DESCRIÇÃO

O projeto propõe-se aprofundar o conhecimento sobre os fatores ambientais e socioeconómicos que influenciam a propagação de doenças causadas por agentes patogénicos transmitidos por flebótomos, cuja incidência tem aumentado devido às mudanças climáticas e alterações ambientais.

Entre os seus objetivos principais estão o desenvolvimento de um sistema de alerta precoce para monitorizar e prever alterações na distribuição e sazonalidade destes insetos vetores, a avaliação do risco de transmissão dos agentes patogénicos e a análise do impacto socioeconómico das doenças associadas. O projeto visa ainda apoiar a definição de políticas de adaptação e mitigação, promovendo respostas integradas e baseadas em evidência científica. 

Ao fornecer avaliações de risco mais fiáveis e melhorar a previsão da distribuição presente e futura das doenças causadas por agentes patogénicos transmitidos por flebótomos, pretende reforçar a eficácia da resposta das autoridades de saúde.

TRÊS LIÇÕES APRENDIDAS

Normalização dos procedimentos de recolha e manutenção de dados por todos os membros do consórcio

Num consórcio de investigação, onde múltiplas instituições colaboram na produção e análise de dados, a normalização dos procedimentos de recolha, armazenamento e manutenção de dados é essencial para garantir a consistência, a qualidade e a integridade dos resultados. A adoção de metodologias comuns permite que os dados sejam comparáveis e interoperáveis, independentemente da sua origem, facilitando a integração e a análise conjunta. Esta uniformização reduz redundâncias, minimiza erros e assegura que todos os membros do consórcio operam com base em critérios técnicos e éticos partilhados. Além disso, contribui para a eficiência operacional e para a credibilidade científica do projeto.

Partilha de dados sustentada por documentação apropriada

A partilha de dados é um dos pilares da ciência colaborativa, mas deve ser realizada com responsabilidade e transparência. Tanto no contexto interno do consórcio como em interações com entidades externas, é fundamental que os dados sejam acompanhados de documentação rigorosa, incluindo metadados, termos de uso, licenças e acordos de confidencialidade. Esta documentação assegura que os dados são compreendidos no seu contexto original, utilizados de forma ética e em conformidade com os direitos e deveres das partes envolvidas. Além de proteger os interesses institucionais e individuais dos investigadores, esta prática promove a confiança mútua, a rastreabilidade e a valorização do trabalho científico desenvolvido.

Importância da aplicação prática dos princípios FAIR

A aplicação dos princípios FAIR na gestão de dados científicos é cada vez mais reconhecida como uma boa prática essencial para maximizar o valor da investigação. Tornar os dados encontráveis (Findable) implica o uso de identificadores persistentes e metadados descritivos; garantir que são acessíveis (Accessible) requer a definição clara de condições de acesso e uso; assegurar que são interoperáveis (Interoperable) envolve a utilização de formatos e vocabulários padronizados; e promover a sua reutilização (Reusable) exige documentação completa e licenças adequadas. A implementação destes princípios não só facilita a reutilização dos dados por outros investigadores, como também contribui para uma ciência mais aberta, eficiente e sustentável, alinhada com as exigências de financiadores e políticas públicas de investigação.

 

TRÊS DESAFIOS FUTUROS

Garantir a continuidade da aplicação dos princípios FAIR, promovendo a sua integração efetiva em práticas de ciência aberta

A aplicação dos princípios FAIR (Findable, Accessible, Interoperable, Reusable) deve ser entendida não como uma etapa pontual, mas como um compromisso contínuo ao longo de todo o ciclo de vida dos dados. A sua integração efetiva nas práticas de ciência aberta exige o desenvolvimento de políticas institucionais claras, a capacitação dos investigadores e a adoção de ferramentas tecnológicas que facilitem a sua implementação. Ao garantir que os dados permanecem localizáveis, acessíveis, interoperáveis e reutilizáveis, mesmo após o término dos projetos, promove-se a longevidade do conhecimento científico e a sua disseminação responsável.

Assegurar a continuidade dos procedimentos e a manutenção de um servidor fiável para o armazenamento seguro dos dados

A infraestrutura tecnológica desempenha um papel determinante na preservação e acessibilidade dos dados. A manutenção de um servidor fiável, seguro e com capacidade de longo prazo é essencial para garantir que os dados recolhidos não se perdem, permanecem acessíveis e podem ser reutilizados por outros investigadores ou em novos contextos. Esta continuidade operacional deve ser acompanhada por procedimentos bem documentados, planos de preservação digital e mecanismos de redundância que assegurem a integridade e a confidencialidade da informação armazenada.

Conciliar a aplicação rigorosa das boas práticas de proteção de dados com a promoção de investigação socialmente relevante, garantindo que uma não comprometa a outra

A proteção de dados, especialmente quando se trata de dados pessoais ou sensíveis, é uma exigência ética e legal incontornável. No entanto, esta proteção não deve ser vista como um obstáculo à produção de investigação socialmente relevante. Pelo contrário, é possível — e desejável — encontrar um equilíbrio entre o respeito pelos direitos dos participantes e a geração de conhecimento com impacto social. A aplicação rigorosa das boas práticas de anonimização, consentimento informado e gestão ética dos dados permite que a investigação avance de forma responsável, sem comprometer a confiança pública nem a qualidade científica.

CINCO QUESTÕES SOBRE GDI

Questões respondidas por Pádraic Fleming – Research Manager and Cluster Lead – Health da Trilateral Research
(www.trilateralresearch.com), parceiro responsável pelo DMP
Como define, implementa e avalia as práticas de gestão de dados de investigação?

O projeto CLIMOS tem um parceiro dedicado, a Trilateral Research, responsável por aconselhar, monitorizar e relatar as práticas de gestão de dados ao longo da duração do projeto. Um plano de gestão de dados (DMP) do CLIMOS foi produzido até ao mês 6 do projeto de 3 anos, delineando o plano, políticas, processos e procedimentos do consórcio sobre a recolha, armazenamento, acesso, partilha, proteção, retenção e destruição de dados durante e após o fim do projeto. O plano especificou que dados seriam recolhidos e se seriam partilhados ou tornados de acesso aberto e como seriam curados e preservados (incluindo após o fim do projeto) em conformidade com as Diretrizes de Gestão de Dados FAIR do Horizonte Europa. O DMP abordou tanto os dados de investigação quanto as publicações revistas por pares. O DMP é mantido como um documento vivo, atualizado iterativamente ao longo da duração do projeto, com atualizações submetidas à Comissão Europeia no mês 18 e novamente planeadas para o final do projeto. O parceiro coordenador do consórcio é responsável pela gestão do armazenamento de documentos administrativos e de investigação não sensíveis do projeto, num SharePoint institucional seguro e conforme com o GDPR, uma prática aceite pela Comissão Europeia. O coordenador do projeto também mantém a supervisão das práticas de gestão de dados e apoia ativamente o parceiro responsável pela gestão de dados.

Quais os principais benefícios dessas práticas?

Ter um parceiro de projeto dedicado garante continuidade e padronização em termos de processos e procedimentos, além de fornecer uma fonte confiável para os parceiros recorrerem para conselhos e apoio contínuos. Ter um DMP produzido no início do projeto estabelece uma base para o que são “boas práticas de gestão de dados”, garantindo que todos os parceiros tenham informações, diretrizes, regulamentos, processos e procedimentos consistentes e atualizados para implementar, bem como informações práticas, como detalhes de contacto dos responsáveis/oficinas de proteção de dados institucionais, além de uma consciência das políticas e procedimentos institucionais. A nível de projeto, a preparação e atualização iterativa do DMP garante que os parceiros do projeto considerem proativamente o seu papel e responsabilidades individuais em relação aos dados, conjuntos de dados, fluxos de dados, requisitos de dados, interdependências, entre muitos outros aspetos relacionados com os princípios FAIR. 

Em que medida a gestão de dados de investigação contribui para a otimização do processo de investigação?

Ter tarefas dedicadas à gestão de dados incorporadas no plano do projeto desde a fase de proposta, passando pela implementação do projeto, bem como um parceiro de projeto dedicado, simplifica o processo de investigação, garantindo que processos e procedimentos padronizados estejam em vigor desde o início. Além disso, facilita que os parceiros do projeto contemplem e planeiem antecipadamente a investigação de campo, levando em consideração, por exemplo, o trabalho preparatório que precisa ser realizado antes do início da recolha de dados. Isto inclui folhas de informação do projeto padronizadas, processos e modelos de consentimento, acordos de partilha de dados e outros requisitos específicos da tarefa que também podem ser específicos do país ou da instituição.

Que vantagens e condicionantes aponta na partilha de dados de investigação?

O acordo de concessão do consórcio e o acordo do consórcio servem como um contrato juridicamente vinculativo, com obrigações relacionadas com a boa gestão de dados e práticas seguras de dados. A vantagem destes documentos é que os parceiros estão protegidos desde o início, mas também têm obrigações a cumprir desde o início. Além deste documento juridicamente vinculativo, as práticas seguras e seguras de partilha de dados, tanto dentro como fora do consórcio de investigação, são uma das primeiras coisas a serem estabelecidas. Com base nisso, ter práticas claras de partilha de dados garante que todos os requisitos legais sejam cumpridos ao longo da duração do projeto, contando não apenas com a orientação do parceiro de projeto dedicado, mas também trabalhando em colaboração com os escritórios de proteção de dados em cada uma das instituições parceiras, conforme necessário. Como parte das práticas seguras e seguras entre os parceiros do projeto, um repositório centralizado de armazenamento de dados para documentos do projeto (administrativos e relacionados com a investigação) é gerido pela instituição coordenadora do projeto desde o início. Isto é cuidadosamente gerido e mantido ao longo da duração do projeto. Em termos de dados de investigação, foram estabelecidos processos e acordos de partilha de dados separados, dependendo do tipo de dados, da relação controlador-processador de dados, entre outras considerações para uma boa gestão de dados. Estas restrições garantem práticas seguras e seguras, dado o grande número de parceiros dentro e fora da UE. Esta diversidade complica valores essenciais subjacentes à investigação responsável e inovação, por exemplo, reprodutibilidade e transparência da investigação, qualidade e precisão, responsabilidade, preservação a longo prazo, bem como considerações práticas como a capacidade de publicar em revistas de alto impacto. Como resultado, abordagens padronizadas para a gestão de dados são fundamentais para garantir a integridade dos resultados da investigação. 

De que forma os diferentes atores envolvidos no processo de investigação estão comprometidos com a gestão de dados de investigação?

Todos os parceiros são legalmente obrigados a manter a conformidade com o GDPR assim que o Acordo de Concessão e o Acordo do Consórcio são assinados. Na prática, existem pacotes de trabalho, tarefas e entregas dedicadas associadas à gestão de dados. Esta estrutura garante a participação ativa de cada parceiro, com o parceiro de projeto dedicado à gestão de dados, que se relaciona regularmente diretamente com cada parceiro em termos de recolha de informações relacionadas com a gestão de dados a nível individual. Relatar regularmente à Comissão Europeia demonstra a importância atribuída à boa gestão de dados e atua como uma motivação para os parceiros manterem-se em conformidade com as práticas acordadas. 

De que modo os dados contribuem para a prevenção de doenças provocadas por insetos? 

Como contribuir para o reforço da resposta das autoridades de saúde? 

Qual a relevância da normalização de procedimentos em projetos desenvolvidos em consórcio?

Qual o ponto de equilíbrio entre a proteção de dados e a investigação socialmente relevante?

PROJETO

ENTIDADES

INVESTIGADORA
ENTREVISTADA
A INVESTIGADORA
RESPONDE

(Vídeo disponível em breve)

CINCO QUESTÕES SOBRE GDI

DOMÍNIOS CIENTÍFICOS

Ciências médicas e da saúde

ETAPAS DO CICLO DE VIDA DOS DADOS

Processamento

Preservação

Reutilização

DATA DE RECOLHA

Maio de 2025

DESCRIÇÃO

O Centro Interdisciplinar de Arqueologia e Evolução do Comportamento Humano (ICArEHB), sediado na Universidade do Algarve, celebra uma década de dedicação exclusiva ao estudo da Pré-História. Combinando trabalho de campo e investigação laboratorial, o centro tem-se afirmado como uma referência nacional e internacional na produção de conhecimento sobre os períodos mais remotos da história humana.

A natureza da investigação pré-histórica implica, tradicionalmente, uma abordagem em que a profundidade temporal se traduz numa maior ênfase na quantificação em detrimento da qualificação. Neste contexto, o ICArEHB integra diversas áreas do saber — como a paleontologia, a antropologia física, a geologia e a biologia — enfrentando o constante desafio de articular dados provenientes de disciplinas distintas. Uma das estratégias adotadas por várias escolas de investigação tem sido a aposta na quantificação e na inferência estatística como forma de integrar e comparar dados heterogéneos.

Contudo, desde o início do século XX, a acumulação de grandes volumes de dados nem sempre foi acompanhada por práticas eficazes de partilha e padronização. A ausência de estruturas comuns — como léxicos, variáveis e formatos de dados — tem dificultado a comparação entre projetos e a reprodutibilidade dos resultados. A partilha de dados, ainda pouco enraizada na arqueologia, começa agora a ganhar tração, impulsionada por iniciativas isoladas, sobretudo nos Estados Unidos, que demonstram os benefícios da ciência aberta, como o aumento da visibilidade e da citação dos trabalhos.

Neste panorama, o ICArEHB tem procurado posicionar-se na vanguarda da ciência aberta, promovendo ativamente a cultura de partilha de dados. Desde 2023, o centro tem implementado uma estratégia estruturada com dois eixos principais: diagnóstico e capacitação.

O primeiro passo consistiu na aplicação de um questionário a investigadores e estudantes, com o objetivo de compreender práticas, perceções e barreiras à partilha de dados. A elevada taxa de resposta revelou uma diversidade de níveis de conhecimento e resistência, muitas vezes associada à perceção de posse dos dados e ao desconhecimento sobre licenças de uso e reutilização.

Em resposta, o ICArEHB organizou uma série de workshops, iniciando em 2024 com uma sessão pioneira sobre partilha de dados em arqueologia, seguida de formações sobre o Open Science Framework, licenças, preprints e outros conceitos fundamentais. Paralelamente, está em desenvolvimento um Manual de Ciência Aberta, que reúne conceitos-chave e boas práticas desde a recolha até à publicação dos dados, incluindo listas de verificação por secção para facilitar a sua aplicação prática.

Mais recentemente, o centro reconheceu que a disponibilização de ferramentas não é suficiente sem a criação de uma cultura institucional de partilha. A publicação científica é apenas a vitrine do trabalho realizado — os dados são o verdadeiro contributo para o avanço do conhecimento. Assim, foram criadas iniciativas como o Dia da Ciência Aberta no ICArEHB, com partilha de boas práticas e a atribuição de um prémio para reconhecer a excelência na partilha de dados.

A motivação contínua é essencial, dado que a partilha de dados exige passos adicionais, como a organização de metadados e a curadoria dos próprios dados. No entanto, já existem exemplos inspiradores, como teses por artigos com todos os dados depositados em repositórios e inteiramente reproduzíveis através de linguagem de programação.

O ICArEHB defende que a formação contínua deve ser uma prioridade estratégica e orçamental dos centros de investigação, não apenas para garantir o acesso aberto às publicações, mas também para capacitar investigadores e estudantes nas práticas da ciência aberta. Neste sentido, o centro participa ativamente em projetos-piloto como o Polen, reforçando o seu compromisso com a transparência, a colaboração e a inovação na arqueologia.

TRÊS LIÇÕES APRENDIDAS

Formação como Pilar da Implementação 

A realização de workshops e sessões de capacitação revelou-se fundamental para nivelar o conhecimento dos investigadores e estudantes. A formação contínua não só promove a literacia em gestão de dados, como também fortalece a confiança na partilha e reutilização responsável da informação científica.

Ferramentas estruturantes facilitam a adoção de práticas

O desenvolvimento do Manual de Ciência Aberta tem-se afirmado como uma ferramenta essencial para orientar práticas consistentes. A inclusão de listas de verificação operacionais permite transformar princípios abstratos em ações concretas, promovendo a qualidade e a reprodutibilidade dos dados.

Avaliação baseada em evidência é essencial!

A aplicação de questionários antes e depois das formações tem permitido medir a evolução do conhecimento e identificar lacunas. Esta abordagem evidencia a importância de integrar mecanismos de avaliação desde o início, alinhando-se com o rigor do método científico.

TRÊS DESAFIOS FUTUROS

Definição de metas claras e mensuráveis 

Apesar dos avanços, ainda não foram formalmente estabelecidos indicadores de desempenho. A definição de metas como a percentagem de artigos com dados abertos ou a qualidade dos metadados será crucial para monitorizar o progresso e orientar decisões estratégicas.

Sustentabilidade e continuidade das ações 

A manutenção de formações regulares, a atualização do manual e a consolidação de práticas exigem investimento contínuo de tempo e recursos. Garantir a sustentabilidade destas iniciativas é um desafio que requer o envolvimento de toda a comunidade científica.

Cultura de Partilha ainda em construção! 

Embora haja sinais positivos, a partilha de dados ainda não é uma prática enraizada. É necessário continuar a promover uma cultura de abertura, onde os investigadores se sintam confortáveis, informados e apoiados para partilhar os seus dados de forma segura e ética.

CINCO QUESTÕES SOBRE GDI

Como define, implementa e avalia as práticas de gestão de dados de investigação?

No âmbito da promoção da Ciência Aberta e da melhoria contínua das práticas de gestão de dados de investigação, o ICArEHB tem vindo a desenvolver e aplicar estratégias que visam não apenas a implementação de boas práticas, mas também a sua avaliação sistemática.

A implementação tem sido conduzida através da formação contínua e do Manual de Ciência Aberta, que se encontra em fase de desenvolvimento e é um documento estruturante que reúne os conceitos fundamentais e orientações práticas, inclusivamente apresentando listas de verificação.

A avaliação das práticas implementadas é parte integrante do método científico e essencial para aferir o impacto das ações desenvolvidas. O ICArEHB tem adotado uma abordagem baseada em evidência, que inclui diagnóstico de conhecimentos, com aplicação de questionários antes e depois das ações para medir a evolução e identificar áreas que requerem reforço.  

Para além disso, está previsto para os próximos anos, a definição e objetivos mensuráveis qe permitam avaliar o progresso como, por exemplo, a quantidade de artigos que disponibilizam dados subjacentes, a qualidade e completude dos metadados associados, a adoção de licenças para reutilização, entre outros.

A definição e monitorização destes indicadores permitirá não apenas medir o que foi alcançado, mas também orientar futuras ações e investimentos. A gestão de dados não é apenas uma exigência técnica, mas uma componente essencial da integridade científica, da colaboração interdisciplinar e da valorização do trabalho de investigação.

Quais os principais benefícios dessas práticas?

Na área da arqueologia, os benefícios destas prática são particularmente acentuados, dada a natureza irreversível e destrutiva do processo arqueológico. Uma vez escavado um sítio, o contexto original perde-se para sempre, tornando a documentação e a partilha dos dados recolhidos não apenas desejável, mas imperativa.

Entre os principais benefícios da partilha de dados na arqueologia destacam-se, a validação científica (a disponibilização dos dados permite que outros investigadores reproduzam análises, confirmem resultados e explorem novas interpretações); a maior visibilidade e impacto (estudos recentes, inclusive na área da arqueologia, demonstram que a partilha de dados está associada a um aumento significativo no número de citações dos trabalhos publicados) e a reutilização e inovação (Dados bem organizados e acessíveis podem ser reutilizados em novos contextos, promovendo abordagens interdisciplinares e maximizando o valor do investimento científico).

A partilha de dados não é apenas uma boa prática — é uma exigência científica e ética. Ao promover a organização, documentação e disponibilização dos dados, a comunidade arqueológica garante não só a reprodutibilidade dos estudos, mas também a sua relevância futura.

Em que medida a gestão de dados de investigação contribui para a otimização do processo de investigação?

A otimização do processo científico passa, inevitavelmente, pela organização, sistematização e validação dos dados. Estes três pilares — organizar, sistematizar e comprovar — são fundamentais para garantir a robustez e a reprodutibilidade da investigação. No entanto, nenhuma destas etapas pode ser plenamente concretizada sem o acesso aberto aos dados.

Um exemplo paradigmático desta necessidade é o modelo dos hubs de síntese científica, uma abordagem já consolidada em áreas como a biologia e que começa agora a ganhar expressão noutras disciplinas. Estas iniciativas reúnem anualmente grupos de investigadores de todo o mundo que, de forma colaborativa, escolhem um tema específico e produzem sínteses abrangentes sobre determinado aspeto científico.

Recentemente, foi lançado o primeiro hub de síntese na Europa com foco em arqueologia e ciências humanas. Esta iniciativa, embora não seja exclusivamente dedicada à promoção de dados abertos, depende intrinsecamente da sua existência. A síntese científica — por definição — baseia-se na integração de múltiplos conjuntos de dados, oriundos de diferentes contextos, projetos e instituições. Sem dados disponíveis, a síntese simplesmente não é possível.

Que vantagens e condicionantes aponta na partilha de dados de investigação?

As vantagens são evidentes no campo da Arqueologia, mais ainda na Arqueologia pré-histórica! Quanto às condicionantes, as mais relevantes não estão necessariamente ligadas a quem produziu as evidências, mas sim à forma como o património arqueológico é gerido, regulamentado e tecnicamente suportado.

A partilha de dados arqueológicos deve respeitar a legislação em vigor em cada país, o que pode implicar restrições significativas. Um exemplo comum é a proibição de divulgação de coordenadas geográficas de sítios arqueológicos, com o objetivo de proteger o património de vandalismo, pilhagem ou exploração indevida.

Outro caso sensível diz respeito aos dados relacionados com enterramentos humanos. Na Europa Ocidental, a desconexão cultural com os antepassados permite, em geral, uma abordagem mais aberta à partilha desses dados. No entanto, em outras regiões do mundo, onde essa ligação permanece viva e significativa, é fundamental envolver as comunidades locais e obter o seu consentimento antes de qualquer divulgação. A consulta pública torna-se, assim, uma exigência ética incontornável.

A partilha de dados arqueológicos também enfrenta desafios técnicos relevantes. Um dos principais é o armazenamento de grandes volumes de informação, como modelos 3D de sítios arqueológicos, imagens de alta resolução ou bases de dados complexas. A infraestrutura necessária para armazenar e disponibilizar estes dados de forma acessível e segura nem sempre está disponível ou é financeiramente viável para todas as instituições.

Além disso, a proliferação de iniciativas e plataformas de partilha pode gerar confusão entre os investigadores. A diversidade de repositórios, normas e formatos — embora positiva do ponto de vista da oferta — pode funcionar como uma barreira à adoção, sobretudo para quem está a dar os primeiros passos. Esta fragmentação não constitui uma condicionante intrínseca, mas representa uma limitação prática que deve ser reconhecida e abordada com estratégias de orientação e formação.

De que forma os diferentes atores envolvidos no processo de investigação estão comprometidos com a gestão de dados de investigação?

A construção de uma cultura de partilha de dados na investigação científica exige o envolvimento ativo de múltiplos atores e um compromisso coletivo com os princípios da ciência aberta. Na área da arqueologia, este movimento tem vindo a ganhar força, com sinais claros de sensibilização e ação concreta por parte de centros de investigação, universidades e agências de financiamento.

Os investigadores desempenham um papel central na criação desta cultura de partilha. Embora este compromisso ainda esteja em fase de consolidação, começa a observar-se uma crescente sensibilidade para a importância da disponibilização de dados. Na Universidade do Algarve, por exemplo, dois centros de investigação manifestaram, por iniciativa própria, interesse em desenvolver políticas internas de partilha de dados, refletindo uma mudança de paradigma.

Como parte deste esforço, está prevista a nomeação de dois datastewards, responsáveis pela implementação e monitorização de uma política institucional de gestão de dados abertos. Esta medida visa garantir que todos os investigadores estejam alinhados com boas práticas e que a partilha de dados seja integrada de forma estruturada nos processos de investigação.

Mas também as agências de financiamento têm um papel determinante na promoção da partilha de dados, tanto através da regulamentação como do financiamento direto de infraestruturas e formação. Embora ainda haja caminho a percorrer, verifica-se um bom alinhamento entre as exigências das agências e os princípios da ciência aberta. O reforço deste papel poderá passar por uma maior clareza nas orientações, apoio à capacitação técnica e incentivo à adoção de plataformas comuns.

A arqueologia tem especificidades na preservação e partilha de dados de investigação?

Como pode um Centro de Investigação implementar uma política de GDI concertada?

Como criar uma cultura de Gestão de Dados junto dos investigadores/as?

PROJETO

ENTIDADE

INVESTIGADOR
ENTREVISTADO
O INVESTIGADOR RESPONDE
(Vídeo disponível em breve) 
CINCO QUESTÕES SOBRE GDI

DOMÍNIOS CIENTÍFICOS

Humanidades e Artes

ETAPAS DO CICLO DE VIDA DOS DADOS

Partilha

Preservação

DATA DE RECOLHA

Maio de 2025

DESCRIÇÃO

O projeto Espectroscopia de raios X de ultra-elevada precisão de óxidos de metais de transição e terras raras corresponde a um estudo aprofundado de física fundamental com amplas aplicações na indústria e em diversas áreas científicas. 

O objetivo principal é a construção de um espectrómetro de precisão para realizar medições extremamente apuradas em condições de matéria extrema, como iões altamente carregados e átomos exóticos. 

Para tal, desenvolve-se uma base de dados abrangente de formas espectrais de óxidos de metais de transição e terras raras,  crucial para a calibração de detetores em observações astronómicas e outras aplicações científicas.

Nesta área de trabalho, é essencial obter dados extremamente precisos que possibilitem a calibração dos instrumentos avançados de medição, tendo em consideração que os elementos que são medidos são assimétricos.

A construção de um espectrómetro com estas características permite aos investigadores autonomia relativamente a laboratórios estrangeiros. 

TRÊS LIÇÕES APRENDIDAS

Idealizar a forma de recolha dos dados

Uma das lições mais importantes aprendidas com este projeto foi a necessidade de dedicar mais tempo à criação de cenários sobre a forma de organização dos dados e a sua forma de partilha. Dada a precisão exigida na recolha, era essencial optar por uma organização dos dados precisa, mas simultaneamente fluída para que os datasets pudessem vir a ser usados em diferentes contextos.

Inicialmente, não foram considerados adequadamente os formatos e a hierarquização dos dados, o que resultou em dificuldades significativas na fase final de partilha. Esta experiência sublinhou a importância de um planeamento meticuloso desde o início do projeto, garantindo que todos os dados sejam estruturados de maneira lógica e acessível.

Normalização dos Metadados

Normalizar os metadados é tão importante para o processo científico quanto o tratamento dos próprios dados e só assim é possível garantir a interoperabilidade entre os diversos stakeholders

A normalização dos metadados assegura que os dados possam ser compreendidos e utilizados de forma eficiente por todos os envolvidos, independentemente de suas áreas de especialização.

A ausência de uma descrição clara e consistente dos metadados obsta à utilização dos dados por outros investigadores, destacando-se a necessidade de estabelecer e aplicar padrões rigorosos de documentação. 

Formação contínua em Gestão de Dados de lnvestigação

A sobrecarga de trabalho e a falta de tempo para formação resultaram em inconsistências na forma como os dados foram geridos e partilhados. Esta lição enfatiza a necessidade de um compromisso contínuo com a cultura da Ciência Aberta e a formação em boas práticas de gestão de dados, garantindo que todos os membros da equipa estejam atualizados e capacitados para lidar com os desafios associados à gestão de grandes volumes de dados.

TRÊS DESAFIOS FUTUROS

Visualização e Análise de Dados

Um dos desafios futuros mais prementes é desenvolver ferramentas que permitam a visualização e análise estatística básica dos dados diretamente no site onde a base de dados está partilhada. Isso facilitará a utilização dos dados por diferentes stakeholders sem comprometer a flexibilidade necessária para análises mais complexas. A criação de interfaces intuitivas e acessíveis para a visualização de dados é essencial para maximizar o valor dos dados recolhidos e promover a colaboração entre diferentes áreas de pesquisa.
 

Motivação da Equipa, mudança de mentalidade e organização do tempo

É imprescindível motivar a equipa a focar-se não apenas na aquisição e análise inicial dos dados, mas também na partilha e estruturação dos dados de forma que possam ser amplamente utilizados no futuro. 

Isso requer uma mudança de mentalidade e uma melhor gestão do tempo, promovendo uma cultura de colaboração e partilha de conhecimento. Cabe ao investigador principal, também, incentivar a equipa a ver o valor a longo prazo da organização e partilha de dados para o sucesso contínuo do projeto. 

Sustentabilidade dos Repositórios de Dados

Garantir a sustentabilidade dos repositórios de dados a longo prazo é um desafio crítico! 

É necessário desenvolver políticas e estratégias robustas para preservar os dados ao longo do tempo, evitando a perda de informação valiosa devido a mudanças políticas ou tecnológicas. A implementação de práticas de arquivo e backup, bem como a busca por financiamento contínuo, são essenciais para a manutenção da integridade dos dados. A sustentabilidade dos repositórios de dados assegura que a informação recolhida permaneça acessível e útils para futuras gerações de investigadores. 

CINCO QUESTÕES SOBRE GDI

Como define, implementa e avalia as práticas de gestão de dados de investigação?

As práticas são definidas com base em princípios FAIR, implementadas através de templates de DMPs (Data Management Plans) e ferramentas de repositório, e avaliadas com checklists internas e feedback dos parceiros. 

Na página web onde os dados poderão ser acedidos irão existir ferramentas de visualização com possibilidade de análise em pequena escala (testes estatísticos, etc…) e os stakeholders terão possibilidade de visualizar estatísticas de utilização dos dados.

Quais os principais benefícios dessas práticas?

Estas práticas permitem a preservação a longo prazo dos dados, facilitam colaborações internacionais e aumentam o impacto e reutilização dos resultados, bem como a possibilidade de maior número de citações para os autores dos dados.

Em que medida a gestão de dados de investigação contribui para a otimização do processo de investigação?

Os ganhos são evidentes e extensos, mas podem sistematizar-se no contributo para uma investigação mais eficiente, com dados bem organizados e documentados desde o início,  resultando assim numa redução de  erros e duplicações.

Que vantagens e condicionantes aponta na partilha de dados de investigação?

As principais vantagens são a reprodutibilidade e impacto que a partilha de dados de investigação proporciona. 

As condicionantes centram-se na a sensibilidade inerente a alguns dados e os recursos necessários para curadoria e anonimização, sem sempre existentes em quantidade suficiente.

De que forma os diferentes atores envolvidos no processo de investigação estão comprometidos com a gestão de dados de investigação?

Os investigadores seniores e técnicos já trabalham com a gestão de dados de investigação há muito tempo e, em projetos, de grande envergadura, com parceiros externos, estão fortemente comprometidos com a aplicação das melhores práticas.

Contudo, é necessário que haja um maior envolvimento de estudantes e colaboradores menos experientes. E a formação contínua é, aqui, um aspeto essencial.

Como utiliza a física fundamental dados de investigação? 

Porque é tão relevante a precisão dos dados? 

Quais as preocupações dos investigadores com os metadados?

Sem formação adequada existem boas práticas?

PROJETO

Ultra-high-accuracy X-ray spectroscopy of transition metal oxides and rare earths

 

ENTIDADES

INVESTIGADOR
ENTREVISTADO
O INVESTIGADOR
RESPONDE

(Vídeo disponível em breve) 

CINCO QUESTÕES SOBRE GDI

DOMÍNIOS CIENTÍFICOS

Ciências naturais

Engenharia e tecnologia

ETAPAS DO CICLO DE VIDA DOS DADOS

Planeamento

Preservação

DATA DE RECOLHA

Maio de 2025

DESCRIÇÃO

O projeto SAIL – Space-Atmosphere-Ocean Interactions in the marine boundary Layer é, por definição, um projeto centrado na recolha de dados científicos, fundamental para a compreensão das interações entre a radiação proveniente do espaço e a atmosfera terrestre, desenvolvido em ambiente oceânico.

A investigação centra-se na medição, através de instrumentos de precisão e da aplicação de tecnologia avançada, do campo electro-atmosférico — um fenómeno que se encontra sempre presente na natureza, mesmo em tempo seco e sem trovoada —, e que é particularmente difícil de medir em terra. Esta variável é um importante indicador global do clima terrestre, especialmente num contexto das alterações climáticas globais.

A iniciativa surgiu de forma inusitada e colaborativa, aproveitando a viagem de circum-navegação do navio-escola Sagres em 2020, que ofereceu uma oportunidade inédita para integrar ciência a bordo, permitindo a recolha de dados em locais remotos e de difícil acesso.

Historicamente, foram realizadas campanhas semelhantes no início do século XX, com destaque para os dados obtidos por cientistas britânicos entre 1907 e 1920, a bordo do navio Carnegie. Contudo, desde essa época, o campo elétrico não voltou a ser medido de forma sistemática, em contexto marítimo.

Devido às suas características únicas e à sua relevância do ponto de vista climático, bem como ao volume de dados cuja análise pode prolongar-se por muitos anos, o projeto tem como objetivo imediato a recolha, documentação e preservação, mas também a partilha sistemática de dados de forma a que outros investigadores possam usá-los, existindo um compromisso evidente do projeto com a Ciência Aberta.

TRÊS LIÇÕES APRENDIDAS

Tratando-se de um projeto com enfoque nos dados, todas as ações que permitiram aprender a estruturar dados com vista à sua partilha imediata foram fulcrais.

O Plano de Gestão de Dados (PGD) como documento vivo e estruturante

Ao contrário do que é habitual em muitos projetos, o PGD do SAIL foi elaborado antes do início da campanha. Essa antecipação revelou-se essencial, não apenas como formalidade, mas principalmente como uma ferramenta de trabalho dinâmica, constantemente atualizada. Na realidade, tornou-se uma espécie de pré-data paper, facilitando não só o acesso aos dados, como também a sua interpretação e reutilização.

Um repositório adequado para cada processo de dados

A necessidade de lidar com versões múltiplas de datasets em constante atualização exigiu a adoção de um sistema de repositório robusto e com possibilidade de versionamento. 

A experiência com CKAN, embora útil, mostrou limitações na gestão de dados em evolução, reforçando a necessidade de ferramentas que acompanhem a mutabilidade e a complexidade dos dados. 

O Zenodo demonstrou ser uma opção adequada num processo de investigação altamente dinâmico.

O valor dos dados não estruturados e da observação informal

A ausência de registos não instrumentados — como observações visuais, contextos ambientais ou acontecimentos inesperados — evidenciou uma lacuna crítica: o que atualmente existe em termos tecnológicos é exponencial no que se refere ao conhecimento gerado, mas tende a deixar de lado um manancial de dados circunstanciais, assumidamente difíceis de sistematizar. Por exemplo, informações como relâmpagos observados no decurso das expedições, mas não anotados pelos instrumentos, provaram que a informalidade pode ser científica e necessária.

Contudo, é necessário conseguir soluções para a recolha, registo e partilha destes dados de investigação, equilibrando a sofisticação contemporânea com o valor do registo qualitativo do passado.

TRÊS DESAFIOS FUTUROS

Volume e preservação de dados

Com uma produção de cerca de 10 GB por dia, o projeto enfrenta um desafio significativo no que diz respeito à curadoria e seleção dos dados a serem mantidos a longo prazo. A premissa inicial tem sido a de preservar todos os dados recolhidos, com a justificação de que informações que atualmente podem parecer irrelevantes podem tornar-se cruciais para futuras investigações. 
No entanto, o projeto revelou que esta abordagem de armazenamento indiscriminado é insustentável a longo prazo, tanto em termos de capacidade de storage quanto de eficiência na gestão dos dados, pelo que a questão sobre que datasets preservar é um tema emergente – e, sem dúvida, complexo – neste caso.
 

Organização e partição dos dados

A organização e partição dos dados de um projeto científico de longa duração, especialmente aqueles que se estendem por vários anos e abrangem múltiplas localizações geográficas, é um desafio igualmente complexo que requer uma abordagem meticulosa e sistemática. A distribuição e estruturação eficazes dos dados são essenciais para garantir o acesso por outros investigadores e a sua reutilização.

Uma das primeiras considerações na organização dos dados é a escolha do critério de partição. Existem várias abordagens possíveis, cada uma com suas vantagens e desvantagens.  

A organização por viagens, por exemplo, pode ser útil para projetos que envolvem expedições a diferentes locais, como é o caso. Esta abordagem permite agrupar os dados recolhidos durante cada viagem, facilitando a análise temporal e espacial dos resultados. No entanto, pode tornar-se confusa quando as viagens são frequentes.

Outra abordagem é a organização por datas. Esta metodologia é particularmente útil para uma análise cronológica detalhada, permitindo rastrear mudanças e tendências ao longo do tempo. No entanto, a simples organização por datas pode não ser suficiente para quando se envolvem múltiplas variáveis e localizações, necessitando de uma estrutura adicional para evitar a fragmentação dos dados.

A organização por áreas geográficas é outra opção viável, especialmente quando se abordam múltiplos ecossistemas, facilitando a comparação entre diferentes locais e a identificação de padrões espaciais. No entanto, pode ser menos eficaz para a análise temporal.

Entre organizar por viagens, datas ou áreas geográficas, a preocupação é evitar estruturas confusas para futuros utilizadores.

Garantir a reutilização efetiva dos dados partilhados

Partilhar dados não significa torná-los automaticamente úteis para outros investigadores e projetos. É necessário contextualizá-los, garantir a presença de metadados significativos e disponibilizar documentos auxiliares como o PGD para que a reutilização seja real e produtiva.

Estes elementos são essenciais, contribuindo para o avanço do conhecimento científico e a promoção de uma cultura de colaboração e transparência na Ciência.

CINCO QUESTÕES SOBRE GDI

Como define, implementa e avalia as práticas de gestão de dados de investigação?

As práticas de gestão de dados de investigação foram definidas num momento muito precoce do projeto. Desde o início, o PGD não foi considerado documento de arquivo, de satisfação das exigências dos financiadores, mas sim uma ferramenta ativa, estruturante e refletora das alterações do próprio projeto. A sua implementação exigiu tempo, trabalho e múltiplas versões, mas tornou-se um pilar científico tão importante quanto a recolha de dados em si. Por outro lado, o versionamento foi ele próprio um elemento que possibilitou avaliação do processo.

Quais os principais benefícios dessas práticas?

Apesar das práticas baseadas no PGD serem trabalhosas, os benefícios são evidentes: maior organização, partilha mais eficaz e potencial para reutilização científica por terceiros. No entanto, reconhece-se que mesmo com cuidados extremos, falhas acontecem — mas estas podem ser corrigidas se a gestão de dados for bem documentada e aberta.

Em que medida a gestão de dados de investigação contribui para a otimização do processo de investigação?

No contexto do SAIL, a gestão de dados não é uma otimização, é a própria investigação! Recolher, tratar, documentar e partilhar dados é parte do método científico e não uma tarefa auxiliar. Tal como a redação de um artigo exige reinterpretação dos dados, a sua gestão é um processo contínuo de análise, reflexão e estruturação.

Que vantagens e condicionantes aponta na partilha de dados de investigação?

As vantagens da partilha são inegáveis! Num projeto com esta dimensão, a dificuldade de analisar os dados e de elaborar produtos científicos com os seus resultados é real.

Nem sempre, no contexto científico, a partilha é vista com bons olhos, mas se os dados não forem partilhados, corre-se o risco de ficarem, longos anos, sem uso, condicionando o progresso científico nesta área de conhecimento. Recorde-se que estes dados têm um carácter único.

Tendo em consideração a tipologia de dados, não existem condicionantes de partilha a salientar.

De que forma os diferentes atores envolvidos no processo de investigação estão comprometidos com a gestão de dados de investigação?

A colaboração com a Marinha foi exemplar na abertura e na valorização da observação — incluindo a não instrumentada. Efetivamente, a Marinha está habituada a partilhar dados – dados muito detalhados e baseados em trabalho de recolha pormenorizado e não automático. O perfil de cooperação que caracteriza estas forças é determinante neste sentido.

Em contraste, em alguns contextos académicos, ainda existe resistência à partilha de dados, ligada à autoria ou à competição entre projetos e investigadores.

Porém, instituições como o INESC TEC demonstram forte envolvimento e competência técnica na área, oferecendo apoio e validação contínuos. 

De que forma o campo electro-magnético interfere no clima terrestre? 

Como medi-lo em contexto oceânico? 

O que fazer aos dados, quando não há possibilidade de estudá-los no contexto do projeto?

Porque é o Plano de Gestão de Dados um documento imprescindível?

PROJETO

SAIL – Space-Atmosphere-Ocean Interactions in the marine boundary Layer

ENTIDADES

INVESTIGADORA
ENTREVISTADA
A INVESTIGADORA
RESPONDE
CINCO QUESTÕES SOBRE GDI

DOMÍNIOS CIENTÍFICOS

Ciências naturais

Engenharia e tecnologia

ETAPAS DO CICLO DE VIDA DOS DADOS

Planeamento

Partilha

DATA DE RECOLHA

Maio de 2025