DESCRIÇÃO
O projeto SAIL – Space-Atmosphere-Ocean Interactions in the marine boundary Layer é, por definição, um projeto centrado na recolha de dados científicos, fundamental para a compreensão das interações entre a radiação proveniente do espaço e a atmosfera terrestre, desenvolvido em ambiente oceânico.
A investigação centra-se na medição, através de instrumentos de precisão e da aplicação de tecnologia avançada, do campo electro-atmosférico — um fenómeno que se encontra sempre presente na natureza, mesmo em tempo seco e sem trovoada —, e que é particularmente difícil de medir em terra. Esta variável é um importante indicador global do clima terrestre, especialmente num contexto das alterações climáticas globais.
A iniciativa surgiu de forma inusitada e colaborativa, aproveitando a viagem de circum-navegação do navio-escola Sagres em 2020, que ofereceu uma oportunidade inédita para integrar ciência a bordo, permitindo a recolha de dados em locais remotos e de difícil acesso.
Historicamente, foram realizadas campanhas semelhantes no início do século XX, com destaque para os dados obtidos por cientistas britânicos entre 1907 e 1920, a bordo do navio Carnegie. Contudo, desde essa época, o campo elétrico não voltou a ser medido de forma sistemática, em contexto marítimo.
Devido às suas características únicas e à sua relevância do ponto de vista climático, bem como ao volume de dados cuja análise pode prolongar-se por muitos anos, o projeto tem como objetivo imediato a recolha, documentação e preservação, mas também a partilha sistemática de dados de forma a que outros investigadores possam usá-los, existindo um compromisso evidente do projeto com a Ciência Aberta.
TRÊS LIÇÕES APRENDIDAS
Tratando-se de um projeto com enfoque nos dados, todas as ações que permitiram aprender a estruturar dados com vista à sua partilha imediata foram fulcrais.
O Plano de Gestão de Dados (PGD) como documento vivo e estruturante
Ao contrário do que é habitual em muitos projetos, o PGD do SAIL foi elaborado antes do início da campanha. Essa antecipação revelou-se essencial, não apenas como formalidade, mas principalmente como uma ferramenta de trabalho dinâmica, constantemente atualizada. Na realidade, tornou-se uma espécie de pré-data paper, facilitando não só o acesso aos dados, como também a sua interpretação e reutilização.
Um repositório adequado para cada processo de dados
A necessidade de lidar com versões múltiplas de datasets em constante atualização exigiu a adoção de um sistema de repositório robusto e com possibilidade de versionamento.
A experiência com CKAN, embora útil, mostrou limitações na gestão de dados em evolução, reforçando a necessidade de ferramentas que acompanhem a mutabilidade e a complexidade dos dados.
O Zenodo demonstrou ser uma opção adequada num processo de investigação altamente dinâmico.
O valor dos dados não estruturados e da observação informal
A ausência de registos não instrumentados — como observações visuais, contextos ambientais ou acontecimentos inesperados — evidenciou uma lacuna crítica: o que atualmente existe em termos tecnológicos é exponencial no que se refere ao conhecimento gerado, mas tende a deixar de lado um manancial de dados circunstanciais, assumidamente difíceis de sistematizar. Por exemplo, informações como relâmpagos observados no decurso das expedições, mas não anotados pelos instrumentos, provaram que a informalidade pode ser científica e necessária.
Contudo, é necessário conseguir soluções para a recolha, registo e partilha destes dados de investigação, equilibrando a sofisticação contemporânea com o valor do registo qualitativo do passado.
TRÊS DESAFIOS FUTUROS
Volume e preservação de dados
Organização e partição dos dados
A organização e partição dos dados de um projeto científico de longa duração, especialmente aqueles que se estendem por vários anos e abrangem múltiplas localizações geográficas, é um desafio igualmente complexo que requer uma abordagem meticulosa e sistemática. A distribuição e estruturação eficazes dos dados são essenciais para garantir o acesso por outros investigadores e a sua reutilização.
Uma das primeiras considerações na organização dos dados é a escolha do critério de partição. Existem várias abordagens possíveis, cada uma com suas vantagens e desvantagens.
A organização por viagens, por exemplo, pode ser útil para projetos que envolvem expedições a diferentes locais, como é o caso. Esta abordagem permite agrupar os dados recolhidos durante cada viagem, facilitando a análise temporal e espacial dos resultados. No entanto, pode tornar-se confusa quando as viagens são frequentes.
Outra abordagem é a organização por datas. Esta metodologia é particularmente útil para uma análise cronológica detalhada, permitindo rastrear mudanças e tendências ao longo do tempo. No entanto, a simples organização por datas pode não ser suficiente para quando se envolvem múltiplas variáveis e localizações, necessitando de uma estrutura adicional para evitar a fragmentação dos dados.
A organização por áreas geográficas é outra opção viável, especialmente quando se abordam múltiplos ecossistemas, facilitando a comparação entre diferentes locais e a identificação de padrões espaciais. No entanto, pode ser menos eficaz para a análise temporal.
Entre organizar por viagens, datas ou áreas geográficas, a preocupação é evitar estruturas confusas para futuros utilizadores.
Garantir a reutilização efetiva dos dados partilhados
Partilhar dados não significa torná-los automaticamente úteis para outros investigadores e projetos. É necessário contextualizá-los, garantir a presença de metadados significativos e disponibilizar documentos auxiliares como o PGD para que a reutilização seja real e produtiva.
Estes elementos são essenciais, contribuindo para o avanço do conhecimento científico e a promoção de uma cultura de colaboração e transparência na Ciência.
CINCO QUESTÕES SOBRE GDI
Como define, implementa e avalia as práticas de gestão de dados de investigação?
As práticas de gestão de dados de investigação foram definidas num momento muito precoce do projeto. Desde o início, o PGD não foi considerado documento de arquivo, de satisfação das exigências dos financiadores, mas sim uma ferramenta ativa, estruturante e refletora das alterações do próprio projeto. A sua implementação exigiu tempo, trabalho e múltiplas versões, mas tornou-se um pilar científico tão importante quanto a recolha de dados em si. Por outro lado, o versionamento foi ele próprio um elemento que possibilitou avaliação do processo.
Quais os principais benefícios dessas práticas?
Apesar das práticas baseadas no PGD serem trabalhosas, os benefícios são evidentes: maior organização, partilha mais eficaz e potencial para reutilização científica por terceiros. No entanto, reconhece-se que mesmo com cuidados extremos, falhas acontecem — mas estas podem ser corrigidas se a gestão de dados for bem documentada e aberta.
Em que medida a gestão de dados de investigação contribui para a otimização do processo de investigação?
No contexto do SAIL, a gestão de dados não é uma otimização, é a própria investigação! Recolher, tratar, documentar e partilhar dados é parte do método científico e não uma tarefa auxiliar. Tal como a redação de um artigo exige reinterpretação dos dados, a sua gestão é um processo contínuo de análise, reflexão e estruturação.
Que vantagens e condicionantes aponta na partilha de dados de investigação?
As vantagens da partilha são inegáveis! Num projeto com esta dimensão, a dificuldade de analisar os dados e de elaborar produtos científicos com os seus resultados é real.
Nem sempre, no contexto científico, a partilha é vista com bons olhos, mas se os dados não forem partilhados, corre-se o risco de ficarem, longos anos, sem uso, condicionando o progresso científico nesta área de conhecimento. Recorde-se que estes dados têm um carácter único.
Tendo em consideração a tipologia de dados, não existem condicionantes de partilha a salientar.
De que forma os diferentes atores envolvidos no processo de investigação estão comprometidos com a gestão de dados de investigação?
A colaboração com a Marinha foi exemplar na abertura e na valorização da observação — incluindo a não instrumentada. Efetivamente, a Marinha está habituada a partilhar dados – dados muito detalhados e baseados em trabalho de recolha pormenorizado e não automático. O perfil de cooperação que caracteriza estas forças é determinante neste sentido.
Em contraste, em alguns contextos académicos, ainda existe resistência à partilha de dados, ligada à autoria ou à competição entre projetos e investigadores.
Porém, instituições como o INESC TEC demonstram forte envolvimento e competência técnica na área, oferecendo apoio e validação contínuos.
De que forma o campo electro-magnético interfere no clima terrestre?
Como medi-lo em contexto oceânico?
O que fazer aos dados, quando não há possibilidade de estudá-los no contexto do projeto?
Porque é o Plano de Gestão de Dados um documento imprescindível?
PROJETO
SAIL – Space-Atmosphere-Ocean Interactions in the marine boundary Layer
ENTIDADES
INVESTIGADORA
ENTREVISTADA
A INVESTIGADORA
RESPONDE
CINCO QUESTÕES SOBRE GDI
Domínios
Ciências naturais
Engenharia e tecnologia
Etapas do ciclo de vida dos dados
Planeamento
Partilha
DATA DE RECOLHA
Maio de 2025
Descarregue versão pdf