A arqueologia tem especificidades na preservação e partilha de dados de investigação?

Como pode um Centro de Investigação implementar uma política de GDI concertada?

Como criar uma cultura de Gestão de Dados junto dos investigadores/as?

DESCRIÇÃO

O Centro Interdisciplinar de Arqueologia e Evolução do Comportamento Humano (ICArEHB), sediado na Universidade do Algarve, celebra uma década de dedicação exclusiva ao estudo da Pré-História. Combinando trabalho de campo e investigação laboratorial, o centro tem-se afirmado como uma referência nacional e internacional na produção de conhecimento sobre os períodos mais remotos da história humana.

A natureza da investigação pré-histórica implica, tradicionalmente, uma abordagem em que a profundidade temporal se traduz numa maior ênfase na quantificação em detrimento da qualificação. Neste contexto, o ICArEHB integra diversas áreas do saber — como a paleontologia, a antropologia física, a geologia e a biologia — enfrentando o constante desafio de articular dados provenientes de disciplinas distintas. Uma das estratégias adotadas por várias escolas de investigação tem sido a aposta na quantificação e na inferência estatística como forma de integrar e comparar dados heterogéneos.

Contudo, desde o início do século XX, a acumulação de grandes volumes de dados nem sempre foi acompanhada por práticas eficazes de partilha e padronização. A ausência de estruturas comuns — como léxicos, variáveis e formatos de dados — tem dificultado a comparação entre projetos e a reprodutibilidade dos resultados. A partilha de dados, ainda pouco enraizada na arqueologia, começa agora a ganhar tração, impulsionada por iniciativas isoladas, sobretudo nos Estados Unidos, que demonstram os benefícios da ciência aberta, como o aumento da visibilidade e da citação dos trabalhos.

Neste panorama, o ICArEHB tem procurado posicionar-se na vanguarda da ciência aberta, promovendo ativamente a cultura de partilha de dados. Desde 2023, o centro tem implementado uma estratégia estruturada com dois eixos principais: diagnóstico e capacitação.

O primeiro passo consistiu na aplicação de um questionário a investigadores e estudantes, com o objetivo de compreender práticas, perceções e barreiras à partilha de dados. A elevada taxa de resposta revelou uma diversidade de níveis de conhecimento e resistência, muitas vezes associada à perceção de posse dos dados e ao desconhecimento sobre licenças de uso e reutilização.

Em resposta, o ICArEHB organizou uma série de workshops, iniciando em 2024 com uma sessão pioneira sobre partilha de dados em arqueologia, seguida de formações sobre o Open Science Framework, licenças, preprints e outros conceitos fundamentais. Paralelamente, está em desenvolvimento um Manual de Ciência Aberta, que reúne conceitos-chave e boas práticas desde a recolha até à publicação dos dados, incluindo listas de verificação por secção para facilitar a sua aplicação prática.

Mais recentemente, o centro reconheceu que a disponibilização de ferramentas não é suficiente sem a criação de uma cultura institucional de partilha. A publicação científica é apenas a vitrine do trabalho realizado — os dados são o verdadeiro contributo para o avanço do conhecimento. Assim, foram criadas iniciativas como o Dia da Ciência Aberta no ICArEHB, com partilha de boas práticas e a atribuição de um prémio para reconhecer a excelência na partilha de dados.

A motivação contínua é essencial, dado que a partilha de dados exige passos adicionais, como a organização de metadados e a curadoria dos próprios dados. No entanto, já existem exemplos inspiradores, como teses por artigos com todos os dados depositados em repositórios e inteiramente reproduzíveis através de linguagem de programação.

O ICArEHB defende que a formação contínua deve ser uma prioridade estratégica e orçamental dos centros de investigação, não apenas para garantir o acesso aberto às publicações, mas também para capacitar investigadores e estudantes nas práticas da ciência aberta. Neste sentido, o centro participa ativamente em projetos-piloto como o Polen, reforçando o seu compromisso com a transparência, a colaboração e a inovação na arqueologia.

TRÊS LIÇÕES APRENDIDAS

Formação como Pilar da Implementação 

A realização de workshops e sessões de capacitação revelou-se fundamental para nivelar o conhecimento dos investigadores e estudantes. A formação contínua não só promove a literacia em gestão de dados, como também fortalece a confiança na partilha e reutilização responsável da informação científica.

Ferramentas estruturantes facilitam a adoção de práticas

O desenvolvimento do Manual de Ciência Aberta tem-se afirmado como uma ferramenta essencial para orientar práticas consistentes. A inclusão de listas de verificação operacionais permite transformar princípios abstratos em ações concretas, promovendo a qualidade e a reprodutibilidade dos dados.

Avaliação baseada em evidência é essencial!

A aplicação de questionários antes e depois das formações tem permitido medir a evolução do conhecimento e identificar lacunas. Esta abordagem evidencia a importância de integrar mecanismos de avaliação desde o início, alinhando-se com o rigor do método científico.

TRÊS DESAFIOS FUTUROS

Definição de metas claras e mensuráveis 

Apesar dos avanços, ainda não foram formalmente estabelecidos indicadores de desempenho. A definição de metas como a percentagem de artigos com dados abertos ou a qualidade dos metadados será crucial para monitorizar o progresso e orientar decisões estratégicas.

Sustentabilidade e continuidade das ações 

A manutenção de formações regulares, a atualização do manual e a consolidação de práticas exigem investimento contínuo de tempo e recursos. Garantir a sustentabilidade destas iniciativas é um desafio que requer o envolvimento de toda a comunidade científica.

Cultura de Partilha ainda em construção! 

Embora haja sinais positivos, a partilha de dados ainda não é uma prática enraizada. É necessário continuar a promover uma cultura de abertura, onde os investigadores se sintam confortáveis, informados e apoiados para partilhar os seus dados de forma segura e ética.

CINCO QUESTÕES SOBRE GDI

Como define, implementa e avalia as práticas de gestão de dados de investigação?

No âmbito da promoção da Ciência Aberta e da melhoria contínua das práticas de gestão de dados de investigação, o ICArEHB tem vindo a desenvolver e aplicar estratégias que visam não apenas a implementação de boas práticas, mas também a sua avaliação sistemática.

A implementação tem sido conduzida através da formação contínua e do Manual de Ciência Aberta, que se encontra em fase de desenvolvimento e é um documento estruturante que reúne os conceitos fundamentais e orientações práticas, inclusivamente apresentando listas de verificação.

A avaliação das práticas implementadas é parte integrante do método científico e essencial para aferir o impacto das ações desenvolvidas. O ICArEHB tem adotado uma abordagem baseada em evidência, que inclui diagnóstico de conhecimentos, com aplicação de questionários antes e depois das ações para medir a evolução e identificar áreas que requerem reforço.  

Para além disso, está previsto para os próximos anos, a definição e objetivos mensuráveis qe permitam avaliar o progresso como, por exemplo, a quantidade de artigos que disponibilizam dados subjacentes, a qualidade e completude dos metadados associados, a adoção de licenças para reutilização, entre outros.

A definição e monitorização destes indicadores permitirá não apenas medir o que foi alcançado, mas também orientar futuras ações e investimentos. A gestão de dados não é apenas uma exigência técnica, mas uma componente essencial da integridade científica, da colaboração interdisciplinar e da valorização do trabalho de investigação.

Quais os principais benefícios dessas práticas?

Na área da arqueologia, os benefícios destas prática são particularmente acentuados, dada a natureza irreversível e destrutiva do processo arqueológico. Uma vez escavado um sítio, o contexto original perde-se para sempre, tornando a documentação e a partilha dos dados recolhidos não apenas desejável, mas imperativa.

Entre os principais benefícios da partilha de dados na arqueologia destacam-se, a validação científica (a disponibilização dos dados permite que outros investigadores reproduzam análises, confirmem resultados e explorem novas interpretações); a maior visibilidade e impacto (estudos recentes, inclusive na área da arqueologia, demonstram que a partilha de dados está associada a um aumento significativo no número de citações dos trabalhos publicados) e a reutilização e inovação (Dados bem organizados e acessíveis podem ser reutilizados em novos contextos, promovendo abordagens interdisciplinares e maximizando o valor do investimento científico).

A partilha de dados não é apenas uma boa prática — é uma exigência científica e ética. Ao promover a organização, documentação e disponibilização dos dados, a comunidade arqueológica garante não só a reprodutibilidade dos estudos, mas também a sua relevância futura.

Em que medida a gestão de dados de investigação contribui para a otimização do processo de investigação?

A otimização do processo científico passa, inevitavelmente, pela organização, sistematização e validação dos dados. Estes três pilares — organizar, sistematizar e comprovar — são fundamentais para garantir a robustez e a reprodutibilidade da investigação. No entanto, nenhuma destas etapas pode ser plenamente concretizada sem o acesso aberto aos dados.

Um exemplo paradigmático desta necessidade é o modelo dos hubs de síntese científica, uma abordagem já consolidada em áreas como a biologia e que começa agora a ganhar expressão noutras disciplinas. Estas iniciativas reúnem anualmente grupos de investigadores de todo o mundo que, de forma colaborativa, escolhem um tema específico e produzem sínteses abrangentes sobre determinado aspeto científico.

Recentemente, foi lançado o primeiro hub de síntese na Europa com foco em arqueologia e ciências humanas. Esta iniciativa, embora não seja exclusivamente dedicada à promoção de dados abertos, depende intrinsecamente da sua existência. A síntese científica — por definição — baseia-se na integração de múltiplos conjuntos de dados, oriundos de diferentes contextos, projetos e instituições. Sem dados disponíveis, a síntese simplesmente não é possível.

Que vantagens e condicionantes aponta na partilha de dados de investigação?

As vantagens são evidentes no campo da Arqueologia, mais ainda na Arqueologia pré-histórica! Quanto às condicionantes, as mais relevantes não estão necessariamente ligadas a quem produziu as evidências, mas sim à forma como o património arqueológico é gerido, regulamentado e tecnicamente suportado.

A partilha de dados arqueológicos deve respeitar a legislação em vigor em cada país, o que pode implicar restrições significativas. Um exemplo comum é a proibição de divulgação de coordenadas geográficas de sítios arqueológicos, com o objetivo de proteger o património de vandalismo, pilhagem ou exploração indevida.

Outro caso sensível diz respeito aos dados relacionados com enterramentos humanos. Na Europa Ocidental, a desconexão cultural com os antepassados permite, em geral, uma abordagem mais aberta à partilha desses dados. No entanto, em outras regiões do mundo, onde essa ligação permanece viva e significativa, é fundamental envolver as comunidades locais e obter o seu consentimento antes de qualquer divulgação. A consulta pública torna-se, assim, uma exigência ética incontornável.

A partilha de dados arqueológicos também enfrenta desafios técnicos relevantes. Um dos principais é o armazenamento de grandes volumes de informação, como modelos 3D de sítios arqueológicos, imagens de alta resolução ou bases de dados complexas. A infraestrutura necessária para armazenar e disponibilizar estes dados de forma acessível e segura nem sempre está disponível ou é financeiramente viável para todas as instituições.

Além disso, a proliferação de iniciativas e plataformas de partilha pode gerar confusão entre os investigadores. A diversidade de repositórios, normas e formatos — embora positiva do ponto de vista da oferta — pode funcionar como uma barreira à adoção, sobretudo para quem está a dar os primeiros passos. Esta fragmentação não constitui uma condicionante intrínseca, mas representa uma limitação prática que deve ser reconhecida e abordada com estratégias de orientação e formação.

De que forma os diferentes atores envolvidos no processo de investigação estão comprometidos com a gestão de dados de investigação?

A construção de uma cultura de partilha de dados na investigação científica exige o envolvimento ativo de múltiplos atores e um compromisso coletivo com os princípios da ciência aberta. Na área da arqueologia, este movimento tem vindo a ganhar força, com sinais claros de sensibilização e ação concreta por parte de centros de investigação, universidades e agências de financiamento.

Os investigadores desempenham um papel central na criação desta cultura de partilha. Embora este compromisso ainda esteja em fase de consolidação, começa a observar-se uma crescente sensibilidade para a importância da disponibilização de dados. Na Universidade do Algarve, por exemplo, dois centros de investigação manifestaram, por iniciativa própria, interesse em desenvolver políticas internas de partilha de dados, refletindo uma mudança de paradigma.

Como parte deste esforço, está prevista a nomeação de dois datastewards, responsáveis pela implementação e monitorização de uma política institucional de gestão de dados abertos. Esta medida visa garantir que todos os investigadores estejam alinhados com boas práticas e que a partilha de dados seja integrada de forma estruturada nos processos de investigação.

Mas também as agências de financiamento têm um papel determinante na promoção da partilha de dados, tanto através da regulamentação como do financiamento direto de infraestruturas e formação. Embora ainda haja caminho a percorrer, verifica-se um bom alinhamento entre as exigências das agências e os princípios da ciência aberta. O reforço deste papel poderá passar por uma maior clareza nas orientações, apoio à capacitação técnica e incentivo à adoção de plataformas comuns.

Projeto ReData foi apresentado no Encontro Ciência 2025, através da elaboração de um e-poster e da dinamização da sessão "Estratégias e ferramentas para práticas de Dados Abertos em Portugal"Decorreu, na semana passada, no Campus da NOVA SBE, em Carcavelos, o Encontro Ciência 2025, o maior encontro de ciência e tecnologia de Portugal sob o tema “Ciência, Inovação e Sociedade”, onde o consórcio Re.Data esteve presente.

O coordenador do projeto, Pedro Príncipe, da Universidade do Minho, apresentou o projeto ReData, numa das sessões paralelas do evento, com o título “Estratégias e ferramentas para práticas de Dados Abertos em Portugal”. Foi também orador numa segunda sessão paralela, onde se debateu “Ciência Aberta e Acesso Aberto: práticas e políticas”.

O projeto ReData esteve igualmente presente na sessão de e-posters do evento, tendo chamado a atenção a de  “curiosos”,  o trabalho desenvolvido nas várias linhas de atuação do projeto: o Quadro de Referência, a constituição do Grupo Nacional de Interesse em Políticas e Estratégias de Ciência Aberta, bem como as acções de formação já realizadas e agendadas, e casos de estudo no âmbito da curadoria de dados. A análise dos números de participantes nas iniciativas, bem como a interação crescente com os canais de comunicação do projeto, denota o interesse da comunidade científica nestas temáticas.

A presença neste evento permitiu a partilha de contactos e experiências com diferentes investigadores e entidades, sensibilizando-os para a verdadeira importância de tornar os dados abertos na comunidade científica!

Decorreu na passada segunda feira, dia 30 de Junho, a 2ª reunião do Grupo Nacional de Interesse em Políticas e Estratégias de Ciência Aberta. Esta reunião contou com a presença de 26 representantes institucionais, de 19 instituições de ensino superior e 8 centros de competências.

A manhã começou com a abertura, pelo Vice Reitor para a Cultura e Ciência Aberta da Universidade de Coimbra, Professor Doutor Delfim Leão, seguida de uma breve nota sobre o enquadramento deste grupo de trabalho no projeto. De seguida, o coordenador do projeto, Pedro Príncipe, da Universidade do Minho, apresentou as linhas de ação do projeto Re.Data.

Nesta manhã de partilha, juntou-se ainda João Moreira, Diretor da FCCN-FCT, que apresentou as Políticas de Ciência Aberta da FCT e as linhas propostas para a política de dados da FCT. Juntou-se, online, a keynote speaker Joy Davidson, Diretora Associada do Digital Curation Centre, que falou sobre como definir políticas que potenciem a FAIRificação dos dados. 

O final da manhã foi marcado por uma breve apresentação do Quadro de Referência para Políticas e Estratégias de Ciência Aberta e Gestão de Dados de Investigação, pelo Investigador Bruno Direito (UC) e Eloy Rodrigues, Diretor do Serviço de Documentação e Bibliotecas (UMinho), onde os participantes expuseram as suas concordâncias, dúvidas e discordâncias, numa sessão envolvente, muito interativa, com pósteres e post-its, num clima de cooperação e informalidade.

Antes de uma tarde de trabalho, houve espaço para um almoço de networking. 

No período da tarde, os grupos tiveram a oportunidade de debater as diferentes fases do modelo lógico apresentado no quadro de referência, bem como fazer uma análise SWOT sobre a implementação de políticas de Ciência Aberta nas suas instituições.

Esta reunião, pioneira, conseguiu juntar vários decisores de topo para debater o futuro da Ciência Aberta em Portugal, e por isso, fez-se história.

Decorreu no dia 26 de junho, no Iscte, a primeira edição do Workshop “Utilização de Cadernos de Laboratório Eletrónicos e documentação de dados“.

A sessão contou com a participação de 31 pessoas e foi dinamizada por Tiago Paixão, Head of Advanced Data Analysis do Gulbenkian Institute for Molecular Medicine (GIMM).

Todos os participantes tiveram a oportunidade de conhecer e testar as funcionalidades, vantagens e limitações do software eLabFTW, ficando evidente a necessidade premente de uma instância nacional de um software de cadernos de investigação eletrónicos ou, em alternativa, de um compromisso político por parte das instituições para a instalação e disponibilização de ferramentas que possam suprir essa carência junto das suas comunidades.

O projeto ReData está a operacionalizar um programa de formação para:

  • Especialização profissional para os diversos atores que dão apoio e suporte à GDI
  • Capacitação de investigadores
  • Formação de formadores

Acompanhe a nossa atividade, subscreva a newsletter

O projeto ReDATA prossegue a sua missão de formar a comunidade em áreas fulcrais da gestão de dados de Investigação, no âmbito do seu  Roteiro de Formação.

A primeira edição do tão esperado workshop de fundamentos da curadoria de dados –  especialização para profissionais de apoio à investigação, teve lugar dia 26 de junho, na Nova School of Business and Economics – Universidade Nova de Lisboa. 

Esta formação, para além de dar a possibilidade de consolidar alguns conhecimentos teóricos, apostou numa componente prática transversal a toda a ação, dando a possibilidade aos participantes de terem uma visão  pragmática das atividades inerentes à função de curadoria, integrando momentos mais  hands on e de  exploração de boas práticas, através da apresentação de casos de uso.

Os participantes mostraram-se bastante cooperativos e empenhados, tendo realizado atividades pré-workshop, requeridas pelos formadores, onde sistematizaram alguns conhecimentos, servindo como base para as atividades previstas em sala.

Foi uma sessão dinâmica, interativa, num ambiente cooperativo e informal, com muito bons resultados de aprendizagem e trocas de experiências, fomentando uma rede colaborativa que, se espera, contribua para a sustentabilidade de uma evolução contínua das práticas e competências nestes domínios de intervenção.

Participaram 32 profissionais, vindos de várias instituições de ensino superior, oriundos de diferentes zonas do país, com alguma diversidade de funções, relacionadas direta ou indiretamente com a curadoria de dados.

As próximas duas edições acontecerão em outubro na Universidade de Coimbra e em dezembro, na Universidade do Minho (campus de Guimarães).

Esperamos por si!

 

No passado dia 11 de junho, no âmbito da conferência final do projeto Skills4EOSC, a Rede Portuguesa de Data Stewards esteve em destaque na sessão sobre Redes de Apoio à Gestão de Dados, apresentada por Curtis Sharma. 

Este projeto tem acompanhado os desenvolvimento da Rede Portuguesa de Data Stewards disponibilizando apoio e documentação sobre a organização, funcionamento e sustentabilidade de redes de profissionais de apoio à gestão de dados de investigação.Saiba mais sobre a Rede Portuguesa de Data Stewards e juntem-se a nós!

O projeto ReDATA está a reunir e partilhar casos de uso reais que demonstram boas práticas na gestão de dados em diferentes áreas científicas e contextos institucionais.

Boas práticas e casos de uso em GDI

Estes casos demonstram como investigadores e equipas de apoio estão a planear, organizar, curar e publicar os seus dados de forma eficaz, contribuindo para um ecossistema de investigação mais aberto, responsável e reutilizável.

Ao partilhar estas experiências, pretende-se:

  • Inspirar a adoção de práticas sustentáveis e alinhadas com os princípios FAIR;
  • Valorizar o papel do planeamento e da curadoria de dados desde o início dos projetos;
  • Reforçar a colaboração entre investigação e serviços de apoio técnico;
  • Criar um catálogo de boas práticas que possa ser replicado noutras instituições.

Consulte os casos já disponíveis:

SAIL – Space-Atmosphere-Ocean Interactions in the marine boundary Layer: os dados no centro do projeto e o plano de gestão de dados como guia

Playback the music of the brain: contributo da reutilização e partilha de dados de investigação para a descodificação de emoções provocadas pela música

Projetos do LIBPhys-UNL: relevância dos dados de investigação relativos a estruturas atómicas para a construção de instrumentos de elevada precisão

De que forma o campo electro-magnético interfere no clima terrestre? 

Como medi-lo em contexto oceânico? 

O que fazer aos dados, quando não há possibilidade de estudá-los no contexto do projeto?

Porque é o Plano de Gestão de Dados um documento imprescindível?

DESCRIÇÃO

O projeto SAIL – Space-Atmosphere-Ocean Interactions in the marine boundary Layer é, por definição, um projeto centrado na recolha de dados científicos, fundamental para a compreensão das interações entre a radiação proveniente do espaço e a atmosfera terrestre, desenvolvido em ambiente oceânico.

A investigação centra-se na medição, através de instrumentos de precisão e da aplicação de tecnologia avançada, do campo electro-atmosférico — um fenómeno que se encontra sempre presente na natureza, mesmo em tempo seco e sem trovoada —, e que é particularmente difícil de medir em terra. Esta variável é um importante indicador global do clima terrestre, especialmente num contexto das alterações climáticas globais.

A iniciativa surgiu de forma inusitada e colaborativa, aproveitando a viagem de circum-navegação do navio-escola Sagres em 2020, que ofereceu uma oportunidade inédita para integrar ciência a bordo, permitindo a recolha de dados em locais remotos e de difícil acesso.

Historicamente, foram realizadas campanhas semelhantes no início do século XX, com destaque para os dados obtidos por cientistas britânicos entre 1907 e 1920, a bordo do navio Carnegie. Contudo, desde essa época, o campo elétrico não voltou a ser medido de forma sistemática, em contexto marítimo.

Devido às suas características únicas e à sua relevância do ponto de vista climático, bem como ao volume de dados cuja análise pode prolongar-se por muitos anos, o projeto tem como objetivo imediato a recolha, documentação e preservação, mas também a partilha sistemática de dados de forma a que outros investigadores possam usá-los, existindo um compromisso evidente do projeto com a Ciência Aberta.

TRÊS LIÇÕES APRENDIDAS

Tratando-se de um projeto com enfoque nos dados, todas as ações que permitiram aprender a estruturar dados com vista à sua partilha imediata foram fulcrais.

O Plano de Gestão de Dados (PGD) como documento vivo e estruturante

Ao contrário do que é habitual em muitos projetos, o PGD do SAIL foi elaborado antes do início da campanha. Essa antecipação revelou-se essencial, não apenas como formalidade, mas principalmente como uma ferramenta de trabalho dinâmica, constantemente atualizada. Na realidade, tornou-se uma espécie de pré-data paper, facilitando não só o acesso aos dados, como também a sua interpretação e reutilização.

Um repositório adequado para cada processo de dados

A necessidade de lidar com versões múltiplas de datasets em constante atualização exigiu a adoção de um sistema de repositório robusto e com possibilidade de versionamento. 

A experiência com CKAN, embora útil, mostrou limitações na gestão de dados em evolução, reforçando a necessidade de ferramentas que acompanhem a mutabilidade e a complexidade dos dados. 

O Zenodo demonstrou ser uma opção adequada num processo de investigação altamente dinâmico.

O valor dos dados não estruturados e da observação informal

A ausência de registos não instrumentados — como observações visuais, contextos ambientais ou acontecimentos inesperados — evidenciou uma lacuna crítica: o que atualmente existe em termos tecnológicos é exponencial no que se refere ao conhecimento gerado, mas tende a deixar de lado um manancial de dados circunstanciais, assumidamente difíceis de sistematizar. Por exemplo, informações como relâmpagos observados no decurso das expedições, mas não anotados pelos instrumentos, provaram que a informalidade pode ser científica e necessária.

Contudo, é necessário conseguir soluções para a recolha, registo e partilha destes dados de investigação, equilibrando a sofisticação contemporânea com o valor do registo qualitativo do passado.

TRÊS DESAFIOS FUTUROS

Volume e preservação de dados

Com uma produção de cerca de 10 GB por dia, o projeto enfrenta um desafio significativo no que diz respeito à curadoria e seleção dos dados a serem mantidos a longo prazo. A premissa inicial tem sido a de preservar todos os dados recolhidos, com a justificação de que informações que atualmente podem parecer irrelevantes podem tornar-se cruciais para futuras investigações. 
No entanto, o projeto revelou que esta abordagem de armazenamento indiscriminado é insustentável a longo prazo, tanto em termos de capacidade de storage quanto de eficiência na gestão dos dados, pelo que a questão sobre que datasets preservar é um tema emergente – e, sem dúvida, complexo – neste caso.
 

Organização e partição dos dados

A organização e partição dos dados de um projeto científico de longa duração, especialmente aqueles que se estendem por vários anos e abrangem múltiplas localizações geográficas, é um desafio igualmente complexo que requer uma abordagem meticulosa e sistemática. A distribuição e estruturação eficazes dos dados são essenciais para garantir o acesso por outros investigadores e a sua reutilização.

Uma das primeiras considerações na organização dos dados é a escolha do critério de partição. Existem várias abordagens possíveis, cada uma com suas vantagens e desvantagens.  

A organização por viagens, por exemplo, pode ser útil para projetos que envolvem expedições a diferentes locais, como é o caso. Esta abordagem permite agrupar os dados recolhidos durante cada viagem, facilitando a análise temporal e espacial dos resultados. No entanto, pode tornar-se confusa quando as viagens são frequentes.

Outra abordagem é a organização por datas. Esta metodologia é particularmente útil para uma análise cronológica detalhada, permitindo rastrear mudanças e tendências ao longo do tempo. No entanto, a simples organização por datas pode não ser suficiente para quando se envolvem múltiplas variáveis e localizações, necessitando de uma estrutura adicional para evitar a fragmentação dos dados.

A organização por áreas geográficas é outra opção viável, especialmente quando se abordam múltiplos ecossistemas, facilitando a comparação entre diferentes locais e a identificação de padrões espaciais. No entanto, pode ser menos eficaz para a análise temporal.

Entre organizar por viagens, datas ou áreas geográficas, a preocupação é evitar estruturas confusas para futuros utilizadores.

Garantir a reutilização efetiva dos dados partilhados

Partilhar dados não significa torná-los automaticamente úteis para outros investigadores e projetos. É necessário contextualizá-los, garantir a presença de metadados significativos e disponibilizar documentos auxiliares como o PGD para que a reutilização seja real e produtiva.

Estes elementos são essenciais, contribuindo para o avanço do conhecimento científico e a promoção de uma cultura de colaboração e transparência na Ciência.

CINCO QUESTÕES SOBRE GDI

Como define, implementa e avalia as práticas de gestão de dados de investigação?

As práticas de gestão de dados de investigação foram definidas num momento muito precoce do projeto. Desde o início, o PGD não foi considerado documento de arquivo, de satisfação das exigências dos financiadores, mas sim uma ferramenta ativa, estruturante e refletora das alterações do próprio projeto. A sua implementação exigiu tempo, trabalho e múltiplas versões, mas tornou-se um pilar científico tão importante quanto a recolha de dados em si. Por outro lado, o versionamento foi ele próprio um elemento que possibilitou avaliação do processo.

Quais os principais benefícios dessas práticas?

Apesar das práticas baseadas no PGD serem trabalhosas, os benefícios são evidentes: maior organização, partilha mais eficaz e potencial para reutilização científica por terceiros. No entanto, reconhece-se que mesmo com cuidados extremos, falhas acontecem — mas estas podem ser corrigidas se a gestão de dados for bem documentada e aberta.

Em que medida a gestão de dados de investigação contribui para a otimização do processo de investigação?

No contexto do SAIL, a gestão de dados não é uma otimização, é a própria investigação! Recolher, tratar, documentar e partilhar dados é parte do método científico e não uma tarefa auxiliar. Tal como a redação de um artigo exige reinterpretação dos dados, a sua gestão é um processo contínuo de análise, reflexão e estruturação.

Que vantagens e condicionantes aponta na partilha de dados de investigação?

As vantagens da partilha são inegáveis! Num projeto com esta dimensão, a dificuldade de analisar os dados e de elaborar produtos científicos com os seus resultados é real.

Nem sempre, no contexto científico, a partilha é vista com bons olhos, mas se os dados não forem partilhados, corre-se o risco de ficarem, longos anos, sem uso, condicionando o progresso científico nesta área de conhecimento. Recorde-se que estes dados têm um carácter único.

Tendo em consideração a tipologia de dados, não existem condicionantes de partilha a salientar.

De que forma os diferentes atores envolvidos no processo de investigação estão comprometidos com a gestão de dados de investigação?

A colaboração com a Marinha foi exemplar na abertura e na valorização da observação — incluindo a não instrumentada. Efetivamente, a Marinha está habituada a partilhar dados – dados muito detalhados e baseados em trabalho de recolha pormenorizado e não automático. O perfil de cooperação que caracteriza estas forças é determinante neste sentido.

Em contraste, em alguns contextos académicos, ainda existe resistência à partilha de dados, ligada à autoria ou à competição entre projetos e investigadores.

Porém, instituições como o INESC TEC demonstram forte envolvimento e competência técnica na área, oferecendo apoio e validação contínuos. 

Aconteceu no passado dia 6 de junho uma sessão de esclarecimento on-line, sobre a European Open Science Cloud (EOSC). Contou com a presença de mais de 80 participantes. Esta sessão enquadra-se  no Roteiro de Formação do projeto ReData, e pretendeu desmistificar vários conceitos associados à EOSC.

Na primeira parte da sessão foi feita uma breve apresentação do projeto ReData aos participantes, pela voz do coordenador do projeto – Pedro Príncipe (Universidade do Minho), destacando os  objetivos  alinhados com as orientações da EOSC.

Contou-se ainda com o testemunho de Jorge Noro (Universidade de Coimbra – membro associado da EOSC), co-coordenador do projeto, que elencou as vantagens, múltiplas ações e resultados da UC através do seu   envolvimento nas iniciativas promovidas pela EOSC.

O painel de oradores convidados contou com a presença de João Mendes Moreira, (FCCN – serviços digitais da FCT), organização mandatada para a EOSC, por Portugal, tendo apresentado as várias linhas de atuação, bem como o seu papel na concretização da parceria com a EOSC. 

Marcou presença a oradora convidada, Isabel Caetano (Senior Stakeholder Engagement and Outreach Officer da EOSC), que apresentou:

  • A estrutura de governança da EOSC, a colaboração tripartida e a parceria com o Horizonte-Europa, bem como os , os pilares estratégicos e o papel dos nós.
  • O trabalho desenvolvido no âmbito dos projetos INFRAEOSC;
  • Os membros, task-forces, grupos de trabalho e próximos eventos.

Reveja os conteúdos apresentados AQUI.

Esta sessão contribuiu para se dar um passo em frente, na transposição da realidade europeia para as realidades locais e nacionais, aspirando a que a Ciência Aberta seja um “novo normal” no quotidiano da realidade portuguesa.

No âmbito do Roteiro de Formação do consórcio ReData, estão agendadas três edições do workshop – Fundamentos da curadoria de dados: especialização para profissionais de apoio à investigação.

A primeira edição irá decorrer já no mês de junho, sendo que os candidatos selecionados já foram contactados para confirmarem a sua aceitação.

Se deixou passar esta oportunidade, inscreva-se nas próximas edições, onde lhe for mais conveniente:

  • 2ª edição – Coimbra | 3 de outubro – candidaturas abertas a partir de 2 de junho
  • 3ª edição – Braga | 12 de dezembro – candidaturas abertas a partir de 15 de setembro

Esperemos vê-lo numa destas sessões!Para ficar a conhecer as restantes formações do projeto, consulte a nossa agenda. E para não se esquecer das datas, associe o nosso calendário!