Como equilibrar o cumprimento dos princípios FAIR com a realidade de trabalho dos investigadores?
De que forma o apoio a DMP e a formação interna promovem uma cultura sustentável de gestão de dados?

Como pode a formação ajudar a clarificar a gestão de dados em contextos multidisciplinares?

DESCRIÇÃO

Desde 2013, foram desenvolvidas iniciativas na área da gestão de investigação, numa fase ainda inicial da adoção dos princípios FAIR. Uma das primeiras ações consistiu na avaliação de um protótipo de repositório de dados na Universidade do Porto, que, embora não tenha sido implementado, contribuiu para a consolidação de uma cultura de perceção sobre a importância da gestão de dados. Esta etapa envolveu entrevistas com investigadores e a análise de soluções tecnológicas, promovendo o diálogo entre práticas científicas e infraestruturas digitais.

Posteriormente, foi desenvolvido um projeto de investigação centrado na promoção da adoção de ferramentas de gestão de dados, com especial enfoque na criação de vocabulários que enriquecessem os metadados e permitissem uma caracterização mais detalhada das práticas dos investigadores. Paralelamente, têm sido orientados estudantes na área da gestão da informação, contribuindo para a formação de profissionais capacitados para os desafios da ciência aberta.

Desde 2021, o INESC TEC passou a integrar funções institucionais de apoio à publicação de dados científicos, com base num repositório desenvolvido internamente e gerido segundo critérios alinhados com os princípios FAIR. Esta gestão adota uma abordagem flexível, que reconhece as limitações e necessidades específicas dos investigadores. O apoio à publicação estende-se também a outros repositórios, através da criação de comunidades dedicadas a projetos específicos.

Uma componente central da atividade institucional reside no apoio à elaboração e revisão de Planos de Gestão de Dados (Data Management Plans – DMP), tanto em projetos em curso como em novas iniciativas. Este apoio inclui recomendações técnicas e boas práticas, permitindo que as equipas de investigação se concentrem na produção e análise dos dados, enquanto se assegura a conformidade com os requisitos institucionais e normativos.

Mais recentemente, foi implementada formação sistemática dirigida a investigadores, com o objetivo de reforçar a capacitação interna em gestão de dados e ciência aberta. Estas ações são desenvolvidas pelo serviço de apoio à gestão que, embora não dedicado exclusivamente à ciência aberta, integra competências diversas, incluindo apoio administrativo, gestão de repositórios e arquivos, e produção de indicadores institucionais.

TRÊS LIÇÕES APRENDIDAS

Integração precoce nos projetos

A participação ativa nas reuniões de arranque (kick-off meetings) dos projetos constitui uma oportunidade estratégica para garantir a integração eficaz dos Planos de Gestão de Dados (DMP) desde as fases iniciais. Ao apresentar de forma clara e estruturada os objetivos, requisitos e implicações práticas dos DMP, promove-se não apenas a compreensão partilhada entre os parceiros, mas também o seu envolvimento e compromisso com as boas práticas de gestão e partilha de dados ao longo do ciclo de vida do projeto. Esta abordagem antecipada facilita o alinhamento entre as equipas, previne mal-entendidos futuros e contribui para a consolidação de uma cultura colaborativa e transparente em torno da ciência aberta.

Envolvimento ativo dos investigadores principais (PI) e flexibilidade

A motivação e o compromisso dos PI são determinantes para o sucesso da implementação dos DMP. A flexibilidade é um conceito transversal à gestão de dados. Embora existam requisitos técnicos e normativos obrigatórios — como os princípios FAIR — é essencial adaptar os processos às realidades dos investigadores. A simplificação dos procedimentos e a mediação ativa no depósito de dados são estratégias que visam evitar que os investigadores se sintam sobrecarregados. No INESC TEC, o processo de depósito é mediado. Esta abordagem tem como objetivo não só garantir a qualidade dos dados, mas também fomentar a confiança e a recorrência dos investigadores ao serviço.

Clareza na comunicação

A apresentação direta e objetiva dos requisitos técnicos e das boas práticas facilita a compreensão e adesão por parte dos investigadores, promovendo uma cultura de colaboração e melhoria contínua.

Em contextos de investigação multidisciplinar, a definição pode variar significativamente. As ambiguidades exigem uma abordagem pedagógica e adaptada, que ajude os investigadores a compreender e aplicar corretamente os conceitos de organização e descrição de dados.

Por exemplo, a diversidade de interpretações sobre o que constitui um dataset — desde uma pasta zipada até ficheiros individuais — dificulta a contabilização e a criação de indicadores avançados, como a percentagem de datasets publicados face ao número de artigos científicos.

TRÊS DESAFIOS FUTUROS

Disseminação do serviço em termos institucionais

Um dos principais desafios prende-se com a dificuldade em garantir que todos os investigadores têm conhecimento sobre os serviços de apoio à gestão de dados. Numa instituição extensa e distribuída como o INESC TEC, com múltiplos centros e polos geográficos, é complexo assegurar uma comunicação eficaz e uma presença transversal. Muitos investigadores acabam por publicar dados por iniciativa própria, em resposta a exigências editoriais, sem recorrer ao serviço institucional. Esta prática, embora legítima, pode comprometer a qualidade dos depósitos e dificultar a uniformização das boas práticas.

Equilíbrio entre rigor e flexibilidade

A publicação de dados exige conformidade com critérios técnicos e normativos, mas também sensibilidade às realidades dos investigadores. Defende-se uma abordagem equilibrada que permita o cumprimento dos princípios FAIR sem comprometer a viabilidade da partilha de dados.

Integração dos serviços nas práticas dos investigadores

Nem todos os investigadores recorrem ao serviço de gestão de dados, muitas vezes por desconhecimento ou por exigências editoriais que surgem no momento da publicação. Este desafio reforça a necessidade de tornar o serviço mais visível e acessível, promovendo uma cultura de colaboração desde as fases iniciais dos projetos.

Garantir a implementação das boas práticas desde o início dos projetos — desde o momento em que os dados são gerados e armazenados — é fundamental para assegurar a qualidade e a conformidade com os princípios FAIR.

A formação dos investigadores é essencial, mas enfrenta desafios de disponibilidade e adesão. É necessário um esforço contínuo para chegar às pessoas e promover sessões de capacitação que reforcem o conhecimento técnico necessário para uma gestão de dados eficaz. A compreensão da importância dos metadados e do nível de detalhe exigido na descrição dos dados é um exemplo claro da necessidade de formação especializada e contextualizada.

CINCO QUESTÕES SOBRE GDI

Como define, implementa e avalia as práticas de gestão de dados de investigação?

No INESC TEC, a partir deste serviço que apoia os investigadores, todo o processo de depósito é mediado. É realizada uma recolha de metadados e complementada a informação, garantido – o mais possível – a qualidade e conformidade com os princípios FAIR.

Desde o início dos projetos, são realizadas reuniões de arranque onde se apresentam os requisitos dos Planos de Gestão de Dados (DMP). É partilhada uma ficha de recolha de informação que serve de base para a elaboração dos DMP, adaptados às práticas internas e orientados para os investigadores.

O serviço não se limita aos dados do INESC TEC, mas também apoia projetos em que a instituição é parceira. Muitas vezes, os dados são recolhidos por outras entidades e integrados em comunidades específicas criadas para cada projeto.

Foi implementado um curso interno certificado, com duas manhãs dedicadas à gestão de dados de investigação, dirigido sobretudo a estudantes de doutoramento, mas aberto a outros públicos. Estão previstas duas edições por ano.

A necessidade de escalar processos com recursos limitados levou à exploração de ferramentas de inteligência artificial. A Inteligência Artificial tem potencial  para automatizar tarefas como o preenchimento de templates de DMP e o versionamento de ficheiros, embora sejam reconhecidas limitações atuais e salientada a importância de uma integração ética e eficaz.

Em centros de investigação, há práticas informais de armazenamento de dados em servidores partilhados. A intervenção do serviço desde o início do ciclo de vida dos dados pode evitar duplicações e promover o versionamento adequado, facilitando a posterior publicação e reutilização.

Quais os principais benefícios dessas práticas?

Um dos principais benefícios identificados é a criação de templates orientadores que facilitam a compreensão e o preenchimento dos Planos de Gestão de Dados (DMP). Estes modelos não se limitam a reproduzir os formatos oficiais dos financiadores, mas são adaptados às práticas institucionais e à linguagem dos investigadores. Esta abordagem reduz o esforço exigido aos investigadores, evita respostas genéricas ou sem significado, promove uma descrição mais rica e útil dos dados e facilita a consulta posterior por colegas e parceiros.

A mediação não se limita ao apoio técnico, mas envolve uma recolha estruturada de informação e uma simplificação pragmática das exigências, tornando o processo mais acessível e eficaz.

Por outro lado, a prática de documentar datasets publicados nos DMP permite reconhecer e promover os contributos específicos de cada investigador. Esta valorização gera motivação e reforça o envolvimento dos investigadores no processo de gestão de dados, tendo até um efeito multiplicador que contribui para aumentar a adesão às práticas de partilha de dados, promover uma cultura de transparência e colaboração e estimular o sentido de pertença dos investigadores.

Em que medida a gestão de dados de investigação contribui para a otimização do processo de investigação?

Os DMP bem estruturados ajudam a clarificar com que dados se está a trabalhar, onde estão armazenados e como podem ser acedidos. Esta organização interna facilita a comunicação entre parceiros de projeto, a reutilização de dados já existentes e a criação de comunidades de prática em torno dos dados.

A partilha de dados não se limita à disponibilização técnica, mas envolve também a partilha de contexto — apresentações, bibliografia, documentação — que enriquece a compreensão e o uso dos datasets. Quando bem comunicadas, estas práticas são valorizadas pelos investigadores e contribuem para a eficiência e qualidade da investigação.

Que vantagens e condicionantes aponta na partilha de dados de investigação?

Apesar das vantagens evidentes da partilha de dados — como a transparência, reutilização e colaboração — existem condicionantes significativas, sobretudo em áreas como a bioengenharia e em projetos com empresas, onde há acordos de confidencialidade e dados sensíveis. Para mitigar essas limitações, podem ser adotadas estratégias como a disponibilização de metadados detalhados, a partilha de amostras representativas dos dados ou a criação de guias para pedidos de acesso, permitindo uma avaliação caso a caso.

Estas práticas procuram equilibrar a proteção da informação com a abertura científica, promovendo uma cultura de partilha responsável.

De que forma os diferentes atores envolvidos no processo de investigação estão comprometidos com a gestão de dados de investigação?

O envolvimento dos diversos atores — investigadores, responsáveis de projeto, serviços de apoio — está cada vez mais consolidado. Embora o desafio da escalabilidade persista, há uma maturidade crescente na forma como a gestão de dados é integrada nos projetos.

A mediação eficaz, a formação contínua e o reconhecimento dos contributos individuais são fatores que reforçam esse compromisso. O serviço atua como facilitador, promovendo práticas que são valorizadas tanto internamente como por parceiros e avaliadores externos.