Como transformar a gestão de dados de investigação de obrigação burocrática em ferramenta estratégica?

De que forma a formação inicial pode garantir que futuras gerações de investigadores adotem estas práticas naturalmente?

Que mecanismos podem reforçar o reconhecimento e a integridade na reutilização de dados em acesso aberto?

DESCRIÇÃO

A gestão de dados de investigação e a sua abertura à comunidade científica e a outras comunidades interessadas tem vindo a ganhar crescente relevância e era uma temática já conhecida, nomeadamente através da experiência de participação em projetos Twinning.

Contudo, o marco decisivo neste processo ocorreu com a aprovação de um projeto  na Universidade de Aveiro centrado na análise epigenética e que envolve dados de sequenciação, tradicionalmente depositados em plataformas internacionais amplamente utilizadas. Estes dados são frequentemente reutilizados por diversos investigadores, permitindo novas abordagens a problemas já estudados ou a questões emergentes, reforçando o valor da partilha e da reutilização da informação científica.

O projeto EPIBOOST – BOOSting excellence in environmental EPIgenetics está enquadrado no Programa Horizonte Europa que tornou a prática de acesso abeto aos dados obrigatória. Este enquadramento institucional trouxe novos desafios formais, exigindo maior rigor na implementação das boas práticas de gestão de dados e no cumprimento das obrigações estabelecidas nos grant agreements.

O processo coincidiu, igualmente, com a entrada em funcionamento do repositório institucional da Universidade de Aveiro, que não estava inicialmente previsto nos planos de gestão de dados, mas que acabou por ser integrado. Esta integração representou simultaneamente um desafio e uma oportunidade: permitiu alinhar práticas institucionais com as exigências europeias e criar condições para aprendizagem conjunta entre investigadores e equipas técnicas, num contexto em que a linguagem e a estruturação dos planos de gestão de dados ainda correspondiam obstáculos, no sentido em que os investigadores estavam pouco familiarizados com estes novos requisitos.

A decisão de privilegiar o repositório institucional reforçou a aposta na capacitação, objetivo central dos projetos Twinning. Estes projetos não se limitam ao desenvolvimento científico, mas promovem igualmente competências transversais, incluindo a gestão da ciência e dos dados de investigação. 

A experiência de implementação das práticas de gestão de dados de investigação no contexto do Horizonte Europa revelou-se exigente, mas também profundamente enriquecedora. Num cenário em que os fluxos institucionais ainda não estavam plenamente definidos, os investigadores pouco treinados e o apoio especializado limitado, o processo constituiu uma oportunidade de aprendizagem coletiva. Apesar das dificuldades iniciais e da perceção de que se tratava de mais uma exigência burocrática, a prática demonstrou o seu valor e contribuiu para a criação de uma cultura mais sólida e eficiente de gestão de dados.

TRÊS LIÇÕES APRENDIDAS

A prática desmistifica a perceção burocrática

A gestão de dados de investigação só se torna clara e compreensível quando é efetivamente praticada. O contacto direto com os requisitos e procedimentos permitiu ultrapassar a ideia inicial de que se tratava apenas de uma obrigação administrativa sem benefícios. A experiência mostrou que, ao experimentar e aplicar, é possível reconhecer o potencial e as vantagens da gestão estruturada de dados, transformando-a de um fardo numa ferramenta útil.

Fluxos de registo estruturados aumentam a eficiência

A ausência de fluxos claros de registo e organização de dados gera perdas de tempo e descontinuidade nos projetos, sobretudo quando há rotatividade de investigadores. A implementação de processos formais, como a preparação de dossiês para depósito em acesso aberto, revelou-se uma estratégia eficaz para monitorizar o progresso da investigação e assegurar continuidade. Estes fluxos não apenas reduzem falhas, como também tornam a própria investigação mais eficiente e transparente.

Capacitação gera cultura e sustentabilidade

A obrigatoriedade de adotar boas práticas de gestão de dados impulsionou a formação da equipa e estimulou a criação de hábitos que beneficiarão as gerações futuras de investigadores. O treino e a adaptação inicial, embora exigentes, abriram caminho para que os novos investigadores encarem estas práticas como parte natural do processo científico. Assim, a experiência não só fortaleceu a equipa atual, como contribuiu para institucionalizar uma cultura de gestão de dados que assegura maior eficiência e sustentabilidade da investigação.

TRÊS DESAFIOS FUTUROS

Reforço do apoio institucional especializado

Um dos principais obstáculos prende-se com a ausência de equipas dedicadas de data stewards capazes de apoiar coordenadores e gestores de projetos, sobretudo em consórcios internacionais de grande dimensão. A inexistência deste suporte técnico coloca sobre os investigadores responsabilidades para as quais não estão plenamente preparados, como a definição de vocabulários ou a harmonização de práticas entre parceiros. O futuro exige que as instituições invistam em estruturas estáveis de apoio especializado, garantindo consistência e qualidade na gestão de dados.

Integração da formação em currículos académicos

A gestão de dados de investigação deve ser incorporada desde cedo nos percursos formativos, começando na licenciatura e aprofundando-se no mestrado e doutoramento. A ausência desta preparação inicial faz com que os investigadores encarem estas práticas como exigências adicionais e burocráticas. Ao contrário, se forem treinados desde o início, adotarão naturalmente estas metodologias como parte integrante da investigação, tornando os processos mais eficientes e sustentáveis. Este desafio implica uma mudança curricular e pedagógica significativa.

Reconhecimento e proteção da autoria dos dados

Apesar das vantagens do acesso aberto, subsiste um conflito entre o esforço de quem gera dados e a reutilização por terceiros sem o devido reconhecimento. A falta de mecanismos eficazes para garantir citações e rastrear reutilizações fragiliza a confiança dos investigadores e cria barreiras psicológicas à abertura. O futuro passa por desenvolver ferramentas e práticas que assegurem integridade e reconhecimento, promovendo a cultura de que um dataset tem o mesmo valor e estatuto de uma publicação científica.

Estes três desafios — apoio institucional especializado, formação académica estruturada e reconhecimento da autoria dos dados — representam pontos críticos para a consolidação de uma cultura de gestão de dados robusta e sustentável. Enfrentá-los será determinante para que as instituições e os investigadores possam não apenas cumprir requisitos formais, mas também transformar a gestão de dados num verdadeiro motor de eficiência, colaboração e inovação científica.

CINCO QUESTÕES SOBRE GDI

Como define, implementa e avalia as práticas de gestão de dados de investigação?

A implementação de boas práticas na gestão de dados de investigação exige uma abordagem estruturada e integrada, capaz de responder às exigências formais dos financiadores e, ao mesmo tempo, de promover eficiência e qualidade nos processos científicos.

Um primeiro passo fundamental consiste na definição de fluxos claros, através da criação de dossiês e templates específicos para o depósito de dados. Esta prática assegura uniformidade e continuidade, permitindo que diferentes investigadores ou equipas possam dar seguimento ao trabalho sem perda de informação ou inconsistência nos registos.

Complementarmente, a formação prática (hands-on) revela-se essencial. Ao utilizar os próprios dados dos investigadores em exercícios de depósito e gestão, o processo torna-se mais concreto e aplicável, facilitando a aprendizagem e a apropriação das metodologias. Esta abordagem prática contribui para desmistificar a perceção de burocracia e reforça a utilidade da gestão de dados como ferramenta de apoio à investigação.

Outro elemento crítico é a integração institucional, que passa pela implementação de repositórios institucionais e pelo alinhamento com os requisitos formais dos financiadores, como os estabelecidos no Horizonte Europa. Esta integração garante não apenas conformidade legal e contratual, mas também reforça a credibilidade da instituição e a sua capacidade de participar em projetos internacionais de grande dimensão.

Por fim, a avaliação contínua desempenha um papel central na consolidação destas práticas. A monitorização da eficácia deve ser realizada através da análise da capacidade de reutilização dos dados, da adesão das equipas e da redução de falhas nos processos de investigação. Este acompanhamento permite identificar pontos de melhoria, ajustar estratégias e assegurar que a gestão de dados evolui em consonância com as necessidades da comunidade científica e com as exigências regulatórias.

Quais os principais benefícios dessas práticas?

A adoção de práticas estruturadas de gestão de dados de investigação tem demonstrado benefícios claros tanto para os investigadores como para as instituições.

Um dos aspetos mais relevantes é a desmistificação do processo. Ao serem aplicadas de forma sistemática, estas práticas deixam de ser percecionadas como meros requisitos burocráticos e passam a ser entendidas como ferramentas úteis, capazes de apoiar diretamente a investigação. Esta mudança de perceção é essencial para promover a adesão e para consolidar uma cultura de dados mais madura e eficiente.

Outro benefício evidente é a eficiência. A existência de registos claros e fluxos definidos reduz significativamente as perdas de tempo associadas à rotatividade de investigadores e à ausência de documentação estruturada. Com dados organizados e acessíveis, torna-se possível assegurar continuidade nos projetos, evitando duplicação de esforços e facilitando a interpretação e prosseguimento do trabalho por diferentes membros da equipa.

A capacitação constitui igualmente um resultado central. A implementação destas práticas promove o desenvolvimento de competências transversais em investigadores e técnicos, fortalecendo a cultura institucional e criando condições para que futuras gerações de cientistas integrem naturalmente a gestão de dados nos seus processos de trabalho. Este investimento em formação e prática contribui para a sustentabilidade e para a qualidade da investigação a longo prazo.

Por fim, destaca-se a conformidade com as exigências legais e contratuais dos financiadores. O cumprimento rigoroso destas normas não só evita riscos de incumprimento, como reforça a credibilidade das instituições e a sua capacidade de participar em projetos internacionais competitivos. A gestão de dados, neste sentido, deixa de ser apenas uma obrigação formal e passa a representar uma vantagem estratégica.

Em que medida a gestão de dados de investigação contribui para a otimização do processo de investigação?

O impacto da gestão estruturada de dados na otimização do processo de investigação é significativo e multifacetado, refletindo-se diretamente na eficiência e na qualidade dos resultados científicos.

Em primeiro lugar, destaca-se a continuidade. A existência de fluxos de registo bem definidos permite que diferentes membros da equipa avancem sem interrupções, mesmo em contextos de rotatividade ou substituição de investigadores. Esta prática assegura que o conhecimento acumulado não se perde e que o trabalho pode prosseguir de forma consistente e integrada.

A monitorização constitui outro benefício central. Dossiês e planos de gestão de dados funcionam como ferramentas de acompanhamento do progresso científico, permitindo avaliar etapas concluídas, identificar lacunas e garantir que os objetivos do projeto são cumpridos. Esta capacidade de acompanhamento sistemático fortalece a transparência e facilita a tomada de decisões estratégicas.

No que respeita à qualidade, a organização e acessibilidade dos dados aumentam a fiabilidade dos resultados e abrem espaço para novas abordagens investigativas. Dados bem estruturados não apenas reduzem erros e inconsistências, como também potenciam a reutilização e a exploração de hipóteses adicionais, ampliando o impacto da investigação.

Por fim, a agilidade é um efeito direto da formação adequada dos investigadores. Quando estes dominam as práticas de gestão de dados, conseguem integrá-las naturalmente no seu trabalho, sem atrasos adicionais ou perceção de burocracia. A gestão de dados torna-se, assim, parte integrante do processo científico, contribuindo para maior rapidez e eficiência na produção de conhecimento.

Em conjunto, estes elementos demonstram que a gestão de dados não é apenas um requisito formal, mas um fator determinante para a otimização da investigação, assegurando continuidade, monitorização rigorosa, qualidade acrescida e maior agilidade na execução dos projetos.

Que vantagens e condicionantes aponta na partilha de dados de investigação?

A gestão de dados de investigação apresenta um conjunto de vantagens que reforçam a qualidade e a sustentabilidade da ciência, mas também enfrenta condicionantes que exigem atenção e investimento estratégico por parte das instituições.

Entre as principais vantagens, destaca-se a maior eficiência e transparência nos processos científicos. A adoção de fluxos claros e práticas de registo estruturado permite reduzir falhas, assegurar continuidade e tornar os resultados mais fiáveis e acessíveis. Paralelamente, a implementação destas práticas contribui para a formação de novas gerações de investigadores, que desde cedo se adaptam às exigências da gestão de dados e passam a encarar estas metodologias como parte natural da investigação. Este processo formativo garante que, no futuro, a cultura de dados estará plenamente integrada nas rotinas científicas.

Outro benefício relevante é o reforço da credibilidade institucional e da competitividade em projetos internacionais. Instituições que demonstram capacidade de gerir dados de forma eficiente e conforme às exigências dos financiadores posicionam-se melhor para liderar ou integrar consórcios de grande dimensão, aumentando a sua visibilidade e relevância no panorama científico global.

Contudo, estas vantagens são acompanhadas por condicionantes que não podem ser ignorados. A falta de recursos humanos especializados, nomeadamente data stewards, limita a capacidade de apoio técnico e coloca sobre os investigadores responsabilidades adicionais para as quais nem sempre estão preparados. A isto somam-se os custos elevados de formação e a resistência inicial dos investigadores, que muitas vezes percecionam a gestão de dados como uma exigência burocrática sem benefícios imediatos.

Existe ainda um conflito psicológico e cultural em torno da abertura e reutilização dos dados sem reconhecimento adequado. Muitos investigadores sentem que o esforço investido na produção de dados não é devidamente valorizado quando estes são reutilizados sem citação, o que gera barreiras à plena adesão ao acesso aberto.

 Finalmente, a necessidade de políticas institucionais claras e obrigatórias surge como um fator crítico: sem diretrizes firmes e consistentes, a adesão tende a ser desigual e dependente da motivação individual, comprometendo a eficácia das práticas.

Em síntese, a gestão de dados de investigação oferece ganhos significativos em eficiência, formação e credibilidade, mas só poderá atingir o seu pleno potencial se forem enfrentados os desafios relacionados com recursos humanos, formação, cultura científica e políticas institucionais.

De que forma os diferentes atores envolvidos no processo de investigação estão comprometidos com a gestão de dados de investigação?

O papel dos diferentes atores na gestão de dados de investigação é determinante para assegurar a eficácia, a sustentabilidade e a credibilidade das práticas adotadas. Cada interveniente contribui de forma complementar para a criação de uma cultura sólida de dados, capaz de responder às exigências científicas e institucionais.

As instituições têm a responsabilidade de garantir recursos humanos dedicados, definir perfis funcionais específicos e investir em programas de formação contínua. Além disso, devem criar políticas claras e obrigatórias que assegurem a adesão dos investigadores e promovam a integração da gestão de dados como parte essencial da atividade científica.

Os investigadores desempenham um papel central ao adotar práticas de gestão desde o início das suas carreiras, participando em formações e contribuindo para a consolidação da cultura de dados. A sua adesão e envolvimento são fundamentais para que estas práticas deixem de ser percecionadas como burocráticas e passem a ser encaradas como ferramentas de apoio à investigação.

Os data stewards assumem uma função técnica especializada, apoiando os projetos na definição de vocabulários, na harmonização de procedimentos e na garantia da qualidade dos planos de gestão. A sua intervenção é essencial para assegurar consistência e rigor, sobretudo em consórcios internacionais de grande dimensão.

Os financiadores têm igualmente um papel estratégico, ao definir requisitos claros e promover a cultura de dados como parte integrante da investigação. Ao estabelecer normas e critérios de avaliação, contribuem para que a gestão de dados seja reconhecida como elemento indispensável à qualidade e à transparência científica.

Por fim, os centros de competências oferecem formação inicial e contínua, adaptada às necessidades dos investigadores e à evolução das regras de financiamento. Estes centros funcionam como espaços de apoio e capacitação, garantindo que as práticas de gestão de dados acompanham as mudanças do ecossistema científico e regulatório.

Em conjunto, estes atores formam um ecossistema interdependente, no qual cada papel é essencial para que a gestão de dados de investigação se afirme como prática consolidada, eficiente e sustentável, contribuindo para o avanço da ciência e para o reforço da credibilidade institucional.

 

 

De que forma a interoperabilidade reforça o impacto científico e social do portal BIOS?

Quais os principais desafios para garantir a sustentabilidade institucional e evitar a dependência exclusiva das equipas científicas?

Como a integração da ciência cidadã e a normalização dos formatos contribuem para a valorização e reutilização dos dados de biodiversidade?

DESCRIÇÃO

O portal BIOS – Biodiversidade dos Açores teve início em 2004, no contexto de um projeto INTERREG que envolveu as regiões das Canárias, Açores, Madeira e Cabo Verde. A proposta inicial visava a criação de uma plataforma de biodiversidade comum, interoperável e comunicável entre todas estas regiões.

Apesar do sucesso inicial, o projeto não teve continuidade em Cabo Verde e na Madeira. No primeiro caso, a ausência de condições operacionais e de capacidade científica dificultou o avanço. No segundo, questões de política interna e reservas relativamente à partilha de dados de biodiversidade impediram a consolidação da iniciativa. Ainda assim, foram produzidas listagens taxonómicas em todas as regiões, incluindo duas para os Açores (2005 e 2010) e uma para a Madeira (2008), elaborada com a colaboração de equipas locais e nacionais.

Nas Canárias, o projeto evoluiu de forma consistente, resultando na criação de uma ferramenta de partilha de dados de elevada relevância para a gestão territorial e para as políticas públicas de conservação. Nos Açores, o percurso foi distinto: após um envolvimento inicial do Governo Regional, a continuidade do projeto passou a ser assegurada pela equipa científica local, que integrou o Portal Biota a nível nacional como infraestrutura reconhecida pela Fundação para a Ciência e a Tecnologia (FCT).

Atualmente, o BIOS é considerado uma infraestrutura oficial do Governo Regional dos Açores e encontra-se em processo de candidatura a financiamento no âmbito das infraestruturas regionais, prevendo-se um apoio significativo para a sua manutenção e desenvolvimento.

A experiência acumulada ao longo do projeto permitiu identificar três questões centrais no domínio da gestão e partilha de dados de investigação:

Disponibilização e interoperabilidade dos dados: a necessidade de assegurar que os sistemas criados sejam compatíveis e comunicáveis entre diferentes regiões e instituições.

Sustentabilidade institucional: a importância de garantir apoio político e recursos humanos adequados para a manutenção das infraestruturas de dados, evitando dependência exclusiva das equipas científicas.

Valorização e aplicação dos dados: a relevância de promover a utilização dos dados de biodiversidade em políticas públicas, planeamento territorial e iniciativas de conservação, reforçando o impacto social e científico da partilha de informação.

O projeto BIOS representa um percurso de mais de duas décadas de trabalho colaborativo, marcado por avanços significativos na disponibilização de dados de biodiversidade e pela consolidação de uma infraestrutura científica regional. A experiência evidencia tanto o potencial da partilha de dados para a ciência e para a sociedade, como os desafios institucionais e políticos que ainda se colocam à sua plena integração e sustentabilidade.

TRÊS LIÇÕES APRENDIDAS

Limitações dos sistemas iniciais

Os primeiros modelos de gestão de dados assentavam em software instalado localmente e em servidores dedicados, o que implicava custos elevados de manutenção e exigia equipas técnicas especializadas para garantir o funcionamento. A natureza fechada destes sistemas criava barreiras significativas: apenas utilizadores com conhecimentos avançados conseguiam aceder ou manipular os dados, o que reduzia drasticamente o potencial de reutilização. Além disso, a ausência de mecanismos de interoperabilidade dificultava a integração com outras bases de dados e plataformas, fragmentando a informação e limitando a sua circulação. Como consequência, os dados permaneciam isolados em silos institucionais, sem alcançar a comunidade científica mais ampla nem a sociedade, que poderia beneficiar do seu valor.

Necessidade de plataformas online abertas

A evolução tecnológica e a crescente valorização da ciência aberta evidenciaram a necessidade de migrar para plataformas acessíveis diretamente pela internet. Estas soluções eliminaram a dependência de software especializado, tornando o processo de disponibilização e carregamento de dados mais intuitivo e inclusivo. A acessibilidade universal passou a ser um princípio estruturante, permitindo que investigadores, gestores de dados e cidadãos acedam às informações sem barreiras técnicas. Além disso, a interoperabilidade tornou-se uma característica central, facilitando a integração com sistemas internacionais e potenciando colaborações transfronteiriças. Exemplos como o Atlas of Living Australia demonstraram que a abertura não só amplia o alcance dos dados, como também fortalece a confiança da comunidade científica e da sociedade na sua utilização.

Integração da ciência cidadã e normalização dos formatos

A incorporação de ferramentas de ciência cidadã, como o iNaturalist, trouxe uma dimensão participativa inédita, permitindo que qualquer pessoa contribua para a recolha e disponibilização de dados. Este envolvimento da sociedade aumentou a diversidade e a escala da informação recolhida, enriquecendo os repositórios científicos com dados provenientes de múltiplos contextos. 

Paralelamente, a adoção de padrões internacionais como o Darwin Core foi decisiva para assegurar a interoperabilidade, permitindo que os dados sejam reutilizados em diferentes plataformas e contextos — desde portais regionais e nacionais até bases globais e publicações científicas. A normalização dos formatos também facilitou a criação de data papers, que conferem reconhecimento académico ao trabalho de recolha e gestão de dados, reforçando a credibilidade e a visibilidade dos resultados. Este alinhamento entre participação cidadã e padronização técnica consolidou uma cultura de abertura e confiança, essencial para a valorização dos dados científicos.

TRÊS DESAFIOS FUTUROS

Recursos humanos e sustentabilidade da equipa

A escassez de recursos humanos dedicados à manutenção da infraestrutura constitui um dos maiores entraves à sua consolidação. Apesar de fases de financiamento terem permitido a contratação temporária de bolseiros, que apoiaram investigadores na preparação de dados e data papers, a ausência de mecanismos de apoio continuado para pessoal técnico especializado compromete a estabilidade da equipa. Esta intermitência gera descontinuidade no trabalho, dificulta a retenção de competências e impede a criação de rotinas sólidas de gestão de dados. Sem uma equipa estável e qualificada, torna-se difícil assegurar a eficiência na mobilização, curadoria e disponibilização dos dados, o que fragiliza a credibilidade e a capacidade de resposta da infraestrutura perante desafios crescentes.

Infraestrutura tecnológica e capacidade institucional

A limitação da capacidade técnica das instituições para gerir servidores, garantir requisitos de rede e assegurar padrões de segurança representa outro obstáculo significativo. A inexistência de condições adequadas obriga ao recurso a empresas externas para a gestão da infraestrutura, financiadas com verbas de investigação que deveriam ser canalizadas para atividades científicas. Esta dependência externa aumenta os custos operacionais e reduz a autonomia do projeto, tornando-o vulnerável a flutuações de mercado e à disponibilidade de serviços contratados. Além disso, a falta de uma base tecnológica sólida dentro da instituição dificulta a integração da infraestrutura em estratégias mais amplas de ciência aberta e gestão de dados, limitando o seu impacto e alcance.

Institucionalização e continuidade a longo prazo

Garantir que a infraestrutura seja assumida de forma institucional pelo Governo Regional ou por entidades nacionais é um desafio crítico para a sua sustentabilidade. Atualmente, a continuidade depende sobretudo da visão e dedicação das equipas de investigação, sem integração plena nas estruturas oficiais. Esta dependência de lideranças individuais coloca em risco a perenidade do projeto, especialmente perante a eventual saída ou reforma dos investigadores que o impulsionam. A institucionalização é, portanto, essencial para assegurar estabilidade, financiamento regular e reconhecimento formal da infraestrutura como parte integrante das políticas científicas e tecnológicas. Só através desta integração será possível garantir relevância a longo prazo, consolidar a confiança da comunidade científica e da sociedade, e transformar a infraestrutura num recurso estratégico para o desenvolvimento regional e nacional.

CINCO QUESTÕES SOBRE GDI

Como define, implementa e avalia as práticas de gestão de dados de investigação?

A gestão de dados de investigação é assegurada através de um processo estruturado que combina normas internacionais, mecanismos de validação em múltiplos níveis e práticas de revisão contínua. O objetivo central é garantir que os dados recolhidos, sejam provenientes de ciência cidadã, de projetos de estudantes de doutoramento e mestrado ou de equipas de investigação, tenham qualidade científica, consistência taxonómica e credibilidade para serem reutilizados em diferentes contextos.

A recolha de dados, orientada por standards previamente definidos como o Darwin Core, estabelece regras claras sobre formatos, categorias e metodologias de registo. Esta normalização facilita a uniformização dos dados, reduz ambiguidades e assegura que diferentes equipas e contextos de recolha possam produzir informação compatível e interoperável. O uso de tabelas e modelos estruturados constitui um benefício adicional pois orienta investigadores e cidadãos na forma correta de recolher e descrever os dados promovendo consistência desde o início do processo.

A qualidade dos dados é avaliada em quatro níveis complementares. No nível inicial os orientadores de alunos de doutoramento e mestrado asseguram que os dados recolhidos têm validade científica e rigor taxonómico; no nível intermédio a própria plataforma de gestão GBIF deteta erros estruturais ou taxonómicos durante a submissão obrigando à sua correção antes da integração definitiva; no nível avançado, revistas científicas especializadas como o  Biodiversity Data Journal realizam uma revisão detalhada das tabelas e metadados identificando inconsistências que devem ser corrigidas e recarregadas. No último nível, os data papers publicados permitem ainda uma última revisão pelos pares garantindo que os dados disponibilizados cumprem critérios de qualidade e podem ser reutilizados com confiança.

Assim, a avaliação e implementação das práticas de gestão de dados de investigação assentam numa combinação de normalização técnica validação, em múltiplos níveis e revisão contínua. Este modelo garante não apenas a qualidade e credibilidade dos dados mas também a sua valorização científica e social ao permitir que sejam reutilizados em diferentes contextos e reconhecidos como parte integrante da produção académica

Quais os principais benefícios dessas práticas?

A principal vantagem decorre da adoção de standards internacionais na organização dos dados que imprime versatilidade, permitindo que a mesma base de informação seja utilizada para múltiplos fins sem necessidade de duplicação de esforços. Quando os dados são estruturados de acordo com normas como o Darwin Core, tornam-se imediatamente aplicáveis em diferentes contextos, desde a gestão interna de projetos de investigação até à disponibilização em plataformas internacionais.

O percurso de utilização dos dados, desde a primeira fase na qual os alunos de mestrado e doutoramento asseguram eles próprios a qualidade da recolha, passando pelos processos de validação automática do GBIF e /ou a integração em portais regionais, até à sua publicação em plataformas de data papers demonstra que um único produto inicial — a base de dados organizada segundo standards — pode sustentar quatro níveis distintos de utilização: investigação individual dos alunos, integração em plataformas globais, disponibilização em portais regionais e publicação científica.

Este modelo revela-se particularmente vantajoso porque reduz a necessidade de intervenção constante dos orientadores, que passam a focar-se na supervisão científica geral, enquanto os alunos desenvolvem autonomia na gestão dos seus dados. A uniformização e a reutilização em múltiplos contextos reforçam não apenas a eficiência da investigação, mas também a credibilidade e o impacto dos resultados produzidos.

Em que medida a gestão de dados de investigação contribui para a otimização do processo de investigação?

A implementação de práticas estruturadas de gestão de dados tem um efeito direto na otimização do processo científico. Ao trabalhar com dados organizados segundo standards internacionais, os estudantes desenvolvem não apenas competências técnicas, mas também uma maior consciência da importância da qualidade e da consistência da informação que produzem. O facto de saberem que os seus dados serão submetidos a diferentes níveis de validação e revisão — desde a supervisão dos orientadores até à avaliação em plataformas internacionais e revistas científicas — incentiva-os a adotar uma postura mais rigorosa e sistemática na recolha, organização e análise da informação.

Este processo contribui para a eficiência da investigação, uma vez que dados bem estruturados podem ser facilmente integrados em softwares de análise estatística, modelos de investigação ou bases de dados globais. A uniformização reduz redundâncias e erros, permitindo que os investigadores concentrem esforços na interpretação científica e não na resolução de problemas técnicos.

Além disso, a experiência adquirida pelos estudantes na gestão de dados segundo normas reconhecidas internacionalmente constitui uma aprendizagem duradoura. Mesmo após concluírem os seus estudos ou seguirem outros percursos profissionais, levam consigo boas práticas de organização, documentação e partilha de informação, que podem ser aplicadas em diferentes contextos científicos ou profissionais.

Este impacto é também de natureza formativa e heurística, pois promove uma cultura de rigor, transparência e eficiência que ultrapassa o âmbito imediato da investigação académica. A gestão de dados deixa de ser apenas uma exigência técnica e passa a ser entendida como parte integrante da prática científica, contribuindo para a credibilidade dos resultados e para a sustentabilidade da ciência aberta.

Que vantagens e condicionantes aponta na partilha de dados de investigação?

A partilha de dados de investigação constitui um elemento central para a valorização científica e social da informação produzida. Atualmente, os dados recolhidos podem ser disponibilizados e reutilizados de forma ampla, desde que seja garantido o devido crédito aos seus autores. Esta abertura promove transparência, reforça a credibilidade dos resultados e facilita a integração em plataformas regionais, nacionais e internacionais, ampliando o impacto da investigação.

Do ponto de vista académico, a partilha permite que estudantes e investigadores utilizem os mesmos conjuntos de dados em diferentes fases do trabalho científico, desde análises estatísticas até publicações em data papers. A disponibilização em portais assegura visibilidade internacional e contribui para a consolidação de boas práticas de ciência aberta.

Embora a regra geral seja a abertura, existem situações específicas em que condicionantes éticas ou de privacidade exigem ajustamentos. Um exemplo recente ocorreu com dados de monitorização de térmitas nos Açores, recolhidos ao longo de 15 anos. Inicialmente, os registos incluíam a localização precisa das ocorrências, mas foi identificado o risco de que essa informação pudesse ser utilizada de forma indevida, por exemplo em transações imobiliárias. Para mitigar este problema, os dados foram disponibilizados com menor resolução espacial, agregando pontos num raio de 500 metros.

Este caso ilustra que, em determinadas circunstâncias, a proteção da privacidade ou a salvaguarda de interesses sociais pode exigir a redução da precisão dos dados. No entanto, mesmo com estas limitações, foi possível garantir a sua disponibilização, preservando o valor científico e assegurando a reutilização em contextos de investigação.

De que forma os diferentes atores envolvidos no processo de investigação estão comprometidos com a gestão de dados de investigação?

A gestão de dados de investigação envolve múltiplos atores, cada um com responsabilidades e níveis distintos de compromisso. No caso dos estudantes de mestrado e doutoramento, o envolvimento é direto e prático, uma vez que são eles que recolhem, organizam e estruturam os dados segundo standards internacionais. Este processo não só garante a qualidade e a consistência da informação, como também promove a aprendizagem de boas práticas que se tornam parte integrante da sua formação científica.

Os orientadores desempenham um papel complementar, assegurando a supervisão científica geral e validando a credibilidade dos dados produzidos. Embora não estejam envolvidos em todos os detalhes técnicos, apoiam os estudantes na adoção de metodologias rigorosas e na integração dos dados em contextos mais amplos, como publicações ou plataformas internacionais.

Ao nível institucional, a Universidade dos Açores demonstra abertura à partilha de dados e já possui experiência consolidada na gestão de repositórios de publicações. Contudo, a sua capacidade instalada em termos de servidores e infraestrutura tecnológica é limitada, o que obriga ao recurso a empresas externas para assegurar a manutenção e segurança da plataforma. Apesar destas restrições, não existe resistência à disponibilização dos dados, havendo colaboração por parte dos serviços internos, nomeadamente o serviço de informática, que responde de forma eficiente às necessidades operacionais.

No plano político, o Governo Regional dos Açores ainda não assumiu plenamente a responsabilidade pela institucionalização da infraestrutura de dados, o que fragiliza a sustentabilidade a longo prazo. A continuidade depende sobretudo da dedicação das equipas de investigação, sem integração formal nas estruturas oficiais. Esta situação revela que o compromisso existe, mas é desigual: forte ao nível das equipas e dos estudantes, moderado ao nível da universidade e ainda incipiente ao nível governamental.

Em síntese, o processo de gestão de dados de investigação é sustentado por uma rede de atores que, embora com diferentes graus de envolvimento, partilham uma sensibilidade crescente para a importância da ciência aberta. O desafio futuro reside em transformar este compromisso em políticas institucionais e governamentais que assegurem estabilidade, recursos e reconhecimento formal da infraestrutura como parte integrante do sistema científico.

 

 

Como pode a partilha de dados transformar rotinas internas de investigação?

De que forma a organização dos dados reforça a continuidade e coesão das equipas?

Será a estruturação dos dados uma ferramenta metodológica tão importante quanto a recolha?

Como transformar a gestão de dados científicos numa prática valorizada e duradoura?

DESCRIÇÃO

O projeto de investigação em cognição comparada desenvolve trabalho de análise do comportamento tirando partido do contínuo entre espécies humanas e não humanas, com o objetivo de compreender processos psicológicos fundamentais como perceção, memória, aprendizagem, ou tomada de decisão. A abordagem adotada é comparativa e integradora, explorando diferentes espécies para identificar estratégias cognitivas e regras de comportamento adaptativo. As questões centrais incluem a forma como os organismos extraem informação relevante do ambiente, como navegam em contextos complexos e como tomam decisões entre opções disponíveis.

Os dados recolhidos são essencialmente quantitativos, incluindo métricas como frequência de respostas, escolhas entre alternativas, taxas de acerto e erro, e latência de resposta. Estas variáveis, baseadas em contagens e tempos, permitem inferir processos cognitivos subjacentes ao comportamento observado, constituindo uma base sólida para a análise científica.

O interesse em publicar os dados associados às publicações científicas levou ao desenvolvimento de práticas internas de organização e gestão. Embora os métodos de recolha se tenham mantido estáveis, a forma como os dados são tratados após a recolha sofreu melhorias significativas. Durante anos, foram enfrentadas dificuldades na sistematização dos dados, especialmente em momentos de transição de membros da equipa. A ausência de um sistema estruturado dificultava o acesso posterior aos dados e comprometia a continuidade da investigação. Em resposta, foram adotadas medidas que visam garantir a preservação, acessibilidade e reutilização dos dados, com vista à sua publicação em repositórios institucionais e à integração em práticas alinhadas com os princípios da ciência aberta.

TRÊS LIÇÕES APRENDIDAS

A partilha como prática transformadora

Uma das principais mudanças no grupo de investigação foi a adoção sistemática da partilha de dados através do repositório institucional. Esta prática, inicialmente vista como uma tarefa altruísta — feita para beneficiar outros investigadores — revelou-se crítica para a evolução das metodologias internas. Atualmente, tudo o que é produzido é publicado no repositório, com o apoio fundamental dos serviços de documentação e biblioteca, que disponibilizam ferramentas e orientações essenciais.

A existência de uma infraestrutura já montada foi uma das grandes lições: não é necessário reinventar a roda! O sistema de repositório oferece opções de categorização e formatos padronizados que facilitam a organização e publicação dos dados. Esta estrutura externa ajuda a ultrapassar a tendência natural de trabalhar apenas para consumo interno, promovendo uma organização mais clara e acessível.

Organização e inteligibilidade dos dados

Mesmo para o próprio investigador, os dados podem perder inteligibilidade ao longo do tempo. Torná-los compreensíveis para terceiros é, simultaneamente, uma forma eficaz de organizar o trabalho e de garantir a sua longevidade. A partilha obriga à sistematização, o que melhora a fluidez dentro do grupo de investigação.

Em estudos com animais, por exemplo, onde as recolhas são diárias e prolongadas, a organização dos dados permite que qualquer membro da equipa possa substituir outro em caso de ausência, sem comprometer a continuidade da investigação. Esta prática reforça a coesão e a eficiência do grupo.

Comunicação científica e reflexão metodológica

Outra lição apreendida é o impacto na comunicação científica. Explicar processos complexos de forma clara e acessível exige reflexão sobre a estrutura dos dados e sobre a melhor forma de os apresentar. Este exercício de descentração — pensar como os outros vão interpretar o que foi feito — ajuda os investigadores a olhar para os seus próprios dados com maior clareza.

A organização da informação, portanto, não é apenas uma questão técnica, mas uma ferramenta de pensamento. Ao integrar os dados em sistemas externos, o grupo deparou-se com desafios de enquadramento: onde é que este tipo de investigação se insere? Quão próxima está de outras áreas? 

Mesmo quando há motivação para organizar, a realidade da investigação é caótica, e os sistemas padronizados ajudam a transformar essa complexidade em estrutura.

TRÊS DESAFIOS FUTUROS

Superar barreiras terminológicas e disciplinaridades fragmentadas

Um dos desafios mais persistentes na ciência contemporânea é a fragmentação terminológica entre disciplinas que, embora distintas, partilham conceitos e metodologias semelhantes. Exemplifica-se esta realidade com o conceito de priming na psicologia, equivalente ao search image na etologia — duas designações para o mesmo fenómeno. Esta duplicação terminológica dificulta o diálogo interdisciplinar e impede a construção de conhecimento partilhado.

A partilha de dados, acompanhada de metadados rigorosos, surge como uma estratégia fundamental para ultrapassar estas barreiras. Ao tornar os dados acessíveis e bem descritos, abre-se espaço para que investigadores de diferentes áreas possam reinterpretá-los, reutilizá-los e estabelecer novas conexões. A criação de pontes entre disciplinas exige, portanto, não apenas abertura conceptual, mas também práticas de documentação e partilha que favoreçam a inteligibilidade e a interoperabilidade dos dados.

Reequilibrar a relação entre investigação básica e aplicada

Outro desafio crítico prende-se com a crescente assimetria entre investigação básica e aplicada, especialmente em áreas como a psicologia. A pressão por resultados com aplicação imediata tem levado ao desinvestimento em estudos fundamentais, comprometendo o avanço científico a longo prazo. Pretende-se, muitas vezes, colher os frutos da ciência sem investir na plantação das sementes.

A partilha de dados pode funcionar como um mecanismo de reequilíbrio, permitindo que resultados de investigação básica sejam reutilizados em contextos aplicados, mesmo quando a sua utilidade não era evidente no momento da recolha. No entanto, esta ponte entre vertentes exige também uma mudança nos critérios de avaliação científica, que devem reconhecer o valor intrínseco da investigação fundamental.

Além disso, dentro da própria psicologia, a ligação entre investigação básica e aplicada é frequentemente frágil. A partilha estruturada de dados pode contribuir para reforçar essa ligação, promovendo uma maior circulação de conhecimento entre subáreas e facilitando a tradução de descobertas em soluções práticas.

Decidir o que partilhar e como garantir sustentabilidade

A decisão sobre o que partilhar — e em que condições — constitui um dos dilemas mais complexos da gestão de dados. Em estudos experimentais, como os realizados com animais, os dados recolhidos incluem múltiplas variáveis (escolhas, latências, taxas de acerto), nem todas tratadas ou publicadas. Embora os dados brutos possam ter valor futuro, a sua partilha implica custos significativos de organização, curadoria e interpretação.

Muitos desses dados “invisíveis” existem e podem ser recuperados, mas a sua disponibilização exige um esforço adicional que nem sempre é viável. A alternativa — não os partilhar — limita o potencial de reutilização científica. Assim, torna-se necessário encontrar um equilíbrio entre exaustividade e viabilidade, definindo critérios claros para a seleção, tratamento e preservação dos dados.

CINCO QUESTÕES SOBRE GDI

Como define, implementa e avalia as práticas de gestão de dados de investigação?

A implementação das práticas de gestão de dados no grupo de investigação em psicologia tem seguido uma abordagem gradual, prática e centrada na melhoria contínua. Em vez de aguardar por soluções perfeitas, o grupo iniciou com procedimentos simples, que foram sendo refinados à medida que a experiência se acumulava. Um exemplo claro deste processo evolutivo é a inclusão progressiva de elementos como o software de recolha nos depósitos de dados, com revisões retroativas sempre que necessário. Esta lógica iterativa permite ajustar e melhorar continuamente os procedimentos, sem comprometer a continuidade do trabalho.

A avaliação das práticas é feita de forma interna e prática, com destaque para a estratégia de envolver estudantes no processo. Ao realizarem o seu primeiro depósito de dados com instruções mínimas, os estudantes são incentivados a explorar a base de dados existente, o que permite testar a inteligibilidade da documentação e identificar oportunidades de melhoria. Embora não se trate de uma avaliação formal, esta abordagem funciona como um mecanismo eficaz de autoavaliação e aprendizagem.

Do ponto de vista técnico, o grupo reconhece desafios relacionados com a interoperabilidade dos formatos utilizados, nomeadamente o uso de ficheiros Excel. A reflexão sobre formatos mais adequados e alinhados com os princípios FAIR está em curso, integrando-se num esforço mais amplo de conformidade com boas práticas internacionais.

Uma decisão estruturante foi a integração do depósito de dados como parte obrigatória do processo de publicação científica. Nenhum artigo é submetido sem que os dados estejam previamente depositados num repositório institucional, o qual gera automaticamente um código de referência (identificador persistente) a ser incluído na publicação. Esta prática reforça a normalização do depósito e assegura a rastreabilidade dos dados.

Apesar da ausência de incentivos formais específicos para a gestão de dados — frequentemente vista como uma tarefa com custos imediatos e benefícios diferidos — o grupo conseguiu integrar esta prática no sistema de incentivos já existente, associando-a diretamente à publicação científica. Esta estratégia contribui para a sustentabilidade da prática, tornando o depósito de dados uma etapa natural do ciclo de investigação.

Quais os principais benefícios dessas práticas?

Os benefícios decorrentes da abordagem adotada para a gestão de dados são amplos e estruturantes, refletindo-se tanto na qualidade do trabalho científico como na sua sustentabilidade a longo prazo. Em primeiro lugar, destaca-se a promoção de uma organização eficaz dos dados, que permite não apenas o seu armazenamento sistemático, mas também a preservação da integridade e da rastreabilidade da informação recolhida ao longo dos projetos. Esta organização facilita o acesso futuro aos dados, mesmo em contextos de rotatividade de equipa, assegurando a continuidade da investigação e a valorização dos resultados obtidos.

A reutilização dos dados é outro benefício central, possibilitada pela sua estruturação clara e pela adoção de práticas que favorecem a partilha em ambientes académicos reconhecidos. Ao tornar os dados acessíveis e compreensíveis para terceiros, abre-se espaço para novas análises, comparações e colaborações, ampliando o impacto da investigação original e fomentando a produção de conhecimento cumulativo.

A transparência do processo científico é igualmente reforçada, uma vez que os dados passam a estar disponíveis para verificação, validação e reutilização por outros investigadores. Esta abertura contribui para a credibilidade dos resultados e para a construção de uma ciência mais ética, responsável e alinhada com os princípios da integridade académica.

Importa também sublinhar que a gestão de dados é conduzida de forma prática e adaptada à realidade de um grupo pequeno, o que permite uma maior agilidade na implementação de rotinas e na resposta a desafios operacionais. A utilização de estratégias comportamentais, coerentes com o campo de estudo, tem sido eficaz na transformação de práticas pontuais em hábitos sustentáveis, promovendo uma cultura interna de responsabilidade e compromisso com a qualidade.

Esta coerência entre os princípios que orientam a investigação e as práticas adotadas no seu quotidiano contribui para uma cultura institucional de abertura e partilha, em sintonia com os valores da ciência aberta e com os desafios contemporâneos da produção científica. Ao integrar a gestão de dados como parte integrante do processo de investigação, reforça-se a ideia de que a produção de conhecimento não termina na publicação, mas prolonga-se na forma como os dados são preservados, disponibilizados e reutilizados.

Em que medida a gestão de dados de investigação contribui para a otimização do processo de investigação?

A gestão e partilha de dados têm um impacto direto na otimização do processo de trabalho científico, sobretudo nas fases posteriores à recolha inicial. Embora os métodos de recolha não tenham sido alterados, a organização dos dados após essa etapa beneficiou significativamente da implementação de práticas estruturadas. A estandardização dos procedimentos permitiu reduzir a carga administrativa, facilitar a comunicação entre membros da equipa e reutilizar estruturas previamente desenvolvidas. Estes ganhos traduzem-se em poupança de tempo e recursos, promovendo maior eficiência na condução dos estudos e na gestão quotidiana dos projetos.

Para além da eficiência operacional, a gestão de dados também contribui para a otimização ética da investigação, especialmente em contextos que envolvem animais não humanos. A partilha de dados já recolhidos por outros grupos permite evitar novas recolhas que impliquem exposição dos animais a procedimentos invasivos, alinhando-se com o princípio dos 3Rs — redução, substituição e refinamento. Esta prática reforça o compromisso com uma investigação responsável, respeitando os direitos dos sujeitos envolvidos e promovendo uma utilização mais racional dos recursos científicos.

Mesmo em estudos com participantes humanos, a reutilização de dados previamente organizados e acessíveis permite evitar redundâncias, acelerar o progresso científico e partir de bases já consolidadas. Esta abordagem favorece a continuidade da investigação, facilita a replicação de estudos e contribui para a construção de conhecimento cumulativo, com benefícios claros para a qualidade e a sustentabilidade da produção científica.

Que vantagens e condicionantes aponta na partilha de dados de investigação?

A partilha de dados de investigação apresenta um conjunto robusto de vantagens que contribuem para a qualidade, integridade e impacto da produção científica. Um dos benefícios mais imediatos é a organização e sistematização dos dados. O simples facto de preparar os dados para partilha obriga à sua estruturação clara, o que melhora a eficiência interna dos projetos e facilita a comunicação entre os membros da equipa. Esta prática promove uma cultura de rigor e transparência, com efeitos positivos na gestão quotidiana da investigação.

A partilha de dados também responde a uma responsabilidade pública fundamental. Quando a investigação é financiada por fundos públicos, existe uma obrigação ética de tornar os dados acessíveis e inteligíveis, reforçando o compromisso com a ciência aberta e com a prestação de contas à sociedade. Neste sentido, a disponibilização dos dados é encarada não apenas como uma boa prática, mas como um dever cívico e académico.

Outro aspeto relevante é o potencial motivador da partilha, sobretudo para investigadores em início de carreira. Ao transformar os dados num produto científico adicional, com valor próprio e possibilidade de citação, esta prática contribui para a valorização do trabalho desenvolvido e para o reconhecimento do esforço investido na sua produção e curadoria.

Do ponto de vista metodológico, a partilha de dados permite a validação cruzada de resultados, especialmente em áreas como a psicologia, onde os fenómenos estudados são frequentemente inferidos de forma indireta. A comparação entre diferentes tarefas e metodologias reduz vieses, fortalece a validade dos resultados e promove uma ciência mais robusta. A reprodutibilidade é igualmente beneficiada, uma vez que a disponibilização dos dados facilita o processo de revisão científica e permite replicações mais rigorosas.

Apesar destes benefícios, persistem condicionantes relevantes que limitam a adoção generalizada da partilha de dados. Um dos principais desafios prende-se com os custos associados à preparação, tratamento e publicação dos dados. Este processo exige tempo, esforço e competências específicas, o que pode tornar inviável a partilha integral de todos os conjuntos de dados. É, por isso, necessário encontrar um equilíbrio entre a utilidade da partilha e a sustentabilidade do esforço envolvido.

A sobrecarga dos investigadores constitui outro obstáculo significativo. Para além das exigências da investigação, os profissionais acumulam responsabilidades de ensino, captação de financiamento, extensão científica e gestão administrativa. A gestão de dados surge como mais uma tarefa num contexto já altamente exigente, o que pode comprometer a sua priorização.

Por fim, a ausência de incentivos formais nos sistemas de avaliação académica limita o reconhecimento institucional destas práticas. Enquanto a publicação de artigos continua a ser o principal critério de valorização curricular, a gestão e partilha de dados permanecem pouco visíveis, o que dificulta a sua integração plena nas rotinas científicas.

De que forma os diferentes atores envolvidos no processo de investigação estão comprometidos com a gestão de dados de investigação?

A transformação das práticas de gestão de dados na investigação científica depende do envolvimento articulado de múltiplos atores institucionais e individuais. A eficácia dessas práticas não se mede apenas pela sua implementação pontual, mas pela sua consolidação ao longo do tempo e pela capacidade de gerar mudanças comportamentais sustentadas. Neste contexto, o papel dos incentivos, do reconhecimento institucional e da criação de condições favoráveis à mudança é determinante.

As iniciativas de promoção da gestão de dados são particularmente eficazes junto de investigadores que já reconhecem o valor da partilha, mas ainda não a integram nas suas rotinas. Para este grupo, exemplos inspiradores e boas práticas podem funcionar como catalisadores de mudança. No entanto, para que essa mudança se torne estrutural, é necessário ir além da inspiração e atuar sobre o contexto em que os comportamentos científicos se desenvolvem.

A imposição de regras pode ser um ponto de partida útil, mas não é suficiente por si só. A valorização simbólica e institucional das práticas de gestão de dados — através de prémios, reconhecimento curricular ou indicadores específicos — é essencial para tornar essas práticas desejáveis e não apenas obrigatórias. A motivação dos investigadores está muitas vezes ligada à perceção de recompensa, seja ela material, reputacional ou simbólica. Assim, o desenho dos sistemas de avaliação científica deve refletir essa realidade, reconhecendo o trabalho invisível que sustenta os resultados visíveis.

A psicologia do incentivo oferece uma lente útil para compreender este fenómeno. Tal como outros animais, os humanos respondem a estímulos e recompensas. Se o sistema valoriza a quantidade de publicações, os investigadores tenderão a priorizar volume. Se, por outro lado, forem recompensadas práticas como a partilha de dados, a transparência e a colaboração, essas tornar-se-ão mais frequentes. Esta lógica exige uma revisão crítica das métricas atualmente utilizadas, evitando que se tornem metas distorcidas que comprometem a integridade do processo científico.

As instituições desempenham um papel central neste processo. Para além de disponibilizarem formação e plataformas técnicas, devem criar condições estruturais que favoreçam a adoção de boas práticas. Os serviços de documentação e bibliotecas, por exemplo, são atores fundamentais na operacionalização da gestão de dados, mas o seu contributo nem sempre é devidamente reconhecido. A mudança de comportamento exige mais do que capacitação: exige contexto, regras claras e valorização institucional.

A persistência é outro fator crítico. Mesmo quando os resultados não são imediatamente visíveis, a continuidade das ações é essencial para consolidar uma cultura de ciência aberta. A ausência de reconhecimento pode gerar desânimo, especialmente quando o esforço investido parece não produzir efeitos. No entanto, é precisamente essa persistência — muitas vezes silenciosa — que sustenta a transformação a longo prazo.

 

 

Como gerir dados históricos e comunitários de forma ética, acessível e cientificamente válida?
Estão as infraestruturas digitais preparadas para acolher dados das ciências sociais e humanas?
Que desafios levanta a curadoria de testemunhos orais enquanto dados de investigação?

DESCRIÇÃO

O projeto constitui uma investigação histórica centrada na arquitetura e na sua relação com as comunidades locais. A iniciativa parte da observação de elementos já identificados por outros estudos, mas que revelam camadas de significado ainda não plenamente exploradas. Trata-se de um campo específico, com desafios próprios, sobretudo no que se refere à acessibilidade e à gestão dos dados gerados. 

Este trabalho levanta questões relevantes sobre a capacidade das instituições para lidar com dados provenientes das ciências sociais e humanas. Observa-se, ainda hoje, uma predominância de abordagens centradas nas ciências exatas e naturais, o que dificulta a adaptação de metodologias e infraestruturas às exigências das ciências sociais. Tal limitação tem representado um dos principais desafios enfrentados, exigindo constante negociação e ajustamento de práticas. 

A questão central que orienta o projeto é: de que forma a história da arquitetura pode contribuir para que as comunidades continuem a utilizar edifícios públicos? Para responder a esta pergunta, foram desenvolvidos dois projetos complementares: um projeto financiado pela Fundação para a Ciência e a Tecnologia (FCT), com foco nas regiões do Alentejo e Algarve; um projeto financiado pelo European Research Council (ERC), de maior escala, abrangendo todo o território português e incluindo também impactos provenientes de Espanha. 

Enquanto o projeto FCT se concentrou no sul do país, o projeto ERC dedicou-se ao centro e norte. Em ambos os casos, foram aplicadas metodologias tradicionais de investigação histórica, complementadas pela recolha de testemunhos orais — memórias, experiências e narrativas associadas à vivência em edifícios públicos. 

Dessa abordagem resultaram dois conjuntos principais de dados: dados de oralidade: transcrições de entrevistas com membros das comunidades, que requerem cuidados éticos e legais, especialmente no que diz respeito à privacidade e à gestão de dados sensíveis; dados históricos tradicionais: documentação, registos e fontes que integram a base de dados do projeto. 

Estes dados estão organizados na plataforma digital Arquitetura Aqui, composta por um site e uma base. A infraestrutura foi concebida com base nos princípios do acesso aberto, permitindo a disponibilização pública da maior quantidade possível de dados, sem comprometer a sua integridade ou confidencialidade. 

A plataforma inclui mecanismos de controlo que asseguram a segurança dos dados partilhados. Desde o início, os projetos foram estruturados segundo os princípios da ciência cidadã, tanto na recolha como na disseminação da informação. O site permite que qualquer pessoa contribua com memórias, experiências e, idealmente, dados mais específicos, como datas ou referências locais. 

Apesar dos desafios associados ao envolvimento do público na vertente técnica da história, a recolha de testemunhos orais tem sido bem-sucedida. As equipas de investigação visitaram comunidades, realizaram entrevistas e, em alguns casos, receberam contributos posteriores que foram integrados na base de dados. Esta dinâmica tem enriquecido significativamente os resultados do projeto. 

Atualmente, decorre no Iscte o processo de integração dos dados no repositório institucional. Após o depósito inicial, os dados são validados e disponibilizados publicamente, reforçando o compromisso com o acesso aberto. Uma parte significativa da coleção externa do repositório é composta por dados produzidos no âmbito deste projeto.  

TRÊS LIÇÕES APRENDIDAS

Categorização de dados qualitativos

A forma de categorizar e sistematizar dados qualitativos, especialmente em áreas como a história, a antropologia ou outras disciplinas das ciências sociais e humanas, exigem que seja feita uma curva de aprendizagem acentuada.

As ferramentas digitais disponíveis para gestão de dados foram, em grande parte, concebidas com base em modelos quantitativos, orientadas para a organização de séries numéricas, medições laboratoriais ou dados estatísticos. Essa orientação limita a sua aplicabilidade direta a dados que emergem de processos interpretativos, como testemunhos orais, narrativas históricas ou leituras de arquivo.

Consequentemente, foi necessário adaptar essas ferramentas, criando categorias artificiais. Este processo exige não apenas criatividade metodológica, mas também uma reflexão crítica sobre os limites da categorização e sobre o risco de simplificação excessiva. A gestão eficaz destes dados requer soluções flexíveis, capazes de respeitar a complexidade e a natureza contextual da informação recolhida.

Consentimento informado em contextos de trabalho de campo

A aplicação prática dos protocolos éticos, nomeadamente no que diz respeito ao consentimento informado, enfrenta obstáculos específicos em contextos informais, rurais ou comunitários. Embora os princípios éticos que regem a investigação estejam bem definidos em documentos institucionais e normativos, a sua implementação no terreno nem sempre é linear. Em muitos casos, os participantes não estão familiarizados com os procedimentos formais de consentimento, ou os próprios contextos de interação não favorecem abordagens padronizadas. Na prática, é quase impossível iniciar uma conversa espontânea com membros de uma comunidade — por exemplo, numa aldeia isolada da serra — e começar por pedir que assinem um documento formal antes de partilharem memórias sobre a escola primária, o lavadouro ou o mercado local. Esse tipo de abordagem quebra a relação de confiança e afasta as pessoas. Mas a intenção é fazer história com as pessoas, não apenas sobre elas — uma história construída de baixo para cima, com base nas suas experiências e testemunhos.

Nestes cenários, torna-se necessário desenvolver estratégias adaptadas, que respeitem simultaneamente os princípios éticos e a realidade sociocultural dos participantes. Isso pode incluir o uso de consentimento verbal, a explicação informal dos objetivos da investigação, ou a negociação contínua da participação ao longo do processo. É essencial articular os procedimentos éticos e legais com a realidade prática da investigação de campo. Ainda assim, e apesar de se ter conseguido estabilizar esse processo, muitas conversas e contributos ficaram de fora por não se ter conseguido cumprir os requisitos formais a tempo. Para futuros projetos, será fundamental incluir no planeamento tempo e recursos dedicados à definição clara dos procedimentos éticos e à formação prática das equipas. 

Formação e tempo dedicado à gestão de dados

A gestão de dados de investigação, especialmente quando envolve informação sensível ou qualitativa, exige tempo, planeamento e capacitação técnica das equipas envolvidas. Trata-se de uma dimensão que deve ser considerada desde a fase inicial dos projetos, com alocação de recursos específicos e definição clara de responsabilidades. A ausência de formação adequada pode comprometer a qualidade da curadoria, a segurança da informação e a conformidade com as políticas institucionais e legais.

Além disso, a gestão de dados não se limita ao armazenamento ou organização técnica — envolve decisões metodológicas, éticas e comunicacionais que requerem competências especializadas. A formação contínua das equipas, aliada ao apoio institucional, é essencial para garantir que os dados recolhidos sejam tratados com o rigor necessário e possam ser reutilizados, partilhados e valorizados como parte integrante da produção científica. Mas, as ações de formação existentes são muitas vezes demasiado abstratas e genéricas. Seria muito útil que fossem mais concretas, ligadas às realidades específicas de cada disciplina, e que partissem dos problemas reais enfrentados no terreno.

TRÊS DESAFIOS FUTUROS

Clarificação dos limites dos dados pessoais na investigação histórica

A investigação histórica enfrenta uma lacuna significativa na definição e tratamento de dados pessoais, especialmente no que diz respeito a figuras públicas e documentos administrativos. A ausência de diretrizes claras sobre o estatuto jurídico e ético destes dados pode gerar entraves à investigação, dificultando o acesso, a reutilização e a publicação de fontes relevantes. Em muitos casos, documentos que são tecnicamente públicos — como atas, relatórios ou correspondência institucional — contêm informações que podem ser interpretadas como dados pessoais, o que levanta dúvidas sobre os limites da sua divulgação.

Este desafio exige uma abordagem equilibrada entre o direito à informação e a proteção da privacidade, com especial atenção ao contexto histórico, à função pública dos sujeitos envolvidos e à finalidade científica da investigação. A clarificação normativa e institucional destes limites é essencial para garantir segurança jurídica aos investigadores e para promover práticas éticas e transparentes na gestão de dados históricos.

Saber o que pode, ou não, ser incluído, como anonimizar dados, e como garantir a conformidade legal é um esforço adicional que exige tempo e atenção. 

Preservação digital a longo prazo

Embora os repositórios institucionais ofereçam garantias importantes em termos de preservação digital, subsistem incertezas quanto à sustentabilidade de plataformas próprias desenvolvidas por projetos de investigação. Estas plataformas, muitas vezes criadas com financiamento temporário, enfrentam riscos associados à obsolescência tecnológica, à descontinuidade de manutenção e à falta de integração com infraestruturas institucionais permanentes.

A longo prazo, a preservação dos dados depende da sua migração para sistemas estáveis, interoperáveis e reconhecidos institucionalmente. É fundamental que os projetos prevejam desde o início estratégias de preservação que incluam o depósito em repositórios certificados, a atribuição de identificadores persistentes e a adoção de formatos normalizados. A articulação entre plataformas próprias e repositórios institucionais deve ser pensada como uma complementaridade, garantindo simultaneamente inovação e sustentabilidade.

Reconhecimento académico da produção de dados em bruto

A produção de dados de investigação, especialmente qualitativos, continua a ser subvalorizada nos sistemas de avaliação científica. Apesar de constituírem uma componente essencial em projetos de ciência cidadã e em investigações que envolvem comunidades, os dados em bruto — como testemunhos orais, registos históricos ou documentação recolhida — são frequentemente vistos como auxiliares ou preparatórios, e não como resultados científicos em si.

Este enquadramento limita o reconhecimento do trabalho de recolha, curadoria e publicação de dados, que exige competências especializadas e contribui diretamente para o avanço do conhecimento. É necessário promover uma mudança cultural e institucional que valorize os dados como produtos científicos legítimos, com critérios próprios de qualidade, citabilidade e impacto. A atribuição de identificadores persistentes, o depósito em repositórios e a adoção de licenças claras são passos fundamentais nesse processo, mas devem ser acompanhados por políticas de avaliação que reconheçam a diversidade das práticas científicas.

CINCO QUESTÕES SOBRE GDI

Como define, implementa e avalia as práticas de gestão de dados de investigação?

A instituição implementa as suas práticas de gestão de dados com base numa Política de Gestão e Partilha de Dados de Investigação, em vigor desde 2023. Esta política estabelece as diretrizes para o armazenamento, partilha e citação de dados produzidos na comunidade científica da instituição. Todos os dados são acompanhados por identificadores persistentes e pela atribuição de licenças adequadas, garantindo a rastreabilidade, a transparência e o cumprimento das normas éticas e legais aplicáveis.

Para além desta política geral, cada projeto de investigação segue procedimentos específicos de gestão de dados, adequados à natureza e sensibilidade da informação recolhida. No caso particular dos projetos que envolvem dados pessoais — como registos de voz, impressões ou memórias —, são obtidos consentimentos informados dos participantes, assegurando o tratamento ético e responsável dos dados.

Os dados são armazenados numa base de dados própria, cujo nível de visibilidade e acesso é definido de acordo com o tipo de informação contida. Parte destes dados pode estar publicamente acessível, enquanto outros permanecem restritos para salvaguardar a privacidade e a confidencialidade dos participantes.

A avaliação das práticas de gestão de dados é realizada de forma contínua, assegurando a conformidade com a política institucional, com os requisitos dos financiadores e com as boas práticas internacionais de ciência aberta e gestão responsável de dados.

Quais os principais benefícios dessas práticas?

A adoção sistemática de práticas de gestão e partilha de dados científicos representa um avanço significativo na consolidação da ciência aberta. A associação de publicações a repositórios institucionais não só reforça a visibilidade dos dados gerados, como também facilita o seu acesso por parte da comunidade científica e da sociedade em geral. Esta integração contribui diretamente para a transparência dos processos de investigação e para a democratização do conhecimento.

Para além da acessibilidade, estas práticas promovem uma cultura de consciência e responsabilidade ética, alinhando os objetivos científicos com princípios fundamentais de integridade, reprodutibilidade e equidade. A gestão adequada dos dados permite garantir que os resultados são compreensíveis, verificáveis e reutilizáveis, fortalecendo a confiança nas evidências produzidas.

Outro benefício estrutural reside na preservação e fidelidade dos dados ao longo do tempo. A reabilitação de conjuntos de dados, a sua conservação em ambientes seguros e a manutenção da sua integridade são elementos essenciais para assegurar a continuidade da investigação e a valorização do trabalho científico.

Por fim, o impacto real destas práticas é visível na utilização efetiva dos dados por outros investigadores, na criação de novas abordagens e na ampliação do alcance dos projetos. A partilha ativa de dados transforma-se, assim, num motor de inovação, colaboração e reconhecimento institucional.

Em que medida a gestão de dados de investigação contribui para a otimização do processo de investigação?

A integração de práticas de gestão de dados desde as fases iniciais do projeto contribui de forma decisiva para a eficiência e solidez do processo científico. Quando o planeamento da investigação é concebido com base em princípios de acesso aberto, torna-se possível estruturar desde o início uma base de dados alinhada com os objetivos do projeto e com os requisitos de transparência e reprodutibilidade. Esta abordagem proativa evita retrabalho, assegura a coerência dos dados recolhidos e facilita a sua posterior validação e partilha.

As validações e integrações realizadas ao longo do percurso não alteraram a lógica do processo, mas reforçaram a sua robustez e a permanência dos dados em ambientes digitais sustentáveis. Estes mecanismos funcionam como camadas adicionais de fiabilidade, assegurando que os dados mantêm a sua integridade e relevância ao longo do tempo.

A atribuição de identificadores persistentes, como os DOI (Digital Object Identifiers), desempenha um papel fundamental neste contexto. Para além de garantirem a validação formal dos dados, permitem a sua citação adequada e a partilha em plataformas académicas reconhecidas, assegurando a rastreabilidade, a visibilidade e a longevidade dos resultados produzidos.

Que vantagens e condicionantes aponta na partilha de dados de investigação?

A implementação de práticas de gestão e partilha de dados traz vantagens significativas para a investigação científica. Entre os principais benefícios destaca-se o aumento da visibilidade dos dados produzidos, que potencia a sua reutilização por outros investigadores e projetos. Esta abertura contribui para o fortalecimento de uma cultura de colaboração, promovendo o intercâmbio de metodologias, fontes e resultados. Além disso, permite a complementaridade entre projetos com abordagens distintas, ampliando o impacto e a diversidade da produção científica.

No entanto, persistem condicionantes relevantes que limitam a adoção plena destas práticas, especialmente em áreas como a história. A resistência cultural à divulgação de fontes primárias continua a ser um obstáculo, refletindo preocupações com a autoria intelectual e a preservação de abordagens tradicionais. A falta de recursos, interesse ou autorização para partilhar documentos originais agrava esta limitação, dificultando a abertura dos dados em formatos acessíveis e reutilizáveis.

Adicionalmente, verifica-se uma inflexibilidade nas ferramentas institucionais, muitas vezes concebidas para dados quantitativos, o que dificulta a integração de dados qualitativos e interpretativos. Esta realidade evidencia a necessidade de uma perspetiva mais atualizada sobre as práticas em humanidades digitais, que reconheça a especificidade dos dados produzidos em contextos comunitários, históricos e multidisciplinares.

De que forma os diferentes atores envolvidos no processo de investigação estão comprometidos com a gestão de dados de investigação?

A consolidação de práticas eficazes de gestão e partilha de dados depende da atuação coordenada de diversos atores institucionais e científicos. Os investigadores desempenham um papel central, sendo os principais responsáveis pela definição metodológica e pela disponibilização dos dados. A sua visão sobre a abertura e reutilização dos materiais de investigação é determinante para o sucesso de qualquer iniciativa de ciência aberta.

A equipa de projeto, especialmente quando composta por investigadores com uma postura aberta e colaborativa, pode ser um motor de inovação. A predisposição para experimentar novas abordagens têm sido fatores decisivos na adoção de práticas mais transparentes e inclusivas.

As instituições, por sua vez, têm a responsabilidade de liderar esta transformação, criando condições estruturais e políticas que favoreçam a integração dos dados em ambientes académicos reconhecidos. Em contextos orientados para as ciências sociais, como o Iscte, essa liderança é particularmente relevante para garantir que os dados qualitativos e interpretativos sejam valorizados e corretamente enquadrados.

As bibliotecas assumem um papel técnico e estratégico, apoiando na categorização dos dados e na sua integração nos repositórios institucionais. Este apoio é essencial para garantir que os dados sejam organizados de forma adequada e acessível.

Por fim, a comunidade científica tem um papel crítico na validação e reconhecimento de abordagens alternativas, como aquelas que cruzam história com arquitetura e envolvem diretamente as comunidades locais. O reconhecimento da diversidade metodológica e da riqueza dos dados qualitativos é fundamental para ampliar os horizontes da ciência aberta e promover uma cultura de partilha mais inclusiva e representativa.

Como equilibrar o cumprimento dos princípios FAIR com a realidade de trabalho dos investigadores?
De que forma o apoio a DMP e a formação interna promovem uma cultura sustentável de gestão de dados?

Como pode a formação ajudar a clarificar a gestão de dados em contextos multidisciplinares?

DESCRIÇÃO

Desde 2013, foram desenvolvidas iniciativas na área da gestão de investigação, numa fase ainda inicial da adoção dos princípios FAIR. Uma das primeiras ações consistiu na avaliação de um protótipo de repositório de dados na Universidade do Porto, que, embora não tenha sido implementado, contribuiu para a consolidação de uma cultura de perceção sobre a importância da gestão de dados. Esta etapa envolveu entrevistas com investigadores e a análise de soluções tecnológicas, promovendo o diálogo entre práticas científicas e infraestruturas digitais.

Posteriormente, foi desenvolvido um projeto de investigação centrado na promoção da adoção de ferramentas de gestão de dados, com especial enfoque na criação de vocabulários que enriquecessem os metadados e permitissem uma caracterização mais detalhada das práticas dos investigadores. Paralelamente, têm sido orientados estudantes na área da gestão da informação, contribuindo para a formação de profissionais capacitados para os desafios da ciência aberta.

Desde 2021, o INESC TEC passou a integrar funções institucionais de apoio à publicação de dados científicos, com base num repositório desenvolvido internamente e gerido segundo critérios alinhados com os princípios FAIR. Esta gestão adota uma abordagem flexível, que reconhece as limitações e necessidades específicas dos investigadores. O apoio à publicação estende-se também a outros repositórios, através da criação de comunidades dedicadas a projetos específicos.

Uma componente central da atividade institucional reside no apoio à elaboração e revisão de Planos de Gestão de Dados (Data Management Plans – DMP), tanto em projetos em curso como em novas iniciativas. Este apoio inclui recomendações técnicas e boas práticas, permitindo que as equipas de investigação se concentrem na produção e análise dos dados, enquanto se assegura a conformidade com os requisitos institucionais e normativos.

Mais recentemente, foi implementada formação sistemática dirigida a investigadores, com o objetivo de reforçar a capacitação interna em gestão de dados e ciência aberta. Estas ações são desenvolvidas pelo serviço de apoio à gestão que, embora não dedicado exclusivamente à ciência aberta, integra competências diversas, incluindo apoio administrativo, gestão de repositórios e arquivos, e produção de indicadores institucionais.

TRÊS LIÇÕES APRENDIDAS

Integração precoce nos projetos

A participação ativa nas reuniões de arranque (kick-off meetings) dos projetos constitui uma oportunidade estratégica para garantir a integração eficaz dos Planos de Gestão de Dados (DMP) desde as fases iniciais. Ao apresentar de forma clara e estruturada os objetivos, requisitos e implicações práticas dos DMP, promove-se não apenas a compreensão partilhada entre os parceiros, mas também o seu envolvimento e compromisso com as boas práticas de gestão e partilha de dados ao longo do ciclo de vida do projeto. Esta abordagem antecipada facilita o alinhamento entre as equipas, previne mal-entendidos futuros e contribui para a consolidação de uma cultura colaborativa e transparente em torno da ciência aberta.

Envolvimento ativo dos investigadores principais (PI) e flexibilidade

A motivação e o compromisso dos PI são determinantes para o sucesso da implementação dos DMP. A flexibilidade é um conceito transversal à gestão de dados. Embora existam requisitos técnicos e normativos obrigatórios — como os princípios FAIR — é essencial adaptar os processos às realidades dos investigadores. A simplificação dos procedimentos e a mediação ativa no depósito de dados são estratégias que visam evitar que os investigadores se sintam sobrecarregados. No INESC TEC, o processo de depósito é mediado. Esta abordagem tem como objetivo não só garantir a qualidade dos dados, mas também fomentar a confiança e a recorrência dos investigadores ao serviço.

Clareza na comunicação

A apresentação direta e objetiva dos requisitos técnicos e das boas práticas facilita a compreensão e adesão por parte dos investigadores, promovendo uma cultura de colaboração e melhoria contínua.

Em contextos de investigação multidisciplinar, a definição pode variar significativamente. As ambiguidades exigem uma abordagem pedagógica e adaptada, que ajude os investigadores a compreender e aplicar corretamente os conceitos de organização e descrição de dados.

Por exemplo, a diversidade de interpretações sobre o que constitui um dataset — desde uma pasta zipada até ficheiros individuais — dificulta a contabilização e a criação de indicadores avançados, como a percentagem de datasets publicados face ao número de artigos científicos.

TRÊS DESAFIOS FUTUROS

Disseminação do serviço em termos institucionais

Um dos principais desafios prende-se com a dificuldade em garantir que todos os investigadores têm conhecimento sobre os serviços de apoio à gestão de dados. Numa instituição extensa e distribuída como o INESC TEC, com múltiplos centros e polos geográficos, é complexo assegurar uma comunicação eficaz e uma presença transversal. Muitos investigadores acabam por publicar dados por iniciativa própria, em resposta a exigências editoriais, sem recorrer ao serviço institucional. Esta prática, embora legítima, pode comprometer a qualidade dos depósitos e dificultar a uniformização das boas práticas.

Equilíbrio entre rigor e flexibilidade

A publicação de dados exige conformidade com critérios técnicos e normativos, mas também sensibilidade às realidades dos investigadores. Defende-se uma abordagem equilibrada que permita o cumprimento dos princípios FAIR sem comprometer a viabilidade da partilha de dados.

Integração dos serviços nas práticas dos investigadores

Nem todos os investigadores recorrem ao serviço de gestão de dados, muitas vezes por desconhecimento ou por exigências editoriais que surgem no momento da publicação. Este desafio reforça a necessidade de tornar o serviço mais visível e acessível, promovendo uma cultura de colaboração desde as fases iniciais dos projetos.

Garantir a implementação das boas práticas desde o início dos projetos — desde o momento em que os dados são gerados e armazenados — é fundamental para assegurar a qualidade e a conformidade com os princípios FAIR.

A formação dos investigadores é essencial, mas enfrenta desafios de disponibilidade e adesão. É necessário um esforço contínuo para chegar às pessoas e promover sessões de capacitação que reforcem o conhecimento técnico necessário para uma gestão de dados eficaz. A compreensão da importância dos metadados e do nível de detalhe exigido na descrição dos dados é um exemplo claro da necessidade de formação especializada e contextualizada.

CINCO QUESTÕES SOBRE GDI

Como define, implementa e avalia as práticas de gestão de dados de investigação?

No INESC TEC, a partir deste serviço que apoia os investigadores, todo o processo de depósito é mediado. É realizada uma recolha de metadados e complementada a informação, garantido – o mais possível – a qualidade e conformidade com os princípios FAIR.

Desde o início dos projetos, são realizadas reuniões de arranque onde se apresentam os requisitos dos Planos de Gestão de Dados (DMP). É partilhada uma ficha de recolha de informação que serve de base para a elaboração dos DMP, adaptados às práticas internas e orientados para os investigadores.

O serviço não se limita aos dados do INESC TEC, mas também apoia projetos em que a instituição é parceira. Muitas vezes, os dados são recolhidos por outras entidades e integrados em comunidades específicas criadas para cada projeto.

Foi implementado um curso interno certificado, com duas manhãs dedicadas à gestão de dados de investigação, dirigido sobretudo a estudantes de doutoramento, mas aberto a outros públicos. Estão previstas duas edições por ano.

A necessidade de escalar processos com recursos limitados levou à exploração de ferramentas de inteligência artificial. A Inteligência Artificial tem potencial  para automatizar tarefas como o preenchimento de templates de DMP e o versionamento de ficheiros, embora sejam reconhecidas limitações atuais e salientada a importância de uma integração ética e eficaz.

Em centros de investigação, há práticas informais de armazenamento de dados em servidores partilhados. A intervenção do serviço desde o início do ciclo de vida dos dados pode evitar duplicações e promover o versionamento adequado, facilitando a posterior publicação e reutilização.

Quais os principais benefícios dessas práticas?

Um dos principais benefícios identificados é a criação de templates orientadores que facilitam a compreensão e o preenchimento dos Planos de Gestão de Dados (DMP). Estes modelos não se limitam a reproduzir os formatos oficiais dos financiadores, mas são adaptados às práticas institucionais e à linguagem dos investigadores. Esta abordagem reduz o esforço exigido aos investigadores, evita respostas genéricas ou sem significado, promove uma descrição mais rica e útil dos dados e facilita a consulta posterior por colegas e parceiros.

A mediação não se limita ao apoio técnico, mas envolve uma recolha estruturada de informação e uma simplificação pragmática das exigências, tornando o processo mais acessível e eficaz.

Por outro lado, a prática de documentar datasets publicados nos DMP permite reconhecer e promover os contributos específicos de cada investigador. Esta valorização gera motivação e reforça o envolvimento dos investigadores no processo de gestão de dados, tendo até um efeito multiplicador que contribui para aumentar a adesão às práticas de partilha de dados, promover uma cultura de transparência e colaboração e estimular o sentido de pertença dos investigadores.

Em que medida a gestão de dados de investigação contribui para a otimização do processo de investigação?

Os DMP bem estruturados ajudam a clarificar com que dados se está a trabalhar, onde estão armazenados e como podem ser acedidos. Esta organização interna facilita a comunicação entre parceiros de projeto, a reutilização de dados já existentes e a criação de comunidades de prática em torno dos dados.

A partilha de dados não se limita à disponibilização técnica, mas envolve também a partilha de contexto — apresentações, bibliografia, documentação — que enriquece a compreensão e o uso dos datasets. Quando bem comunicadas, estas práticas são valorizadas pelos investigadores e contribuem para a eficiência e qualidade da investigação.

Que vantagens e condicionantes aponta na partilha de dados de investigação?

Apesar das vantagens evidentes da partilha de dados — como a transparência, reutilização e colaboração — existem condicionantes significativas, sobretudo em áreas como a bioengenharia e em projetos com empresas, onde há acordos de confidencialidade e dados sensíveis. Para mitigar essas limitações, podem ser adotadas estratégias como a disponibilização de metadados detalhados, a partilha de amostras representativas dos dados ou a criação de guias para pedidos de acesso, permitindo uma avaliação caso a caso.

Estas práticas procuram equilibrar a proteção da informação com a abertura científica, promovendo uma cultura de partilha responsável.

De que forma os diferentes atores envolvidos no processo de investigação estão comprometidos com a gestão de dados de investigação?

O envolvimento dos diversos atores — investigadores, responsáveis de projeto, serviços de apoio — está cada vez mais consolidado. Embora o desafio da escalabilidade persista, há uma maturidade crescente na forma como a gestão de dados é integrada nos projetos.

A mediação eficaz, a formação contínua e o reconhecimento dos contributos individuais são fatores que reforçam esse compromisso. O serviço atua como facilitador, promovendo práticas que são valorizadas tanto internamente como por parceiros e avaliadores externos.

Que impacto têm os tratamentos por radiofrequência e ambiente controlado na qualidade dos alimentos?
Que papel desempenham os metadados na rastreabilidade e integração de dados experimentais?
Quais são os benefícios de automatizar a recolha e integração de dados em tempo real?
De que forma a conformidade com os princípios FAIR facilita a colaboração entre instituições e a reutilização dos dados?

DESCRIÇÃO

O projeto VIIA Food investiga a qualidade, segurança e eficiência do processamento alimentar com tratamentos inovadores e sob condições ambientais controladas. 

O subprojeto de radiofrequência (RF) avalia os efeitos do aquecimento eletromagnético em matrizes alimentares (nomeadamente castanhas), com foco na retenção de nutrientes, inativação microbiana e alterações físico-químicas. O subprojeto das câmaras de ambiente controlado (CACs) estuda o impacto de regimes precisos de temperatura, humidade e luz no armazenamento e maturação de alimentos.

Os dados recolhidos incluem registos de sensores (temperatura, humidade, entre outros), análises da composição química, avaliações microbiológicas e métricas de qualidade. A gestão de dados abrange protocolos padronizados de aquisição, registo de metadados, integração de conjuntos de dados heterogéneos e conformidade com os princípios FAIR, garantindo a reprodutibilidade e a reutilização futura.

A colaboração interdisciplinar entre engenheiros alimentares, microbiologistas e cientistas de dados é essencial para uma interpretação fiável e uma análise abrangente.

TRÊS LIÇÕES APRENDIDAS

Padronização de dispositivos e protocolos

A padronização de dispositivos e protocolos é essencial para garantir a qualidade e a comparabilidade dos dados. Durante a implementação dos subprojetos de tratamentos por radiofrequência (RF) e câmaras de ambiente controlado (CACs), verificou-se que a diversidade de equipamentos e metodologias poderia comprometer a consistência dos resultados. A harmonização dos protocolos de aquisição, calibração e registo de dados revelou-se fundamental para assegurar que os dados recolhidos fossem comparáveis entre diferentes dispositivos e contextos experimentais. Esta padronização permitiu a realização de análises estatísticas robustas e válidas, minimizando variações indesejadas e aumentando a fiabilidade dos resultados. Além disso, facilitou a integração de dados entre subprojetos, promovendo uma abordagem mais coesa e interdisciplinar à investigação.

Captura de metadados como garantia de preservação

A captura abrangente e sistemática de metadados é indispensável para preservar a integridade da informação e garantir a rastreabilidade. A experiência demonstrou que a documentação detalhada de todos os parâmetros experimentais — incluindo dados de calibração, configurações dos sensores, condições ambientais e marcações temporais — é essencial para evitar perdas de informação e assegurar a reprodutibilidade dos resultados. A ausência de metadados completos pode dificultar a interpretação dos dados, comprometer a integração entre subprojetos e limitar a reutilização futura. Ao adotar modelos padronizados de metadados e assegurar o seu preenchimento sistemático, foi possível manter um registo claro e auditável de todas as etapas experimentais, facilitando a validação cruzada e o alinhamento entre equipas.

Planeamento antecipado como chave para o sucesso

O planeamento antecipado da gestão de dados é um fator determinante para o sucesso da colaboração interdisciplinar. A definição de planos de gestão de dados antes do início das atividades experimentais revelou-se uma prática estratégica que contribuiu significativamente para a eficiência do projeto. Este planeamento prévio permitiu estabelecer convenções claras de nomeação de ficheiros, definir estruturas de armazenamento e partilha, e antecipar necessidades específicas de integração entre áreas científicas distintas. Como resultado, foram reduzidos erros operacionais, evitadas duplicações de esforço e promovida uma comunicação mais fluida entre engenheiros alimentares, microbiologistas e cientistas de dados. 

TRÊS DESAFIOS FUTUROS

Integração de dados em tempo real 

A integração de dados em tempo real é essencial para a otimização da análise e a redução de esforço manual. A crescente complexidade dos sistemas de recolha de dados nos subprojetos de radiofrequência (RF) e câmaras de ambiente controlado (CACs) exige a implementação de pipelines automatizados que permitam a recolha, limpeza e integração em tempo real dos dados gerados pelos sensores. Esta abordagem visa eliminar etapas manuais suscetíveis a erros, acelerar o processamento e permitir uma análise mais ágil e responsiva. A automatização dos fluxos de dados facilita a deteção precoce de padrões, a adaptação dinâmica dos parâmetros experimentais e a tomada de decisões informadas durante o próprio processo de investigação. Para tal, será necessário desenvolver infraestruturas digitais robustas, capazes de lidar com dados de alta frequência e de integrar múltiplas fontes de forma eficiente e segura.

Armazenamento sustentável e acessibilidade prolongada de grandes volumes de dados experimentais 

Os dados recolhidos por sensores RF e CACs, especialmente em medições contínuas ou de alta resolução temporal, geram volumes significativos de informação que devem ser preservados de forma estruturada e acessível. A garantia de armazenamento a longo prazo implica não apenas a utilização de repositórios seguros e escaláveis, mas também a documentação rigorosa dos dados e metadados associados, assegurando a sua interpretabilidade futura. A adoção de estratégias de preservação digital, incluindo formatos duráveis, controlo de versões e políticas de backup, é essencial para que os dados permaneçam disponíveis para reanálise, validação ou reutilização em novos contextos científicos. Este desafio é particularmente relevante para projetos que visam contribuir para a ciência aberta e para a construção de bases de conhecimento partilhadas.

Melhoria da interoperabilidade e promoção da reutilização externa através da adoção de padrões comunitários 

Para que os dados gerados no âmbito do projeto VIIA Food possam ser reutilizados por investigadores externos e integrados em iniciativas colaborativas interinstitucionais, é fundamental alinhar os formatos de dados e os modelos de metadados com os padrões reconhecidos pela comunidade científica. A interoperabilidade não se limita à compatibilidade técnica entre sistemas, mas envolve também a clareza semântica dos dados, a adoção de vocabulários controlados e a conformidade com princípios como os FAIR. Este alinhamento facilita a partilha responsável, a integração em plataformas de dados abertas e a realização de análises secundárias que ampliem o impacto da investigação. A promoção da reutilização externa exige, portanto, um compromisso contínuo com a qualidade, a transparência e a normalização dos dados produzidos.

CINCO QUESTÕES SOBRE GDI

Como define, implementa e avalia as práticas de gestão de dados de investigação?

As práticas de gestão de dados de investigação são definidas através de protocolos abrangentes para medições RF e CACs, incluindo desenhos experimentais detalhados, procedimentos de calibração e modelos padronizados de metadados. A implementação envolve entrada estruturada de dados em folhas de cálculo, controlo de versões para dados brutos e processados, registo sistemático de calibrações e configurações de sensores, e validação cruzada regular entre subprojetos. Todos os conjuntos de dados, análises e código são armazenados em repositórios pessoais para garantir a preservação segura a longo prazo. A avaliação é realizada por meio de testes de reprodutibilidade, auditorias internas e monitorização contínua da conformidade com os princípios FAIR. Esta abordagem iterativa assegura a integridade, acessibilidade e usabilidade dos dados ao longo do ciclo de vida do projeto.

Quais os principais benefícios dessas práticas?

Estas práticas garantem dados de alta qualidade e consistência entre experiências e subprojetos, facilitando a reprodutibilidade e permitindo conclusões científicas robustas. Promovem a colaboração interdisciplinar ao tornar os conjuntos de dados, metadados e código facilmente compreensíveis e acessíveis a todos os membros da equipa. O armazenamento em repositórios assegura a disponibilidade a longo prazo, apoia iniciativas de ciência aberta e permite que investigadores externos acedam, verifiquem ou desenvolvam trabalhos com base nos dados existentes. Em última instância, estas práticas aumentam a transparência, o impacto da investigação e a possibilidade de reutilização futura dos dados recolhidos em novos estudos ou meta-análises.

Em que medida a gestão de dados de investigação contribui para a otimização do processo de investigação?

Uma gestão de dados de investigação eficaz facilita a integração de conjuntos de dados heterogéneos provenientes de múltiplos subprojetos, reduzindo redundâncias e minimizando erros. Dados estruturados, metadados completos e análises com controlo de versões aceleram a interpretação e a elaboração de relatórios, apoiando decisões rápidas e o desenho experimental adaptativo. Ao garantir que todos os dados, scripts de processamento e pipelines analíticos estão consistentemente documentados e armazenados em repositórios, os investigadores podem reproduzir resultados, resolver problemas e transferir conhecimento de forma eficiente entre equipas. Esta abordagem sistemática reduz o risco de perda de dados e melhora a eficiência global da investigação.

Que vantagens e condicionantes aponta na partilha de dados de investigação?

As vantagens da partilha de dados são significativas: permite a validação independente de resultados, fomenta a colaboração entre instituições e disciplinas, aumenta o impacto científico e está alinhada com os mandatos de ciência aberta de financiadores e editores. A partilha também promove a transparência e permite que outros investigadores reutilizem conjuntos de dados e ferramentas analíticas em novos contextos. 

As limitações incluem a natureza proprietária de alguns protocolos RF, o elevado volume e frequência dos dados dos sensores, e a necessidade de fornecer metadados completos e padronizados para garantir a interpretabilidade. No entanto, o armazenamento estruturado de dados, código e documentação em repositórios ajuda a mitigar estas limitações, oferecendo um enquadramento responsável para a partilha.

De que forma os diferentes atores envolvidos no processo de investigação estão comprometidos com a gestão de dados de investigação?

Investigadores juniores supervisionam o desenho experimental, asseguram a qualidade dos dados recolhidos, documentam o código e validam os metadados. Estudantes de doutoramento mantêm os registos de aquisição de dados, calibração e sensores, contribuindo também para a entrada de dados e o cumprimento das convenções de nomeação. A equipa garante que os dados são abertos, transparentes e reutilizáveis.

Como equilibrar o acesso aberto com a proteção de dados pessoais sensíveis na investigação científica?

Por que o exercício de proteção de dados é considerado valioso mesmo quando não há riscos evidentes?

Que fatores contribuem para a subvalorização dos riscos na partilha de dados por investigadores/as?

Como uma licença “Para o Bem Maior” poderia transformar a reutilização de dados científicos?

DESCRIÇÃO

No contexto da Universidade da Beira Interior (UBI), é destacado o projeto C4MSSData@UBI – Centro para a Gestão e Partilha Segura de Dados de Investigação, como uma iniciativa recente que tem contribuído significativamente para a consolidação das práticas de gestão de dados de investigação. 

Contudo, a evolução destas práticas na UBI resulta também de um percurso institucional sustentado ao longo dos últimos anos, com especial incidência nas áreas da ética e da proteção de dados, no âmbito do qual são identificáveis três boas práticas:

Requisitos Éticos para Divulgação de Projetos
Desde há mais de oito anos, encontra-se instituída na UBI a obrigatoriedade de obtenção de parecer da Comissão de Ética para a divulgação de pedidos de participação em projetos de investigação. Esta medida antecipa e acompanha práticas atualmente adotadas por diversas instituições de ensino superior e investigação, reforçando o compromisso com a integridade científica e a proteção dos participantes.

Articulação entre Ética e Proteção de Dados
Verifica-se uma articulação eficaz entre a Comissão de Ética e o Gabinete de Cibersegurança e Proteção de Dados. Esta colaboração traduz-se, por exemplo, na exigência de Avaliações de Impacto sobre a Proteção de Dados (AIPD) para determinados pedidos de parecer e projetos submetidos à Comissão de Ética. Em sentido inverso, o Encarregado da Proteção de Dados pode solicitar pareceres éticos para projetos que lhe são apresentados, promovendo uma abordagem integrada e coerente entre os domínios da ética e da proteção de dados.

Automatização Parcial no Processamento de AIPD
O processo de tramitação das declarações de AIPD inclui uma fase inicial semi-automatizada. As respostas inseridas num questionário digital são transformadas automaticamente em documentos nos formatos DOCX e PDF, os quais são enviados para o/a proponente e para o Encarregado da Proteção de Dados. Este procedimento visa facilitar a revisão, melhoria e eventual emissão de parecer, promovendo eficiência e rastreabilidade documental.

TRÊS LIÇÕES APRENDIDAS

A experiência acumulada na interseção entre acesso aberto, partilha de dados e proteção de dados tem revelado um conjunto de aprendizagens relevantes para a prática científica e para a definição de políticas institucionais. Destacam-se, em particular, três lições fundamentais:

Tensão entre Acesso Aberto e Proteção de Dados
A conciliação entre os princípios do acesso aberto, a promoção da partilha de dados e o cumprimento das exigências legais e éticas da proteção de dados revela-se complexa e, por vezes, contraditória. A coexistência destes objetivos exige um equilíbrio delicado, frequentemente difícil de alcançar, sobretudo em contextos que envolvem dados pessoais sensíveis.

Valor Intrínseco do Exercício de Proteção de Dados
Independentemente da necessidade efetiva de anonimização ou de outras medidas de mitigação, o exercício de análise e reflexão sobre a proteção de dados constitui, por si só, uma prática valiosa. Este processo funciona como mecanismo de consciencialização e permite, em muitos casos, identificar vulnerabilidades ou riscos que, de outro modo, poderiam passar despercebidos. Assim, a proteção de dados assume também um papel preventivo e educativo no ciclo de vida da investigação.

Perceções Limitadas sobre Riscos na Investigação Científica
A investigação científica, sendo geralmente orientada por motivações altruístas e de benefício coletivo, tende a desvalorizar os riscos associados à recolha, tratamento e partilha de dados. É comum que investigadores/as, focados/as na prossecução de um bem maior — como a cura de uma doença —, não compreendam as restrições ao acesso imediato a dados pessoais, nem antecipem os potenciais impactos negativos da sua partilha. Parte desta perceção resulta da suposição de que todos os intervenientes partilham os mesmos objetivos éticos. A inexistência de mecanismos legais que permitam condicionar a reutilização de dados exclusivamente a fins de interesse público — como seria o caso de uma hipotética licença “Para o Bem Maior” (PBM) — constitui uma lacuna sentida neste domínio.

TRÊS DESAFIOS FUTUROS

A evolução tecnológica e o crescimento exponencial da produção científica têm trazido novos desafios à gestão de dados de investigação. Destacam-se, neste contexto, três áreas críticas que exigem atenção e desenvolvimento de boas práticas:

Escalabilidade e Eficiência na Gestão de Grandes Conjuntos de Dados
O aumento significativo do volume de dados digitais, potenciado por avanços tecnológicos, tem permitido a construção de conjuntos de dados mais abrangentes e representativos, com benefícios evidentes para a robustez das conclusões científicas. No entanto, este crescimento acarreta desafios técnicos e logísticos, nomeadamente no que respeita ao armazenamento, ao acesso e à transmissão segura e eficiente desses dados.


Consciencialização Ética e Segurança na Era da Digitalização
A digitalização generalizada tem facilitado o acesso a dados, mas também pode ter contribuído para a diluição de certos mecanismos de controlo ético e de senso comum. Torna-se, por isso, essencial reforçar a consciencialização sobre os princípios éticos associados ao acesso, recolha, tratamento e partilha de dados, bem como sobre os requisitos de segurança que devem acompanhar todas as fases do seu ciclo de vida.


Autenticidade e Integridade dos Dados em Contextos de Inteligência Artificial
A crescente valorização da citação de dados como métrica de impacto pode incentivar, em alguns casos, a criação e disseminação de conjuntos de dados fictícios ou pouco rigorosos. Este fenómeno, já observado na publicação científica, tende a intensificar-se com o uso de inteligência artificial generativa. Embora tal risco seja mitigado em ambientes institucionais com práticas consolidadas e confiança nos investigadores, representa um desafio relevante para projetos que recorrem a dados disponíveis publicamente na Internet, exigindo mecanismos de verificação e validação mais robustos.

CINCO QUESTÕES SOBRE GDI

Como define, implementa e avalia as práticas de gestão de dados de investigação?

A definição e implementação das práticas de gestão de dados de investigação têm ocorrido de forma gradual e adaptativa, refletindo o dinamismo e a complexidade crescente deste domínio. Em muitos casos, as ações desenvolvidas são pontuais ou reativas, surgindo em resposta a situações específicas ou como alinhamento com orientações externas. A maioria dos documentos institucionais que regulam estas práticas são classificados como “documentos de trabalho” ou “em atualização”, assumindo a necessidade de revisão contínua.
Apesar da existência de esforços para estabelecer normas estáveis e duradouras, verifica-se que a adoção de metodologias ágeis e iterativas pode ser mais eficaz na atualidade, mesmo que introduza alguma instabilidade inicial. A gestão de dados de investigação beneficia particularmente desta abordagem, permitindo maior flexibilidade e adaptação às exigências emergentes.

Quais os principais benefícios dessas práticas?

A implementação sistemática de práticas de gestão de dados de investigação contribui para aumentar a confiança no ecossistema científico.  A interação entre investigadores/as e entidades institucionais (orientadores, comissões de ética, gabinetes de proteção de dados) promove uma reflexão aprofundada sobre os projetos desde as suas fases iniciais.
Por outro lado, permite uma melhor estruturação dos projetos, dado que as práticas de gestão induzem maior organização e planeamento, favorecendo a qualidade e a rastreabilidade dos processos científicos.
E possibilita ainda consciencialização sobre boas práticas, uma vez que a gestão de dados estimula a adoção de medidas associadas à proteção de dados, à documentação e à reutilização responsável.

Em que medida a gestão de dados de investigação contribui para a otimização do processo de investigação?

A gestão de dados de investigação otimiza o processo científico em diferentes fases:

Para quem utiliza os dados: Dados bem geridos estão prontos a usar, com mínima necessidade de transformação.

Para quem prepara os dados: Embora as tarefas de enriquecimento e organização possam parecer exigentes inicialmente, revelam-se vantajosas na fase de experimentação e reutilização, reduzindo retrabalho e aumentando a eficiência.

Que vantagens e condicionantes aponta na partilha de dados de investigação?

A partilha de dados de investigação apresenta benefícios e desafios:

Vantagens

Avanço científico: Contribui para o progresso da ciência e para o benefício da sociedade.

Reutilização e atribuição: Potencia o trabalho de quem produz os dados, promovendo a sua citação e valorização.

Condicionantes

Riscos de uso indevido: Possibilidade de utilização maliciosa dos dados, como personificação ou exploração indevida.

Resultados prejudiciais: Investigação baseada em dados partilhados pode, em casos extremos, gerar impactos negativos.

De que forma os diferentes atores envolvidos no processo de investigação estão comprometidos com a gestão de dados de investigação?

A comunidade científica da UBI demonstra crescente envolvimento com a gestão de dados de investigação. Embora o grau de compromisso varie entre atores, observa-se uma preocupação transversal com a melhoria contínua das práticas. Os órgãos de gestão institucional estão investidos na promoção de políticas e infraestruturas que sustentem este compromisso.

O Consórcio Re.Data lança uma nova ação dirigida a líderes e gestores de topo das Instituições de Ensino Superior (IES), com o objetivo de promover a adoção de estratégias institucionais de Ciência Aberta e Gestão de Dados de Investigação.

Este programa é promovido pelo Consórcio Re.Data e destina-se a membros do Grupo Nacional de Interesse em Políticas e Estratégias de Ciência Aberta, aos Centros de Competências Re.Data, bem como a líderes e decisores institucionais, profissionais com responsabilidades de direção e gestão de serviços, e outros profissionais de apoio à direção.

O programa de liderança realiza-se em formato híbrido e inclui três momentos principais:

  • 13 de novembro (online, 14h-15h30) – Sessão de Abertura: introdução ao quadro conceptual de liderança institucional em Ciência Aberta e Gestão de Dados de Investigação.
  • 20 de novembro (online, 14h-15h30) – Sessão de Mentoria: apresentação de estudos de caso europeus e promoção da troca de experiências entre participantes e especialistas.
  • 27 de novembro – Sessão presencial no Instituto Politécnico de Bragança, 14h-15h30 para consolidação das aprendizagens e definição de ações institucionais, com momentos de trabalho colaborativo.

A participação é gratuita, mediante candidatura através do formulário disponível aqui: [Formulário de candidatura]

Serão selecionados 20 participantes de todo o país, com base na motivação, experiência profissional e envolvimento com o projeto Re.Data. Em caso de empate, serão considerados critérios adicionais como distribuição geográfica e equilíbrio de género.

O período de candidaturas decorre entre 27 de outubro e 6 de novembro. Os candidatos selecionados serão notificados a 7 de novembro, data em que será também publicado o programa final.

Este programa pretende reforçar o compromisso institucional com práticas científicas abertas e estruturadas, contribuindo para um ecossistema de investigação mais transparente, colaborativo e acessível.

 

No dia 16 de outubro, o Iscte – Instituto Universitário de Lisboa acolheu o Workshop “Questões Jurídicas, Proteção de Dados e Licenças”, uma iniciativa integrada no Programa Nacional de Formação do projeto Re.Data. Esta ação de formação teve como objetivo apoiar a comunidade científica no domínio das questões legais e éticas relacionadas com a gestão de dados de investigação, reforçando o compromisso com os princípios FAIR e a Ciência Aberta.

O evento contou com a apresentação e teste do Toolkit sobre Questões Jurídicas, Proteção de Dados e Licenças (disponibilizado publicamente em breve), reunindo 56 participantes entre os quais 15 especialistas convidados em proteção de dados e ética na investigação. Estes especialistas contribuíram com sugestões de melhoria ao Toolkit e participaram ativamente nas sessões práticas, que visaram fomentar a discussão e a troca de experiências entre profissionais da área e investigadores.

Ao longo das sessões práticas, os participantes foram desafiados a trabalhar em pequenos grupos, analisando cenários reais de investigação e explorando formas de aplicar o Toolkit na resolução de questões jurídicas e de proteção de dados no contexto científico. As atividades promoveram um ambiente colaborativo, estimulando a troca de experiências e o debate entre profissionais e investigadores.

Esta ação permitiu aos participantes compreender os riscos associados à gestão de dados, identificar soluções práticas para o cumprimento de normas jurídicas e refletir criticamente sobre os desafios da proteção e partilha de dados.

O workshop integra o plano de capacitação do Re.Data para 2025, reforçando a aposta do consórcio na profissionalização das práticas de Gestão de Dados de Investigação (GDI).

Veja a reportagem fotográfica do evento em:

https://www.flickr.com/photos/iscteiul/albums/72177720329724431/

 

No dia 17 de outubro, a Faculdade de Ciências Sociais e Humanas da Universidade NOVA de Lisboa (NOVA FCSH) acolheu o Workshop “Como Publicar os Dados da Sua Investigação e Tornar os Dados FAIR”, promovido pelo projeto Re.Data.  

Esta ação foi especialmente dirigida à comunidade das ciências sociais e humanas, tendo como objetivo capacitar investigadores e profissionais de apoio à investigação para publicar dados de forma responsável, transparente e alinhada com os princípios FAIR (Findable, Accessible, Interoperable, Reusable).

Com a duração de 3 horas e meia, o workshop combinou uma forte componente teórica e prática, permitindo aos participantes explorar o processo de publicação de dados desde a preparação até à disseminação pública, com foco na documentação, licenciamento, escolha de repositórios e avaliação da FAIRness dos conjuntos de dados. A sessão foi conduzida por Cátia Laranjeira, Bruno Direito, Inês Carvalho, Paula Moura e André Vieira, investigadores e formadores com experiência em gestão de dados e boas práticas científicas. Esta sessão contou com a especial participação e partilha de boas práticas na publicação de dados do professor Hervé Baudry.

Durante a manhã, os participantes foram desafiados a refletir sobre que dados devem ser publicados, como organizá-los e documentá-los de forma adequada. Seguiram-se exercícios práticos de avaliação de datasets reais, incluindo o uso de ferramentas como o F-UJI, e atividades centradas em ficheiros README, metadados e formatos recomendados. A formação terminou com a dinâmica “O meu compromisso com a publicação dos meus dados FAIR”, onde cada participante registou as suas metas pessoais de aplicação das boas práticas aprendidas.

Os materiais pedagógicos e recursos utilizados nesta sessão – incluindo guias, slides e exemplos de datasets – foram disponibilizados em acesso aberto sob licença Creative Commons CC-BY, reforçando o compromisso do Re.Data com a partilha e reutilização de conhecimento científico.

Este workshop integra o Programa Nacional de Formação em Ciência Aberta e Gestão de Dados de Investigação promovido pelo Re.Data, que visa promover competências em Gestão de Dados de Investigação (GDI) e Ciência Aberta, contribuindo para a melhoria da qualidade, reprodutibilidade e impacto dos resultados científicos em Portugal.