O projeto Re.Data consolida a rede nacional de competências em gestão de dados de investigação com o sucesso das sessões finais de dois programas estratégicos, no Instituto Politécnico de Bragança.​

A sessão presencial do Bootcamp de Formação de Data Stewards (26 novembro), após os módulos online, equipou gestores de repositórios, curadores, bibliotecários e investigadores com ferramentas práticas para o ciclo de vida dos dados, alinhadas aos princípios FAIR e Ciência Aberta.​

O Workshop de Formação de Instrutores de Data Stewards (25-26 novembro) capacitou formadores para replicar estas competências em instituições, ampliando a Rede Portuguesa de Data Stewards.​

Estas ações, integradas no programa de especialização profissional e no programa formação de formadores do Re.Data, posicionam Portugal na vanguarda da profissionalização de data stewards, fomentando repositórios digitais robustos e colaboração sustentável.


O Re.Data disponibiliza uma sessão expositiva acessível online, a decorrer no período da manhã, em simultâneo com o workshop presencial, sobre a utilização de cadernos de laboratório eletrónicos e documentação de dados, permitindo que interessados que não consigam assistir ao workshop completo em formato presencial, possam acompanhar a parte expositiva remotamente.

A sessão presencial, que decorre ao longo de todo o dia, oferece uma experiência mais completa, incluindo atividades práticas, casos de estudo e interação direta com formadores. Por sua vez, a sessão online disponibiliza acesso aos conteúdos expositivos, para garantir maior acessibilidade e flexibilidade, sem requisitos prévios de conhecimento, dirigida a data stewards, investigadores, técnicos e profissionais de apoio à investigação.

Esta iniciativa reforça o compromisso do Re.Data em promover a capacitação especializada, permitindo a ampliação do alcance formativo e o desenvolvimento de competências essenciais para a gestão e documentação de dados científicos, com ênfase nas boas práticas que o software eLabFTW possibilita.

Para mais informações: https://redata.pt/cursos/workshop-utilizacao-de-cadernos-de-laboratorio-eletronicos-e-documentacao-de-dados-2a-ed/

Formulário de inscrição na sessão presencial  (10h00-17h00): [LINK]

Formulário de inscrição na sessão online (10h00-13h00): [LINK]

Entre os dias 9 e 11 de dezembro de 2025, irá decorrer online mais um ciclo de Re.Data Lunch Webinars, dedicado ao tema da proteção de dados em projetos de investigação científica. Esta iniciativa realiza-se das 12h00 às 13h00, procurando sensibilizar a comunidade académica para os principais desafios legais, éticos e tecnológicos na gestão de dados pessoais em contexto científico.​​



9 de dezembro: Apresentação do Toolkit sobre Questões Jurídicas, Proteção de Dados e Licenças
Orador:
Gabriel Cipriano (Iscte); Moderação: Anabela Duarte (UMinho)
Sessão dedicada ao lançamento do novo Toolkit de questões jurídicas, proteção de dados e licenças, destinada a investigadores e profissionais interessados na vertente legal da gestão de dados.
Inscrição: https://videoconf-colibri.zoom.us/webinar/register/WN_LKn2juUcRuGgz4ynThPhsw

10 de dezembro: Gestão de dados na era da IA generativa
Orador: António Lopes (Iscte); Moderação: Clara Boavida (Iscte)
Discussão centrada nos desafios do tratamento de dados com recurso a inteligência artificial, abordando soluções para a equidade e segurança da informação.
Inscrição: https://videoconf-colibri.zoom.us/webinar/register/WN_8qDQessnS3CHoafEwGlERg

11 de dezembro: Amnesia Anonymization Tool
Orador: Manolis Terrovitis (Athena RC / OpenAIRE); Moderação: Paula Moura (UMinho)
Apresentação prática sobre anonimização de dados científicos através da ferramenta Amnesia, para investigadores que lidam com big data e privacidade.
Inscrição: https://videoconf-colibri.zoom.us/webinar/register/WN_10TWyHaFRyqCDOGdEJPe9g

Ao longo destas sessões, os participantes são convidados a partilhar experiências, dúvidas e soluções para uma gestão responsável e transparente dos dados de investigação. Cada webinar inclui momentos de debate aberto e acesso a recursos formativos, com disponibilização dos materiais e gravações através do site www..redata.pt e canal YouTube do Re.Data.​

Para participar, basta inscrever-se em cada sessão.

O workshop “Boas práticas de gestão de dados no ciclo de investigação (2.ª edição)”, originalmente programado para ser presencial na Universidade do Minho, terá agora lugar no formato online, no dia 11 de dezembro, devido à greve que irá ocorrer na função pública nesse mesmo dia. Esta adaptação visa assegurar que todos os participantes tenham acesso à formação, independentemente dos impactos logísticos da greve. O projeto Re.Data mantém o seu compromisso com a formação e o desenvolvimento de competências na área de gestão de dados de investigação e, por esse motivo, concentrou esforços para garantir que os inscritos não percam esta oportunidade. A realização do workshop em formato online permite manter a programação, a participação ativa dos formandos e o acesso a todos os conteúdos planeados, demonstrando a prioridade dada à continuidade da capacitação e ao acesso equitativo à aprendizagem, mesmo perante imprevistos. Todos os inscritos receberão antecipadamente as instruções para acesso à sessão online, bem como os materiais necessários para a sua plena participação.


O workshop “Integridade e Ética na Gestão e Partilha de Dados de Investigação” realizou‑se a 18 de novembro de 2025, no IHMT – Instituto de Higiene e Medicina Tropical, em formato híbrido, integrando o programa de capacitação de investigadores do Re.Data. A ação teve como objetivo sensibilizar para a incorporação de um racional ético e responsável na gestão e partilha de dados ao longo de todo o ciclo de vida dos dados de investigação, reforçando a importância da integridade científica e da conduta responsável na definição de procedimentos de planeamento, recolha, armazenamento, partilha, reutilização e eliminação de dados.

Dirigido a investigadores, estudantes de doutoramento, gestores de dados, gestores de ciência e bibliotecários em fase inicial de contacto com estas temáticas, o curso teve a duração de três horas, com uma primeira parte expositiva em formato híbrido e uma segunda parte prática, presencial, dedicada ao trabalho em pequenos grupos. Foram abordados conceitos de ética e integridade na investigação, princípios éticos aplicados à gestão de dados, enquadramento legal e institucional, proteção de dados pessoais, minimização, consentimento informado, anonimização e pseudonimização, bem como questões de governação de dados, políticas de GDI e definição de termos de uso e licenciamento na disseminação de dados.

Na componente prática, os participantes analisaram e discutiram casos e dilemas éticos relacionados com privacidade e verificação da integridade dos dados, titularidade e reutilização de bases de dados, cumprimento de prazos de destruição e comunicação com participantes, bem como desafios de equidade e literacia nos estudos, exercitando a aplicação de princípios éticos e de integridade na tomada de decisão. No final, os participantes ficaram mais capacitados para identificar riscos e oportunidades na gestão ética dos dados, reconhecer boas práticas de documentação, armazenamento, partilha e eliminação, e recorrer a planos de gestão de dados, códigos de conduta e orientações especializadas como instrumentos de suporte à integridade na investigação

Realizou-se na Universidade de Coimbra, no dia 11 de novembro, o workshopComo publicar os dados da sua investigação e tornar os dados FAIR”, iniciativa da rede Re.Data dedicada à capacitação de profissionais na gestão e publicação de dados científicos. O evento foi desenhado para combinar momentos teóricos e práticos, criando uma experiência formativa intensiva com o objetivo de fortalecer competências técnicas e promover o alinhamento dos projetos de investigação com os princípios FAIR.​​

Ao longo de 3,5 horas de formação presencial, os participantes mergulharam em temáticas essenciais como a distinção entre dados abertos e dados FAIR, os formatos recomendados para arquivo, a relevância dos metadados, licenciamento e seleção de repositórios adequados para publicação. A componente prática, parte central do workshop, incluiu o diagnóstico e avaliação de datasets reais, exercícios de elaboração de ficheiros readme e aplicação de ferramentas para verificar a compatibilidade FAIR dos dados produzidos em investigação.​​

As atividades promoveram o debate e a partilha de estratégias para superar desafios da publicação e disseminação de dados, com exemplos interdisciplinares apresentados por especialistas convidados. Foram dinamizados exercícios em grupo, permitindo aos participantes confrontar as suas práticas com as recomendações internacionais e identificar melhorias concretas na documentação e reuso dos dados.​​

Este workshop revelou-se, à semelhança do que tem acontecido com as ações de formação Re.Data, um espaço colaborativo para a experimentação e para o desenvolvimento de soluções que potenciem o impacto dos dados abertos no ecossistema científico nacional, reforçando a missão Re.Data de promover a adoção de boas práticas e a cultura da ciência aberta.

Realizou-se no dia 24 de outubro de 2025, no Instituto Politécnico de Bragança (IPB), o Workshop “Como publicar os dados da sua investigação e tornar os dados FAIR – Engenharia e Tecnologia”, promovido pelo projeto Re.Data em colaboração com o Instituto Politécnico de Bragança.

O evento registou mais de 50 inscrições, incluindo investigadores, estudantes de doutoramento, docentes e profissionais de apoio à investigação oriundos de cerca de dez instituições nacionais, destacando o interesse crescente pela adoção de boas práticas de gestão e publicação de dados científicos.

Destacaram-se as atividades práticas organizadas em grupos, que permitiram uma troca de experiências focada em três eixos: avaliação de documentação de dados, aplicação dos princípios FAIR e exercícios práticos sobre licenciamento e utilização de repositórios confiáveis. Estes momentos potenciaram o compromisso dos formandos com a publicação FAIR e a reflexão crítica sobre o percurso dos dados desde a recolha até à publicação.

A avaliação do workshop espelhou a grande pertinência e utilidade junto dos participantes, que salientaram a relevância dos conteúdos para potenciar a qualidade dos dados partilhados e aumentar a transparência e reprodutibilidade da investigação nacional. Os participantes sublinharam o contributo da ação para melhorar competências em gestão, abertura e preparação dos dados para reuso, reforçando a necessidade de mais iniciativas formativas práticas nesta área.

Qual o impacto de boas práticas de gestão de dados na educação ambiental?

Porque é necessário o planeamento desde o início do processo de investigação?

Quais são os maiores desafios para garantir a sustentabilidade e interoperabilidade dos dados a longo prazo? 

DESCRIÇÃO

O CIIMAR Watch é um programa institucional de monitorização marinha e ambiental da costa norte de Portugal, desenvolvido pelo Centro de Investigação Marinha e Ambiental (CIIMAR). 

A iniciativa integra esforços anteriores de monitorização realizados por diferentes grupos de investigação, promovendo uma abordagem colaborativa e interdisciplinar. O programa abrange observatórios no Porto e Viana do Castelo, monitorizando ecossistemas costeiros e estuarinos, incluindo os rios Douro e Lima. Os dados recolhidos são de natureza química, física e biológica, com o objetivo de gerar conhecimento científico robusto, apoiar decisões políticas e promover sensibilização pública e educação ambiental.

O programa tem como principais objetivos estabelecer linhas de base científicas, acompanhar a dinâmica ambiental em ecossistemas costeiros e estuarinos e fornecer dados contínuos, de longo prazo, gratuitos e de acesso livre a cientistas, comunidades locais e decisores. A sua abordagem é interdisciplinar, combinando competências de investigadores em oceanografia física, climatologia, química ambiental, deteção remota, toxicologia ambiental, ecologia microbiana, ecologia bentónica e pelágica, ecologia de mamíferos marinhos e biodiversidade. Esta perspetiva holística permite uma visão abrangente de uma região marcada por processos complexos e em constante transformação.

O impacto esperado do programa traduz-se na melhoria da compreensão dos ambientes marinhos, no apoio a políticas públicas de conservação e gestão ambiental e na promoção da ciência aberta, assegurando que os dados recolhidos sejam disponibilizados de forma contínua e acessível à comunidade científica e à sociedade em geral.

TRÊS LIÇÕES APRENDIDAS

Valor da colaboração interdisciplinar

A experiência demonstrou que a integração de diferentes áreas científicas — incluindo biologia, química, oceanografia e monitorização de cetáceos — constitui um fator determinante para a robustez e abrangência dos resultados obtidos. A colaboração interdisciplinar permite que variáveis distintas sejam analisadas em conjunto, oferecendo uma visão holística dos ecossistemas e aumentando a capacidade de resposta a questões ambientais complexas. Ao reunir especialistas com formações diversas, promove-se não apenas a complementaridade de competências, mas também a criação de sinergias que potenciam a inovação científica e a produção de conhecimento mais sólido. Esta abordagem integrada contribui para que os resultados não se limitem a perspetivas isoladas, mas reflitam a complexidade real dos sistemas naturais, tornando-os mais relevantes para a comunidade científica, para os decisores políticos e para a sociedade em geral.

Importância da estandardização de protocolos

A harmonização metodológica foi reconhecida como uma componente essencial para assegurar a transparência e a credibilidade da investigação.

Este processo de estandardização, está a ser adaptado ao contexto do CIIMAR WATCH, garantindo que os dados recolhidos sejam comparáveis entre diferentes equipas e interoperáveis em cenários nacionais e internacionais.

Planeamento estratégico da gestão de dados desde o início

A definição de planos de gestão de dados estruturados desde a fase inicial dos projetos foi reconhecida a nível institucional como essencial para garantir a credibilidade científica e a sustentabilidade da informação a longo prazo, implicando a integração de uma pessoa dedicada a este processo. Um planeamento estratégico desde o início permite antecipar necessidades, identificar potenciais desafios e estabelecer mecanismos claros para a recolha, armazenamento, documentação, preservação e disponibilização dos dados.

TRÊS DESAFIOS FUTUROS

Garantia da qualidade e interoperabilidade de dados históricos

A integração de séries temporais anteriores constitui um dos maiores desafios na gestão de dados ambientais e científicos. A recolha de dados realizada em diferentes períodos, por distintos grupos de investigação e com metodologias diversas, exige um esforço significativo de harmonização. É necessário superar discrepâncias nos métodos de amostragem, nos instrumentos utilizados e nos formatos de registo, assegurando consistência e comparabilidade. A qualidade dos dados históricos deve ser cuidadosamente verificada, de modo a garantir que possam ser integrados em bases de dados atuais sem comprometer a fiabilidade das análises. A interoperabilidade, por sua vez, implica que estes dados sejam estruturados e documentados de forma a permitir a sua reutilização em contextos nacionais e internacionais, reforçando o valor científico das séries temporais e ampliando o seu impacto na investigação e na tomada de decisão.

Sustentabilidade a longo prazo

A continuidade e fiabilidade dos dados dependem da existência de recursos técnicos, humanos e financeiros estáveis. A sustentabilidade a longo prazo exige não apenas financiamento adequado, mas também a criação de estruturas organizacionais que assegurem a manutenção das plataformas de recolha, armazenamento e disponibilização de dados. A formação contínua de profissionais especializados, como data stewards e técnicos de monitorização, é igualmente essencial para garantir que as práticas de gestão de dados evoluam em consonância com os avanços tecnológicos e científicos. Além disso, a sustentabilidade implica a definição de estratégias institucionais que assegurem a preservação da informação ao longo do tempo, evitando perdas e assegurando que os dados permaneçam acessíveis e utilizáveis para futuras gerações de investigadores e decisores.

Implementação de sistemas avançados de disponibilização

O desenvolvimento de plataformas tecnológicas que permitam o acesso em tempo real a dados ambientais representa um desafio tanto tecnológico como organizacional. A criação de sistemas geográficos interativos, capazes de disponibilizar mapas, séries temporais e indicadores atualizados, exige investimentos em infraestrutura digital, interoperabilidade de sistemas e segurança da informação. Estes sistemas devem ser concebidos para servir múltiplos públicos: investigadores, decisores políticos, gestores ambientais e cidadãos interessados. A disponibilização avançada de dados não só aumenta a transparência e a credibilidade da investigação, como também promove a ciência aberta e o envolvimento da sociedade na conservação ambiental. Contudo, a implementação destes sistemas requer coordenação institucional, definição clara de responsabilidades e integração de diferentes competências técnicas, assegurando que a informação seja não apenas acessível, mas também compreensível e útil para os diversos utilizadores.

CINCO QUESTÕES SOBRE GDI

Como define, implementa e avalia as práticas de gestão de dados de investigação?

A implementação das práticas de gestão de dados assenta em várias dimensões complementares. Em primeiro lugar, destaca-se a designação de data stewards e coordenadores de qualidade por habitat, assegurando que cada área de monitorização dispõe de responsáveis dedicados à verificação e harmonização dos dados. Este modelo descentralizado permite maior proximidade às especificidades de cada ecossistema e garante consistência metodológica. Paralelamente, procede-se à criação de protocolos estandardizados e guias de boas práticas, que funcionam como referenciais comuns para todos os grupos de investigação envolvidos. Estes documentos são fundamentais para assegurar transparência, comparabilidade e interoperabilidade dos dados. A implementação inclui ainda a estruturação de planos de gestão de dados institucionais, concebidos como instrumentos estratégicos que orientam todo o ciclo de vida da informação científica. Finalmente, a formação e sensibilização de investigadores para ciência aberta constitui um eixo central, promovendo a adoção de práticas responsáveis e sustentáveis de gestão de dados e incentivando a partilha em conformidade com os princípios FAIR.

A avaliação destas práticas é realizada através de diferentes mecanismos. No âmbito do programa CIIMAR WATCH por exemplo, foram conduzidas entrevistas qualitativas a investigadores, que permitiram identificar lacunas, padrões e necessidades específicas na GDI de cada área científica. A produção de outputs académicos, como teses e relatórios, contribui para caracterizar de forma sistemática as práticas existentes e para documentar os desafios enfrentados. Ao longo deste processo, recorre-se ao benchmarking com programas europeus e internacionais de referência, assegurando o alinhamento das práticas locais com padrões globais e tirando partido da experiência acumulada em iniciativas semelhantes. 

Quais os principais benefícios dessas práticas?

A adoção de práticas estruturadas de gestão de dados científicos gera um conjunto de benefícios que se refletem em diferentes dimensões da investigação e da sociedade. Em primeiro lugar, promove transparência e credibilidade científica, assegurando que os processos de recolha, tratamento e disponibilização da informação são claros, verificáveis e replicáveis. Esta transparência reforça a confiança da comunidade académica e dos stakeholders externos, incluindo decisores políticos, financiadores e cidadãos, que passam a reconhecer o valor e a fiabilidade dos resultados produzidos.

Um segundo benefício prende-se com a interoperabilidade e reutilização dos dados em múltiplos contextos. Ao serem estruturados e documentados de acordo com normas e protocolos estandardizados, os dados tornam-se comparáveis entre diferentes projetos e instituições, aumentando significativamente o seu valor científico. Esta capacidade de reutilização potencia novas análises, reduz redundâncias e amplia o impacto da informação, permitindo que os mesmos dados sirvam de base a investigações diversas e complementares.

Estas práticas apoiam também de forma direta políticas públicas e iniciativas de conservação ambiental, fornecendo informação fiável e atualizada para a tomada de decisão. A disponibilização de dados robustos e acessíveis contribui para que gestores ambientais e decisores políticos possam fundamentar estratégias de conservação, mitigação de impactos e gestão sustentável dos recursos naturais.

Por fim, a adoção de práticas de gestão de dados promove uma maior sensibilização e envolvimento da comunidade científica e educativa, fomentando uma cultura de responsabilidade e partilha. Investigadores, estudantes e instituições passam a reconhecer que os dados não são apenas recursos individuais, mas património coletivo que deve ser preservado e disponibilizado em conformidade com os princípios da ciência aberta. Esta cultura fortalece a cooperação interdisciplinar, estimula a formação de novas gerações de cientistas conscientes da importância da gestão responsável da informação e contribui para aproximar a ciência da sociedade.

Em que medida a gestão de dados de investigação contribui para a otimização do processo de investigação?

A gestão estruturada de dados exerce um impacto direto e significativo na otimização dos processos de investigação científica. Em primeiro lugar, permite a redução de redundâncias e inconsistências, assegurando maior eficiência na utilização da informação. Quando os dados são recolhidos, armazenados e documentados de forma sistemática, evita-se a duplicação de esforços e minimizam-se erros que poderiam comprometer a qualidade das análises. Esta racionalização traduz-se em ganhos de tempo e recursos, aumentando a produtividade das equipas de investigação.

Outro contributo relevante é a aceleração da produção científica e de relatórios ambientais. A organização e acessibilidade dos dados facilitam a elaboração de artigos, relatórios técnicos e documentos de apoio à gestão ambiental, permitindo que os investigadores respondam de forma mais célere às exigências da comunidade científica e dos decisores políticos. A disponibilidade imediata da informação torna os processos de análise mais ágeis e reduz os obstáculos associados à recolha dispersa ou desorganizada de dados.

A gestão estruturada de dados potencia também a integração de variáveis multidisciplinares, tornando mais simples a realização de análises abrangentes e inovadoras. A combinação de dados provenientes de diferentes áreas científicas — como biologia, química, oceanografia ou climatologia — permite construir modelos mais completos e responder a questões complexas com maior rigor. Esta integração interdisciplinar fortalece a capacidade de gerar conhecimento novo e relevante, ampliando o alcance e a aplicabilidade dos resultados.

Finalmente, estas práticas promovem a melhoria da fiabilidade e comparabilidade dos resultados, aumentando a robustez das conclusões científicas e a sua relevância internacional. Dados bem estruturados e documentados podem ser comparados com séries temporais de outros programas ou instituições, permitindo validar hipóteses e reforçar a credibilidade das investigações. A comparabilidade assegura que os resultados obtidos localmente possam ser integrados em redes internacionais de monitorização, ampliando o impacto da investigação e consolidando o papel das instituições envolvidas no panorama científico global.

Que vantagens e condicionantes aponta na partilha de dados de investigação?

Entre as principais vantagens da adoção de práticas estruturadas de gestão de dados, destaca-se a robustez científica que resulta da integração de diferentes áreas de conhecimento. A interdisciplinaridade, ao reunir contributos de domínios como biologia, química, oceanografia e ciências ambientais, permite análises mais completas e rigorosas, capazes de responder a questões complexas com maior profundidade. Esta diversidade metodológica e conceptual fortalece a qualidade dos resultados e amplia a sua relevância para a comunidade científica e para a sociedade.

A gestão estruturada de dados confere também credibilidade junto de decisores políticos e financiadores, demonstrando que os projetos seguem práticas rigorosas, transparentes e alinhadas com padrões internacionais. Essa credibilidade reforça o impacto institucional e aumenta a capacidade de atrair recursos, sejam eles financeiros, técnicos ou humanos. Acresce ainda a maior visibilidade e impacto institucional, posicionando a organização como referência na área da ciência aberta e da monitorização ambiental. A disponibilização de dados de forma transparente e reutilizável contribui para consolidar a reputação da instituição e para fortalecer a sua integração em redes científicas nacionais e internacionais.

Contudo, existem condicionantes que não podem ser ignoradas. A implementação destas práticas requer recursos humanos especializados, cuja formação contínua e retenção constituem desafios permanentes. A complexidade logística e tecnológica associada à recolha, armazenamento e disponibilização de dados exige investimentos constantes em infraestrutura digital, equipamentos e sistemas de suporte, garantindo que a informação seja preservada e acessível a longo prazo. Por fim, a eficácia do sistema depende da adesão voluntária e colaborativa dos grupos de investigação, o que implica um esforço contínuo de sensibilização, coordenação e alinhamento de práticas. Sem este compromisso coletivo, torna-se difícil assegurar a consistência e a interoperabilidade dos dados, limitando o potencial da gestão estruturada.

De que forma os diferentes atores envolvidos no processo de investigação estão comprometidos com a gestão de dados de investigação?

O sucesso das práticas de gestão de dados científicos depende de uma atuação articulada e complementar entre diferentes atores institucionais e sociais. Cada grupo desempenha funções específicas que, em conjunto, asseguram a qualidade, a sustentabilidade e o impacto da informação produzida.

Os investigadores constituem a base do processo, sendo responsáveis pela recolha e disponibilização dos dados. A sua participação ativa nos protocolos definidos e nas ações de formação é essencial para garantir que a informação gerada cumpre padrões de qualidade e se encontra devidamente documentada. Ao adotar práticas harmonizadas, os investigadores contribuem para que os dados sejam comparáveis e reutilizáveis, reforçando a credibilidade da investigação.

Os data stewards desempenham um papel central na coordenação da gestão de dados. Cabe-lhes verificar a qualidade da informação, assegurar a conformidade com protocolos estandardizados e promover a harmonização metodológica entre diferentes grupos de investigação. A sua função garante que os dados não apenas são recolhidos, mas também estruturados e preservados de forma adequada, permitindo a sua utilização a longo prazo.

A coordenação científica assume a responsabilidade de definir prioridades estratégicas e supervisionar a integração interdisciplinar. Este nível de coordenação assegura que os objetivos do programa são claros e que os diferentes contributos científicos convergem para resultados robustos e relevantes. A supervisão interdisciplinar é particularmente importante em programas que envolvem múltiplas áreas de conhecimento, garantindo coerência e consistência na produção científica.

A instituição desempenha um papel de suporte fundamental, fornecendo recursos logísticos, financeiros e organizacionais. É a instituição que cria as condições para a sustentabilidade das práticas de gestão de dados, assegurando que existem meios técnicos e humanos adequados para manter a continuidade do programa. O seu compromisso institucional é determinante para que a gestão de dados seja reconhecida como um eixo estratégico e não apenas como uma atividade acessória.

Os estudantes e a comunidade científica participam em projetos de formação e sensibilização, contribuindo para a disseminação de boas práticas. A sua integração nos processos de gestão de dados promove a renovação de competências e garante que novas gerações de investigadores estão preparadas para lidar com os desafios da ciência aberta e da gestão responsável da informação.

Finalmente, os stakeholders externos, incluindo decisores políticos e sociedade civil, desempenham um papel crucial na valorização e aplicação dos dados. Ao utilizarem a informação científica para fundamentar decisões e promover a conservação ambiental, reforçam o impacto social da investigação. A ligação entre ciência e sociedade é fortalecida quando os dados são disponibilizados de forma transparente e acessível, permitindo que sejam utilizados para enfrentar desafios ambientais e apoiar políticas públicas.

 

 

DESCRIÇÃO

O projeto de doutoramento em curso tem como foco central o desenvolvimento de um sistema inovador de monitorização remota para idosos, concebido para responder às necessidades específicas de uma população frequentemente vulnerável, sobretudo aqueles que residem em regiões mais isoladas e que dependem, em grande medida, de cuidadores informais ou familiares. Trata-se de um esforço científico e tecnológico que procura conciliar duas dimensões fundamentais: por um lado, a segurança e o acompanhamento contínuo dos idosos; por outro, a proteção da sua privacidade e dignidade, assegurando que o processo de recolha e utilização de dados não compromete direitos individuais.

Para atingir estes objetivos, o sistema recorre a sensores ambientais e a imagens de profundidade, em detrimento de imagens convencionais RGB. Esta opção metodológica é particularmente relevante, uma vez que as imagens de profundidade permitem captar padrões de movimento e comportamento sem revelar características físicas identificáveis, como traços faciais ou detalhes pessoais. Assim, garante-se que o monitoramento é eficaz na deteção de situações de risco, mas não invasivo, preservando a identidade dos indivíduos.

O sistema foi concebido para detetar precocemente situações de emergência, como quedas ou movimentos que possam indicar risco iminente, emitindo alertas automáticos para familiares, cuidadores ou profissionais de saúde. Esta funcionalidade tem como objetivo reduzir o tempo de resposta em situações críticas, aumentando a probabilidade de intervenção rápida e eficaz.

Um dos principais resultados esperados do projeto é a criação de um dataset público, cuidadosamente estruturado e anonimizado, que se distingue pela sua relevância científica e social. Este dataset é composto por gravações de ações quotidianas — como caminhar, sentar, levantar ou pegar em objetos — e por simulações de quedas, abrangendo um conjunto de cerca de vinte ações distintas. A disponibilização deste recurso pretende colmatar uma lacuna existente na área, uma vez que não há datasets atualizados e específicos que possam ser utilizados para treinar algoritmos de predição de quedas e padrões de comportamento em idosos.

A criação deste dataset público tem uma dupla finalidade: por um lado, servir de base ao treino e validação dos algoritmos de inteligência artificial desenvolvidos no âmbito do projeto; por outro, promover a reutilização por outros investigadores, incentivando a partilha de conhecimento e a colaboração científica. Ao disponibilizar dados de forma transparente e acessível, o projeto contribui para o avanço da investigação em áreas como saúde digital, envelhecimento ativo e monitorização remota, reforçando os princípios da ciência aberta.

TRÊS LIÇÕES APRENDIDAS

Centralidade da ética e da privacidade

A investigação científica que envolve dados humanos, em particular dados pessoais e ligados a condições de saúde, coloca inevitavelmente a ética e a privacidade no centro das suas preocupações. Trabalhar com este tipo de informação exige não apenas o cumprimento rigoroso de regulamentos como o Regulamento Geral de Proteção de Dados (RGPD), mas também um compromisso profundo com o respeito pela dignidade das pessoas envolvidas. A proteção da identidade e da integridade dos participantes é um princípio estruturante que deve orientar todas as fases do projeto, desde a conceção até à divulgação dos resultados. Neste contexto, a submissão do projeto ao comité de ética revelou-se uma etapa essencial, não apenas como requisito formal, mas como mecanismo de validação das práticas adotadas. Este processo permitiu identificar potenciais fragilidades, reforçar a confiança dos participantes voluntários e assegurar que a investigação decorre dentro de padrões elevados de responsabilidade e transparência. Assim, a dimensão ética não é apenas um requisito legal, mas um elemento que confere credibilidade científica e social ao trabalho desenvolvido.

Planeamento da gestão de dados desde o início

Paralelamente, a experiência demonstrou que o planeamento da gestão de dados desde o início é determinante para garantir a sua reutilização e relevância futura. A ausência de planeamento inicial compromete seriamente a utilidade dos datasets, tornando-os menos transparentes e dificultando a sua integração em novos projetos. Por isso, é fundamental que a documentação, a organização e a padronização sejam definidas antes da recolha, estabelecendo regras claras para nomeação de ficheiros, armazenamento seguro e anonimização dos dados. Este cuidado inicial assegura que os datasets não apenas cumprem requisitos de qualidade, mas também se tornam reutilizáveis e interoperáveis, permitindo que outros investigadores possam beneficiar da informação produzida sem necessidade de repetir processos ou recolher novamente dados junto dos participantes. 

Flexibilidade na investigação aplicada

Por fim, a investigação aplicada, sobretudo quando envolve voluntários, exige uma elevada capacidade de flexibilidade. Projetos desta natureza implicam lidar com imprevistos, ritmos distintos entre participantes e desafios logísticos que não podem ser totalmente antecipados. A organização de sessões de recolha de dados, a disponibilidade de espaços adequados ou a coordenação de voluntários são exemplos de aspetos que frequentemente exigem ajustamentos. A capacidade de adaptação revelou-se fundamental para garantir a continuidade e a qualidade da investigação, permitindo que os objetivos sejam alcançados mesmo em contextos dinâmicos e imprevisíveis. Esta flexibilidade não diminui o rigor científico; pelo contrário, assegura que a investigação se mantém relevante e eficaz, respondendo às exigências do mundo real e às particularidades de cada participante. Trabalhar com pessoas significa lidar com variabilidade e complexidade, e é precisamente nesta capacidade de adaptação que reside a força da investigação aplicada e a boa recolha de dados.

TRÊS DESAFIOS FUTUROS

Garantia da interoperabilidade e reutilização dos dados

A investigação científica contemporânea enfrenta o desafio de assegurar a interoperabilidade e reutilização dos dados produzidos. A criação de datasets não pode ser vista apenas como um resultado imediato de um projeto, mas como um recurso de longo prazo que deve manter padrões elevados de qualidade, consistência e anonimização. Para que os dados possam ser utilizados por outros investigadores, é fundamental que sejam estruturados de forma clara, documentados com rigor e acompanhados de metadados que permitam compreender o seu contexto de produção. A interoperabilidade garante que os datasets possam ser integrados em diferentes sistemas e comparados com outras séries temporais, ampliando o seu valor científico e evitando que a informação se torne obsoleta ou limitada ao âmbito restrito de um único estudo.

Sustentabilidade da informação sensível

A par desta preocupação, surge a necessidade de assegurar a sustentabilidade da informação sensível. A preservação de dados humanos, especialmente quando relacionados com saúde ou comportamento, exige cuidados adicionais de natureza técnica e legal. É imprescindível garantir que os dados sejam armazenados em sistemas seguros, protegidos contra acessos não autorizados e preservados de forma a manter a sua integridade ao longo do tempo. A sustentabilidade implica também assegurar que os dados permanecem acessíveis e utilizáveis, mesmo após o término dos projetos que lhes deram origem. Este compromisso requer investimentos contínuos em infraestrutura tecnológica, formação de profissionais especializados e definição de políticas institucionais que assegurem a longevidade da informação. Só assim é possível garantir que os dados sensíveis não apenas sobrevivem ao ciclo de vida imediato da investigação, mas continuam a ser recursos valiosos para futuras gerações de cientistas e decisores.

Promoção da partilha colaborativa de dados

Finalmente, a criação de datasets públicos deve ser acompanhada por uma estratégia clara de promoção da partilha colaborativa de dados. A disponibilização aberta da informação não é suficiente por si só; é necessário fomentar práticas que incentivem a colaboração internacional, evitando duplicação de esforços e fortalecendo a ciência aberta. A partilha colaborativa permite que investigadores de diferentes instituições e países utilizem os mesmos recursos, ampliando o impacto da investigação e promovendo sinergias entre projetos. Além disso, contribui para reduzir a necessidade de recolher novamente dados junto de participantes, minimizando a intrusão e respeitando a dignidade das pessoas envolvidas. A ciência aberta, apoiada por datasets públicos e colaborativos, reforça a transparência, aumenta a credibilidade da investigação e promove uma cultura de responsabilidade coletiva na produção e utilização do conhecimento.

CINCO QUESTÕES SOBRE GDI

Como define, implementa e avalia as práticas de gestão de dados de investigação?

A implementação das práticas de gestão de dados no projeto foi estruturada de forma progressiva, incorporando aprendizagens obtidas ao longo do processo. Após uma experiência inicial marcada por limitações na reutilização da informação, tornou-se evidente a necessidade de desenvolver planos de gestão de dados claros e consistentes. Estes planos passaram a orientar todas as etapas da recolha e organização da informação, assegurando que os datasets criados fossem não apenas úteis para o investigador principal, mas também reutilizáveis por outros membros da comunidade científica.

Um dos aspetos centrais da implementação foi a definição prévia de regras de nomeação, armazenamento e anonimização dos vídeos. Cada gravação foi cuidadosamente catalogada, seguindo convenções estabelecidas que permitiam identificar ações específicas sem comprometer a privacidade dos participantes. O armazenamento foi realizado em repositórios físicos, evitando o uso de plataformas em nuvem que poderiam representar riscos adicionais de segurança e de eventual exposição indevida dos dados. A anonimização constituiu uma prioridade, garantindo que não existisse qualquer possibilidade de rastreio ou identificação dos voluntários envolvidos.

Outro passo fundamental foi a submissão do projeto ao comité de ética, assegurando que todas as práticas adotadas estavam em conformidade com regulamentos nacionais e internacionais. Este processo não só reforçou a credibilidade científica do trabalho, como também permitiu identificar e corrigir potenciais fragilidades na gestão dos dados, fortalecendo a confiança dos participantes e da instituição.

No que respeita à avaliação das práticas de gestão de dados, o primeiro momento crítico foi a identificação de falhas na criação do dataset original, que não cumpria plenamente os requisitos de reutilização e interoperabilidade. A correção dessas falhas no segundo dataset representou uma evolução significativa, demonstrando a importância da aprendizagem contínua e da adaptação metodológica.

A avaliação incluiu ainda a validação ética e institucional das práticas, confirmando que os procedimentos seguiam padrões de qualidade e responsabilidade. Este processo de validação foi essencial para consolidar a confiança na investigação e para assegurar que os dados produzidos poderiam ser partilhados de forma segura e transparente.

Quais os principais benefícios dessas práticas?

A organização e reutilização dos dados constituem elementos centrais para aumentar a eficiência científica e garantir que a informação recolhida cumpre o seu verdadeiro propósito. Quando os dados são devidamente estruturados, documentados e armazenados, tornam-se mais fáceis de consultar, analisar e integrar em novos projetos. Esta organização evita redundâncias, reduz inconsistências e assegura que o esforço investido na recolha inicial não se perde, mas se transforma num recurso duradouro. A reutilização, por sua vez, amplia o impacto da investigação, permitindo que os mesmos dados sejam aplicados em diferentes contextos e por diversos investigadores, potenciando novas descobertas sem necessidade de repetir processos dispendiosos e intrusivos.

A adoção destas práticas promove também transparência e credibilidade, fatores essenciais para consolidar a confiança da comunidade científica e dos stakeholders externos. A clareza nos métodos de recolha, tratamento e disponibilização dos dados garante que os resultados obtidos podem ser verificados e replicados, reforçando a robustez das conclusões. Esta transparência não beneficia apenas o investigador responsável, mas tem um impacto positivo para outros investigadores que passam a ter acesso a informação fiável e bem documentada. A credibilidade científica é, assim, fortalecida, posicionando os projetos que seguem estas práticas como referências de qualidade e responsabilidade.

A criação de datasets públicos representa um contributo decisivo para ampliar o valor coletivo da investigação. Ao disponibilizar dados de forma aberta e acessível, promove-se a ciência colaborativa e evita-se a duplicação de esforços, permitindo que diferentes equipas e instituições utilizem os mesmos recursos para responder a questões diversas. Estes datasets públicos tornam-se património científico partilhado, fomentando a interdisciplinaridade, incentivando colaborações internacionais e reforçando os princípios da ciência aberta. Além disso, contribuem para reduzir a necessidade de recolher novamente dados junto de participantes.

Em que medida a gestão de dados de investigação contribui para a otimização do processo de investigação?

A adoção de práticas estruturadas de gestão de dados tem efeitos diretos e significativos na redução de redundâncias e inconsistências, evitando a necessidade de recolhas repetidas e assegurando maior eficiência científica. Quando os dados são devidamente organizados e documentados, tornam-se mais fáceis de consultar e reutilizar, permitindo que os investigadores aproveitem plenamente a informação já existente. Este processo não só poupa tempo e recursos, como também diminui a probabilidade de erros ou duplicações, garantindo que os resultados obtidos são consistentes e fiáveis. A racionalização da recolha e utilização dos dados traduz-se, assim, em ganhos concretos para a investigação, aumentando a produtividade e a qualidade das análises realizadas.

Outro contributo fundamental destas práticas é a aceleração do treino e validação de algoritmos de inteligência artificial. A disponibilidade de datasets bem estruturados e anonimizados permite que os modelos sejam treinados de forma mais rápida e eficaz, sem necessidade de criar continuamente novas bases de dados. A qualidade e a organização da informação facilitam o processo de validação, assegurando que os algoritmos podem ser testados em condições robustas e replicáveis. Este fator é particularmente relevante em áreas como a saúde digital ou a monitorização remota, onde a fiabilidade dos algoritmos é determinante para garantir segurança e confiança nos resultados. Ao acelerar o treino e a validação, estas práticas contribuem para reduzir o tempo entre a investigação e a aplicação prática, tornando os avanços tecnológicos mais acessíveis e úteis.

A gestão estruturada de dados facilita a transição dos resultados para ambientes reais, aumentando a sua aplicabilidade e impacto social. A existência de datasets organizados e reutilizáveis permite que os sistemas desenvolvidos em contexto académico sejam mais facilmente adaptados a cenários concretos, como casas de idosos ou instituições de saúde. Esta transição é essencial para que a investigação não permaneça confinada ao laboratório, mas se traduza em soluções práticas que respondam a necessidades sociais urgentes. Ao garantir que os dados são fiáveis, transparentes e reutilizáveis, cria-se uma ponte entre ciência e sociedade, promovendo a inovação tecnológica e reforçando o impacto positivo da investigação na vida das pessoas.

Que vantagens e condicionantes aponta na partilha de dados de investigação?

A adoção de práticas rigorosas de gestão de dados científicos apresenta um conjunto significativo de vantagens que reforçam a qualidade e o impacto da investigação. Em primeiro lugar, destaca-se a robustez científica, resultante da aplicação de metodologias consistentes e da observância de princípios éticos. A credibilidade é fortalecida quando os dados são recolhidos, tratados e disponibilizados de forma transparente, permitindo que os resultados sejam verificados e replicados por outros investigadores. Esta confiança, sustentada por práticas éticas, posiciona os projetos como referências de qualidade e responsabilidade, aumentando a sua relevância no panorama científico.

Outro benefício reside no potencial para colaborações internacionais, que se torna mais evidente quando os dados são organizados e disponibilizados em formatos interoperáveis. A partilha de datasets estruturados e anonimizados facilita a integração em redes científicas globais, promovendo sinergias entre instituições e ampliando o alcance dos resultados. Este fator contribui para um maior impacto institucional, reforçando a visibilidade das organizações envolvidas e consolidando a sua posição como atores relevantes na produção de conhecimento.

A gestão de dados representa ainda um contributo direto para a ciência aberta e para a inovação tecnológica. Ao disponibilizar datasets públicos e reutilizáveis, promove-se a transparência e a democratização do acesso à informação, permitindo que diferentes comunidades científicas e tecnológicas utilizem os mesmos recursos para desenvolver novas soluções. Esta prática não só acelera o avanço da investigação, como também fomenta a inovação em áreas aplicadas, aumentando o impacto social da ciência.

Contudo, estas vantagens são acompanhadas por condicionantes que não podem ser ignoradas. A implementação de práticas robustas exige a disponibilidade de recursos humanos especializados, capazes de lidar com questões técnicas e éticas complexas. A formação e retenção destes profissionais constituem desafios permanentes, essenciais para garantir a qualidade e sustentabilidade da gestão de dados.

A complexidade logística e tecnológica é outro fator condicionante, uma vez que a recolha, armazenamento e anonimização de dados implicam investimentos contínuos em infraestrutura digital, equipamentos e sistemas de segurança. Estes processos exigem planeamento detalhado e capacidade de adaptação, de modo a assegurar que os dados permanecem íntegros e acessíveis ao longo do tempo.

Por fim, a eficácia da gestão de dados depende da conformidade legal e da colaboração voluntária dos participantes. O cumprimento rigoroso das normas jurídicas e éticas é indispensável para proteger os direitos individuais, mas implica também um esforço constante de sensibilização e envolvimento dos voluntários. Sem esta adesão colaborativa, torna-se difícil garantir a consistência e a representatividade dos datasets, limitando o seu potencial científico e social.

De que forma os diferentes atores envolvidos no processo de investigação estão comprometidos com a gestão de dados de investigação?

Os investigadores desempenham um papel central, sendo responsáveis pela recolha, organização e disponibilização dos dados. Cabe-lhes garantir que a informação é obtida de forma rigorosa, documentada e conforme os protocolos estabelecidos, assegurando que os datasets criados possam ser utilizados tanto no presente como em futuras investigações. A sua participação ativa é essencial para que os dados sejam credíveis e representativos, constituindo a base sobre a qual se constrói todo o processo científico.

A coordenação científica e os orientadores têm como responsabilidade supervisionar prioridades estratégicas e assegurar a conformidade ética do processo. Este nível de coordenação garante que os objetivos da investigação estão alinhados com as necessidades institucionais e sociais, promovendo a integração interdisciplinar e reforçando a credibilidade dos resultados. A supervisão ética e metodológica constitui um elemento essencial para que a investigação decorra dentro de padrões elevados de responsabilidade.

A instituição desempenha um papel de suporte fundamental, fornecendo recursos logísticos, financeiros e organizacionais. É a instituição que cria as condições para a sustentabilidade das práticas de gestão de dados, disponibilizando infraestruturas adequadas e promovendo formação especializada para investigadores e técnicos. O compromisso institucional é determinante para que a gestão de dados seja reconhecida como uma prioridade estratégica e não apenas como uma atividade acessória.

Os estudantes e a comunidade científica participam em projetos de sensibilização e disseminação de boas práticas, contribuindo para a renovação de competências e para a consolidação de uma cultura de responsabilidade partilhada. 

Por fim, os stakeholders externos, incluindo cuidadores, decisores políticos e sociedade civil, utilizam os dados para fundamentar decisões e promover impacto social. A disponibilização de informação fiável e transparente permite que políticas públicas sejam melhor informadas, que práticas de cuidado sejam mais eficazes e que a sociedade reconheça o valor da investigação científica. Esta ligação entre ciência e sociedade reforça o impacto social da investigação e legitima o investimento em práticas de gestão de dados robustas e sustentáveis.

 

 

PROJETO

Projeto de Doutoramento sobre Monitorização Remota de ldosos

ENTIDADES

Instituto Politécnico de Bragança

INVESTIGADORA
ENTREVISTADA
A INVESTIGADORA
RESPONDE
CINCO QUESTÕES SOBRE GDI

DOMÍNIOS CIENTÍFICOS

Engenharia e Tecnologia

ETAPAS DO CICLO DE VIDA DOS DADOS

Processamento

Preservação

Reutilização

DATA DE RECOLHA

Novembro de 2025

Como transformar a gestão de dados de investigação de obrigação burocrática em ferramenta estratégica?

De que forma a formação inicial pode garantir que futuras gerações de investigadores adotem estas práticas naturalmente?

Que mecanismos podem reforçar o reconhecimento e a integridade na reutilização de dados em acesso aberto?

DESCRIÇÃO

A gestão de dados de investigação e a sua abertura à comunidade científica e a outras comunidades interessadas tem vindo a ganhar crescente relevância e era uma temática já conhecida, nomeadamente através da experiência de participação em projetos Twinning.

Contudo, o marco decisivo neste processo ocorreu com a aprovação de um projeto  na Universidade de Aveiro centrado na análise epigenética e que envolve dados de sequenciação, tradicionalmente depositados em plataformas internacionais amplamente utilizadas. Estes dados são frequentemente reutilizados por diversos investigadores, permitindo novas abordagens a problemas já estudados ou a questões emergentes, reforçando o valor da partilha e da reutilização da informação científica.

O projeto EPIBOOST – BOOSting excellence in environmental EPIgenetics está enquadrado no Programa Horizonte Europa que tornou a prática de acesso abeto aos dados obrigatória. Este enquadramento institucional trouxe novos desafios formais, exigindo maior rigor na implementação das boas práticas de gestão de dados e no cumprimento das obrigações estabelecidas nos grant agreements.

O processo coincidiu, igualmente, com a entrada em funcionamento do repositório institucional da Universidade de Aveiro, que não estava inicialmente previsto nos planos de gestão de dados, mas que acabou por ser integrado. Esta integração representou simultaneamente um desafio e uma oportunidade: permitiu alinhar práticas institucionais com as exigências europeias e criar condições para aprendizagem conjunta entre investigadores e equipas técnicas, num contexto em que a linguagem e a estruturação dos planos de gestão de dados ainda correspondiam obstáculos, no sentido em que os investigadores estavam pouco familiarizados com estes novos requisitos.

A decisão de privilegiar o repositório institucional reforçou a aposta na capacitação, objetivo central dos projetos Twinning. Estes projetos não se limitam ao desenvolvimento científico, mas promovem igualmente competências transversais, incluindo a gestão da ciência e dos dados de investigação. 

A experiência de implementação das práticas de gestão de dados de investigação no contexto do Horizonte Europa revelou-se exigente, mas também profundamente enriquecedora. Num cenário em que os fluxos institucionais ainda não estavam plenamente definidos, os investigadores pouco treinados e o apoio especializado limitado, o processo constituiu uma oportunidade de aprendizagem coletiva. Apesar das dificuldades iniciais e da perceção de que se tratava de mais uma exigência burocrática, a prática demonstrou o seu valor e contribuiu para a criação de uma cultura mais sólida e eficiente de gestão de dados.

TRÊS LIÇÕES APRENDIDAS

A prática desmistifica a perceção burocrática

A gestão de dados de investigação só se torna clara e compreensível quando é efetivamente praticada. O contacto direto com os requisitos e procedimentos permitiu ultrapassar a ideia inicial de que se tratava apenas de uma obrigação administrativa sem benefícios. A experiência mostrou que, ao experimentar e aplicar, é possível reconhecer o potencial e as vantagens da gestão estruturada de dados, transformando-a de um fardo numa ferramenta útil.

Fluxos de registo estruturados aumentam a eficiência

A ausência de fluxos claros de registo e organização de dados gera perdas de tempo e descontinuidade nos projetos, sobretudo quando há rotatividade de investigadores. A implementação de processos formais, como a preparação de dossiês para depósito em acesso aberto, revelou-se uma estratégia eficaz para monitorizar o progresso da investigação e assegurar continuidade. Estes fluxos não apenas reduzem falhas, como também tornam a própria investigação mais eficiente e transparente.

Capacitação gera cultura e sustentabilidade

A obrigatoriedade de adotar boas práticas de gestão de dados impulsionou a formação da equipa e estimulou a criação de hábitos que beneficiarão as gerações futuras de investigadores. O treino e a adaptação inicial, embora exigentes, abriram caminho para que os novos investigadores encarem estas práticas como parte natural do processo científico. Assim, a experiência não só fortaleceu a equipa atual, como contribuiu para institucionalizar uma cultura de gestão de dados que assegura maior eficiência e sustentabilidade da investigação.

TRÊS DESAFIOS FUTUROS

Reforço do apoio institucional especializado

Um dos principais obstáculos prende-se com a ausência de equipas dedicadas de data stewards capazes de apoiar coordenadores e gestores de projetos, sobretudo em consórcios internacionais de grande dimensão. A inexistência deste suporte técnico coloca sobre os investigadores responsabilidades para as quais não estão plenamente preparados, como a definição de vocabulários ou a harmonização de práticas entre parceiros. O futuro exige que as instituições invistam em estruturas estáveis de apoio especializado, garantindo consistência e qualidade na gestão de dados.

Integração da formação em currículos académicos

A gestão de dados de investigação deve ser incorporada desde cedo nos percursos formativos, começando na licenciatura e aprofundando-se no mestrado e doutoramento. A ausência desta preparação inicial faz com que os investigadores encarem estas práticas como exigências adicionais e burocráticas. Ao contrário, se forem treinados desde o início, adotarão naturalmente estas metodologias como parte integrante da investigação, tornando os processos mais eficientes e sustentáveis. Este desafio implica uma mudança curricular e pedagógica significativa.

Reconhecimento e proteção da autoria dos dados

Apesar das vantagens do acesso aberto, subsiste um conflito entre o esforço de quem gera dados e a reutilização por terceiros sem o devido reconhecimento. A falta de mecanismos eficazes para garantir citações e rastrear reutilizações fragiliza a confiança dos investigadores e cria barreiras psicológicas à abertura. O futuro passa por desenvolver ferramentas e práticas que assegurem integridade e reconhecimento, promovendo a cultura de que um dataset tem o mesmo valor e estatuto de uma publicação científica.

Estes três desafios — apoio institucional especializado, formação académica estruturada e reconhecimento da autoria dos dados — representam pontos críticos para a consolidação de uma cultura de gestão de dados robusta e sustentável. Enfrentá-los será determinante para que as instituições e os investigadores possam não apenas cumprir requisitos formais, mas também transformar a gestão de dados num verdadeiro motor de eficiência, colaboração e inovação científica.

CINCO QUESTÕES SOBRE GDI

Como define, implementa e avalia as práticas de gestão de dados de investigação?

A implementação de boas práticas na gestão de dados de investigação exige uma abordagem estruturada e integrada, capaz de responder às exigências formais dos financiadores e, ao mesmo tempo, de promover eficiência e qualidade nos processos científicos.

Um primeiro passo fundamental consiste na definição de fluxos claros, através da criação de dossiês e templates específicos para o depósito de dados. Esta prática assegura uniformidade e continuidade, permitindo que diferentes investigadores ou equipas possam dar seguimento ao trabalho sem perda de informação ou inconsistência nos registos.

Complementarmente, a formação prática (hands-on) revela-se essencial. Ao utilizar os próprios dados dos investigadores em exercícios de depósito e gestão, o processo torna-se mais concreto e aplicável, facilitando a aprendizagem e a apropriação das metodologias. Esta abordagem prática contribui para desmistificar a perceção de burocracia e reforça a utilidade da gestão de dados como ferramenta de apoio à investigação.

Outro elemento crítico é a integração institucional, que passa pela implementação de repositórios institucionais e pelo alinhamento com os requisitos formais dos financiadores, como os estabelecidos no Horizonte Europa. Esta integração garante não apenas conformidade legal e contratual, mas também reforça a credibilidade da instituição e a sua capacidade de participar em projetos internacionais de grande dimensão.

Por fim, a avaliação contínua desempenha um papel central na consolidação destas práticas. A monitorização da eficácia deve ser realizada através da análise da capacidade de reutilização dos dados, da adesão das equipas e da redução de falhas nos processos de investigação. Este acompanhamento permite identificar pontos de melhoria, ajustar estratégias e assegurar que a gestão de dados evolui em consonância com as necessidades da comunidade científica e com as exigências regulatórias.

Quais os principais benefícios dessas práticas?

A adoção de práticas estruturadas de gestão de dados de investigação tem demonstrado benefícios claros tanto para os investigadores como para as instituições.

Um dos aspetos mais relevantes é a desmistificação do processo. Ao serem aplicadas de forma sistemática, estas práticas deixam de ser percecionadas como meros requisitos burocráticos e passam a ser entendidas como ferramentas úteis, capazes de apoiar diretamente a investigação. Esta mudança de perceção é essencial para promover a adesão e para consolidar uma cultura de dados mais madura e eficiente.

Outro benefício evidente é a eficiência. A existência de registos claros e fluxos definidos reduz significativamente as perdas de tempo associadas à rotatividade de investigadores e à ausência de documentação estruturada. Com dados organizados e acessíveis, torna-se possível assegurar continuidade nos projetos, evitando duplicação de esforços e facilitando a interpretação e prosseguimento do trabalho por diferentes membros da equipa.

A capacitação constitui igualmente um resultado central. A implementação destas práticas promove o desenvolvimento de competências transversais em investigadores e técnicos, fortalecendo a cultura institucional e criando condições para que futuras gerações de cientistas integrem naturalmente a gestão de dados nos seus processos de trabalho. Este investimento em formação e prática contribui para a sustentabilidade e para a qualidade da investigação a longo prazo.

Por fim, destaca-se a conformidade com as exigências legais e contratuais dos financiadores. O cumprimento rigoroso destas normas não só evita riscos de incumprimento, como reforça a credibilidade das instituições e a sua capacidade de participar em projetos internacionais competitivos. A gestão de dados, neste sentido, deixa de ser apenas uma obrigação formal e passa a representar uma vantagem estratégica.

Em que medida a gestão de dados de investigação contribui para a otimização do processo de investigação?

O impacto da gestão estruturada de dados na otimização do processo de investigação é significativo e multifacetado, refletindo-se diretamente na eficiência e na qualidade dos resultados científicos.

Em primeiro lugar, destaca-se a continuidade. A existência de fluxos de registo bem definidos permite que diferentes membros da equipa avancem sem interrupções, mesmo em contextos de rotatividade ou substituição de investigadores. Esta prática assegura que o conhecimento acumulado não se perde e que o trabalho pode prosseguir de forma consistente e integrada.

A monitorização constitui outro benefício central. Dossiês e planos de gestão de dados funcionam como ferramentas de acompanhamento do progresso científico, permitindo avaliar etapas concluídas, identificar lacunas e garantir que os objetivos do projeto são cumpridos. Esta capacidade de acompanhamento sistemático fortalece a transparência e facilita a tomada de decisões estratégicas.

No que respeita à qualidade, a organização e acessibilidade dos dados aumentam a fiabilidade dos resultados e abrem espaço para novas abordagens investigativas. Dados bem estruturados não apenas reduzem erros e inconsistências, como também potenciam a reutilização e a exploração de hipóteses adicionais, ampliando o impacto da investigação.

Por fim, a agilidade é um efeito direto da formação adequada dos investigadores. Quando estes dominam as práticas de gestão de dados, conseguem integrá-las naturalmente no seu trabalho, sem atrasos adicionais ou perceção de burocracia. A gestão de dados torna-se, assim, parte integrante do processo científico, contribuindo para maior rapidez e eficiência na produção de conhecimento.

Em conjunto, estes elementos demonstram que a gestão de dados não é apenas um requisito formal, mas um fator determinante para a otimização da investigação, assegurando continuidade, monitorização rigorosa, qualidade acrescida e maior agilidade na execução dos projetos.

Que vantagens e condicionantes aponta na partilha de dados de investigação?

A gestão de dados de investigação apresenta um conjunto de vantagens que reforçam a qualidade e a sustentabilidade da ciência, mas também enfrenta condicionantes que exigem atenção e investimento estratégico por parte das instituições.

Entre as principais vantagens, destaca-se a maior eficiência e transparência nos processos científicos. A adoção de fluxos claros e práticas de registo estruturado permite reduzir falhas, assegurar continuidade e tornar os resultados mais fiáveis e acessíveis. Paralelamente, a implementação destas práticas contribui para a formação de novas gerações de investigadores, que desde cedo se adaptam às exigências da gestão de dados e passam a encarar estas metodologias como parte natural da investigação. Este processo formativo garante que, no futuro, a cultura de dados estará plenamente integrada nas rotinas científicas.

Outro benefício relevante é o reforço da credibilidade institucional e da competitividade em projetos internacionais. Instituições que demonstram capacidade de gerir dados de forma eficiente e conforme às exigências dos financiadores posicionam-se melhor para liderar ou integrar consórcios de grande dimensão, aumentando a sua visibilidade e relevância no panorama científico global.

Contudo, estas vantagens são acompanhadas por condicionantes que não podem ser ignorados. A falta de recursos humanos especializados, nomeadamente data stewards, limita a capacidade de apoio técnico e coloca sobre os investigadores responsabilidades adicionais para as quais nem sempre estão preparados. A isto somam-se os custos elevados de formação e a resistência inicial dos investigadores, que muitas vezes percecionam a gestão de dados como uma exigência burocrática sem benefícios imediatos.

Existe ainda um conflito psicológico e cultural em torno da abertura e reutilização dos dados sem reconhecimento adequado. Muitos investigadores sentem que o esforço investido na produção de dados não é devidamente valorizado quando estes são reutilizados sem citação, o que gera barreiras à plena adesão ao acesso aberto.

 Finalmente, a necessidade de políticas institucionais claras e obrigatórias surge como um fator crítico: sem diretrizes firmes e consistentes, a adesão tende a ser desigual e dependente da motivação individual, comprometendo a eficácia das práticas.

Em síntese, a gestão de dados de investigação oferece ganhos significativos em eficiência, formação e credibilidade, mas só poderá atingir o seu pleno potencial se forem enfrentados os desafios relacionados com recursos humanos, formação, cultura científica e políticas institucionais.

De que forma os diferentes atores envolvidos no processo de investigação estão comprometidos com a gestão de dados de investigação?

O papel dos diferentes atores na gestão de dados de investigação é determinante para assegurar a eficácia, a sustentabilidade e a credibilidade das práticas adotadas. Cada interveniente contribui de forma complementar para a criação de uma cultura sólida de dados, capaz de responder às exigências científicas e institucionais.

As instituições têm a responsabilidade de garantir recursos humanos dedicados, definir perfis funcionais específicos e investir em programas de formação contínua. Além disso, devem criar políticas claras e obrigatórias que assegurem a adesão dos investigadores e promovam a integração da gestão de dados como parte essencial da atividade científica.

Os investigadores desempenham um papel central ao adotar práticas de gestão desde o início das suas carreiras, participando em formações e contribuindo para a consolidação da cultura de dados. A sua adesão e envolvimento são fundamentais para que estas práticas deixem de ser percecionadas como burocráticas e passem a ser encaradas como ferramentas de apoio à investigação.

Os data stewards assumem uma função técnica especializada, apoiando os projetos na definição de vocabulários, na harmonização de procedimentos e na garantia da qualidade dos planos de gestão. A sua intervenção é essencial para assegurar consistência e rigor, sobretudo em consórcios internacionais de grande dimensão.

Os financiadores têm igualmente um papel estratégico, ao definir requisitos claros e promover a cultura de dados como parte integrante da investigação. Ao estabelecer normas e critérios de avaliação, contribuem para que a gestão de dados seja reconhecida como elemento indispensável à qualidade e à transparência científica.

Por fim, os centros de competências oferecem formação inicial e contínua, adaptada às necessidades dos investigadores e à evolução das regras de financiamento. Estes centros funcionam como espaços de apoio e capacitação, garantindo que as práticas de gestão de dados acompanham as mudanças do ecossistema científico e regulatório.

Em conjunto, estes atores formam um ecossistema interdependente, no qual cada papel é essencial para que a gestão de dados de investigação se afirme como prática consolidada, eficiente e sustentável, contribuindo para o avanço da ciência e para o reforço da credibilidade institucional.