Qual o impacto de boas práticas de gestão de dados na educação ambiental?

Porque é necessário o planeamento desde o início do processo de investigação?

Quais são os maiores desafios para garantir a sustentabilidade e interoperabilidade dos dados a longo prazo? 

DESCRIÇÃO

O CIIMAR Watch é um programa institucional de monitorização marinha e ambiental da costa norte de Portugal, desenvolvido pelo Centro de Investigação Marinha e Ambiental (CIIMAR). 

A iniciativa integra esforços anteriores de monitorização realizados por diferentes grupos de investigação, promovendo uma abordagem colaborativa e interdisciplinar. O programa abrange observatórios no Porto e Viana do Castelo, monitorizando ecossistemas costeiros e estuarinos, incluindo os rios Douro e Lima. Os dados recolhidos são de natureza química, física e biológica, com o objetivo de gerar conhecimento científico robusto, apoiar decisões políticas e promover sensibilização pública e educação ambiental.

O programa tem como principais objetivos estabelecer linhas de base científicas, acompanhar a dinâmica ambiental em ecossistemas costeiros e estuarinos e fornecer dados contínuos, de longo prazo, gratuitos e de acesso livre a cientistas, comunidades locais e decisores. A sua abordagem é interdisciplinar, combinando competências de investigadores em oceanografia física, climatologia, química ambiental, deteção remota, toxicologia ambiental, ecologia microbiana, ecologia bentónica e pelágica, ecologia de mamíferos marinhos e biodiversidade. Esta perspetiva holística permite uma visão abrangente de uma região marcada por processos complexos e em constante transformação.

O impacto esperado do programa traduz-se na melhoria da compreensão dos ambientes marinhos, no apoio a políticas públicas de conservação e gestão ambiental e na promoção da ciência aberta, assegurando que os dados recolhidos sejam disponibilizados de forma contínua e acessível à comunidade científica e à sociedade em geral.

TRÊS LIÇÕES APRENDIDAS

Valor da colaboração interdisciplinar

A experiência demonstrou que a integração de diferentes áreas científicas — incluindo biologia, química, oceanografia e monitorização de cetáceos — constitui um fator determinante para a robustez e abrangência dos resultados obtidos. A colaboração interdisciplinar permite que variáveis distintas sejam analisadas em conjunto, oferecendo uma visão holística dos ecossistemas e aumentando a capacidade de resposta a questões ambientais complexas. Ao reunir especialistas com formações diversas, promove-se não apenas a complementaridade de competências, mas também a criação de sinergias que potenciam a inovação científica e a produção de conhecimento mais sólido. Esta abordagem integrada contribui para que os resultados não se limitem a perspetivas isoladas, mas reflitam a complexidade real dos sistemas naturais, tornando-os mais relevantes para a comunidade científica, para os decisores políticos e para a sociedade em geral.

Importância da estandardização de protocolos

A harmonização metodológica foi reconhecida como uma componente essencial para assegurar a transparência e a credibilidade da investigação.

Este processo de estandardização, está a ser adaptado ao contexto do CIIMAR WATCH, garantindo que os dados recolhidos sejam comparáveis entre diferentes equipas e interoperáveis em cenários nacionais e internacionais.

Planeamento estratégico da gestão de dados desde o início

A definição de planos de gestão de dados estruturados desde a fase inicial dos projetos foi reconhecida a nível institucional como essencial para garantir a credibilidade científica e a sustentabilidade da informação a longo prazo, implicando a integração de uma pessoa dedicada a este processo. Um planeamento estratégico desde o início permite antecipar necessidades, identificar potenciais desafios e estabelecer mecanismos claros para a recolha, armazenamento, documentação, preservação e disponibilização dos dados.

TRÊS DESAFIOS FUTUROS

Garantia da qualidade e interoperabilidade de dados históricos

A integração de séries temporais anteriores constitui um dos maiores desafios na gestão de dados ambientais e científicos. A recolha de dados realizada em diferentes períodos, por distintos grupos de investigação e com metodologias diversas, exige um esforço significativo de harmonização. É necessário superar discrepâncias nos métodos de amostragem, nos instrumentos utilizados e nos formatos de registo, assegurando consistência e comparabilidade. A qualidade dos dados históricos deve ser cuidadosamente verificada, de modo a garantir que possam ser integrados em bases de dados atuais sem comprometer a fiabilidade das análises. A interoperabilidade, por sua vez, implica que estes dados sejam estruturados e documentados de forma a permitir a sua reutilização em contextos nacionais e internacionais, reforçando o valor científico das séries temporais e ampliando o seu impacto na investigação e na tomada de decisão.

Sustentabilidade a longo prazo

A continuidade e fiabilidade dos dados dependem da existência de recursos técnicos, humanos e financeiros estáveis. A sustentabilidade a longo prazo exige não apenas financiamento adequado, mas também a criação de estruturas organizacionais que assegurem a manutenção das plataformas de recolha, armazenamento e disponibilização de dados. A formação contínua de profissionais especializados, como data stewards e técnicos de monitorização, é igualmente essencial para garantir que as práticas de gestão de dados evoluam em consonância com os avanços tecnológicos e científicos. Além disso, a sustentabilidade implica a definição de estratégias institucionais que assegurem a preservação da informação ao longo do tempo, evitando perdas e assegurando que os dados permaneçam acessíveis e utilizáveis para futuras gerações de investigadores e decisores.

Implementação de sistemas avançados de disponibilização

O desenvolvimento de plataformas tecnológicas que permitam o acesso em tempo real a dados ambientais representa um desafio tanto tecnológico como organizacional. A criação de sistemas geográficos interativos, capazes de disponibilizar mapas, séries temporais e indicadores atualizados, exige investimentos em infraestrutura digital, interoperabilidade de sistemas e segurança da informação. Estes sistemas devem ser concebidos para servir múltiplos públicos: investigadores, decisores políticos, gestores ambientais e cidadãos interessados. A disponibilização avançada de dados não só aumenta a transparência e a credibilidade da investigação, como também promove a ciência aberta e o envolvimento da sociedade na conservação ambiental. Contudo, a implementação destes sistemas requer coordenação institucional, definição clara de responsabilidades e integração de diferentes competências técnicas, assegurando que a informação seja não apenas acessível, mas também compreensível e útil para os diversos utilizadores.

CINCO QUESTÕES SOBRE GDI

Como define, implementa e avalia as práticas de gestão de dados de investigação?

A implementação das práticas de gestão de dados assenta em várias dimensões complementares. Em primeiro lugar, destaca-se a designação de data stewards e coordenadores de qualidade por habitat, assegurando que cada área de monitorização dispõe de responsáveis dedicados à verificação e harmonização dos dados. Este modelo descentralizado permite maior proximidade às especificidades de cada ecossistema e garante consistência metodológica. Paralelamente, procede-se à criação de protocolos estandardizados e guias de boas práticas, que funcionam como referenciais comuns para todos os grupos de investigação envolvidos. Estes documentos são fundamentais para assegurar transparência, comparabilidade e interoperabilidade dos dados. A implementação inclui ainda a estruturação de planos de gestão de dados institucionais, concebidos como instrumentos estratégicos que orientam todo o ciclo de vida da informação científica. Finalmente, a formação e sensibilização de investigadores para ciência aberta constitui um eixo central, promovendo a adoção de práticas responsáveis e sustentáveis de gestão de dados e incentivando a partilha em conformidade com os princípios FAIR.

A avaliação destas práticas é realizada através de diferentes mecanismos. No âmbito do programa CIIMAR WATCH por exemplo, foram conduzidas entrevistas qualitativas a investigadores, que permitiram identificar lacunas, padrões e necessidades específicas na GDI de cada área científica. A produção de outputs académicos, como teses e relatórios, contribui para caracterizar de forma sistemática as práticas existentes e para documentar os desafios enfrentados. Ao longo deste processo, recorre-se ao benchmarking com programas europeus e internacionais de referência, assegurando o alinhamento das práticas locais com padrões globais e tirando partido da experiência acumulada em iniciativas semelhantes. 

Quais os principais benefícios dessas práticas?

A adoção de práticas estruturadas de gestão de dados científicos gera um conjunto de benefícios que se refletem em diferentes dimensões da investigação e da sociedade. Em primeiro lugar, promove transparência e credibilidade científica, assegurando que os processos de recolha, tratamento e disponibilização da informação são claros, verificáveis e replicáveis. Esta transparência reforça a confiança da comunidade académica e dos stakeholders externos, incluindo decisores políticos, financiadores e cidadãos, que passam a reconhecer o valor e a fiabilidade dos resultados produzidos.

Um segundo benefício prende-se com a interoperabilidade e reutilização dos dados em múltiplos contextos. Ao serem estruturados e documentados de acordo com normas e protocolos estandardizados, os dados tornam-se comparáveis entre diferentes projetos e instituições, aumentando significativamente o seu valor científico. Esta capacidade de reutilização potencia novas análises, reduz redundâncias e amplia o impacto da informação, permitindo que os mesmos dados sirvam de base a investigações diversas e complementares.

Estas práticas apoiam também de forma direta políticas públicas e iniciativas de conservação ambiental, fornecendo informação fiável e atualizada para a tomada de decisão. A disponibilização de dados robustos e acessíveis contribui para que gestores ambientais e decisores políticos possam fundamentar estratégias de conservação, mitigação de impactos e gestão sustentável dos recursos naturais.

Por fim, a adoção de práticas de gestão de dados promove uma maior sensibilização e envolvimento da comunidade científica e educativa, fomentando uma cultura de responsabilidade e partilha. Investigadores, estudantes e instituições passam a reconhecer que os dados não são apenas recursos individuais, mas património coletivo que deve ser preservado e disponibilizado em conformidade com os princípios da ciência aberta. Esta cultura fortalece a cooperação interdisciplinar, estimula a formação de novas gerações de cientistas conscientes da importância da gestão responsável da informação e contribui para aproximar a ciência da sociedade.

Em que medida a gestão de dados de investigação contribui para a otimização do processo de investigação?

A gestão estruturada de dados exerce um impacto direto e significativo na otimização dos processos de investigação científica. Em primeiro lugar, permite a redução de redundâncias e inconsistências, assegurando maior eficiência na utilização da informação. Quando os dados são recolhidos, armazenados e documentados de forma sistemática, evita-se a duplicação de esforços e minimizam-se erros que poderiam comprometer a qualidade das análises. Esta racionalização traduz-se em ganhos de tempo e recursos, aumentando a produtividade das equipas de investigação.

Outro contributo relevante é a aceleração da produção científica e de relatórios ambientais. A organização e acessibilidade dos dados facilitam a elaboração de artigos, relatórios técnicos e documentos de apoio à gestão ambiental, permitindo que os investigadores respondam de forma mais célere às exigências da comunidade científica e dos decisores políticos. A disponibilidade imediata da informação torna os processos de análise mais ágeis e reduz os obstáculos associados à recolha dispersa ou desorganizada de dados.

A gestão estruturada de dados potencia também a integração de variáveis multidisciplinares, tornando mais simples a realização de análises abrangentes e inovadoras. A combinação de dados provenientes de diferentes áreas científicas — como biologia, química, oceanografia ou climatologia — permite construir modelos mais completos e responder a questões complexas com maior rigor. Esta integração interdisciplinar fortalece a capacidade de gerar conhecimento novo e relevante, ampliando o alcance e a aplicabilidade dos resultados.

Finalmente, estas práticas promovem a melhoria da fiabilidade e comparabilidade dos resultados, aumentando a robustez das conclusões científicas e a sua relevância internacional. Dados bem estruturados e documentados podem ser comparados com séries temporais de outros programas ou instituições, permitindo validar hipóteses e reforçar a credibilidade das investigações. A comparabilidade assegura que os resultados obtidos localmente possam ser integrados em redes internacionais de monitorização, ampliando o impacto da investigação e consolidando o papel das instituições envolvidas no panorama científico global.

Que vantagens e condicionantes aponta na partilha de dados de investigação?

Entre as principais vantagens da adoção de práticas estruturadas de gestão de dados, destaca-se a robustez científica que resulta da integração de diferentes áreas de conhecimento. A interdisciplinaridade, ao reunir contributos de domínios como biologia, química, oceanografia e ciências ambientais, permite análises mais completas e rigorosas, capazes de responder a questões complexas com maior profundidade. Esta diversidade metodológica e conceptual fortalece a qualidade dos resultados e amplia a sua relevância para a comunidade científica e para a sociedade.

A gestão estruturada de dados confere também credibilidade junto de decisores políticos e financiadores, demonstrando que os projetos seguem práticas rigorosas, transparentes e alinhadas com padrões internacionais. Essa credibilidade reforça o impacto institucional e aumenta a capacidade de atrair recursos, sejam eles financeiros, técnicos ou humanos. Acresce ainda a maior visibilidade e impacto institucional, posicionando a organização como referência na área da ciência aberta e da monitorização ambiental. A disponibilização de dados de forma transparente e reutilizável contribui para consolidar a reputação da instituição e para fortalecer a sua integração em redes científicas nacionais e internacionais.

Contudo, existem condicionantes que não podem ser ignoradas. A implementação destas práticas requer recursos humanos especializados, cuja formação contínua e retenção constituem desafios permanentes. A complexidade logística e tecnológica associada à recolha, armazenamento e disponibilização de dados exige investimentos constantes em infraestrutura digital, equipamentos e sistemas de suporte, garantindo que a informação seja preservada e acessível a longo prazo. Por fim, a eficácia do sistema depende da adesão voluntária e colaborativa dos grupos de investigação, o que implica um esforço contínuo de sensibilização, coordenação e alinhamento de práticas. Sem este compromisso coletivo, torna-se difícil assegurar a consistência e a interoperabilidade dos dados, limitando o potencial da gestão estruturada.

De que forma os diferentes atores envolvidos no processo de investigação estão comprometidos com a gestão de dados de investigação?

O sucesso das práticas de gestão de dados científicos depende de uma atuação articulada e complementar entre diferentes atores institucionais e sociais. Cada grupo desempenha funções específicas que, em conjunto, asseguram a qualidade, a sustentabilidade e o impacto da informação produzida.

Os investigadores constituem a base do processo, sendo responsáveis pela recolha e disponibilização dos dados. A sua participação ativa nos protocolos definidos e nas ações de formação é essencial para garantir que a informação gerada cumpre padrões de qualidade e se encontra devidamente documentada. Ao adotar práticas harmonizadas, os investigadores contribuem para que os dados sejam comparáveis e reutilizáveis, reforçando a credibilidade da investigação.

Os data stewards desempenham um papel central na coordenação da gestão de dados. Cabe-lhes verificar a qualidade da informação, assegurar a conformidade com protocolos estandardizados e promover a harmonização metodológica entre diferentes grupos de investigação. A sua função garante que os dados não apenas são recolhidos, mas também estruturados e preservados de forma adequada, permitindo a sua utilização a longo prazo.

A coordenação científica assume a responsabilidade de definir prioridades estratégicas e supervisionar a integração interdisciplinar. Este nível de coordenação assegura que os objetivos do programa são claros e que os diferentes contributos científicos convergem para resultados robustos e relevantes. A supervisão interdisciplinar é particularmente importante em programas que envolvem múltiplas áreas de conhecimento, garantindo coerência e consistência na produção científica.

A instituição desempenha um papel de suporte fundamental, fornecendo recursos logísticos, financeiros e organizacionais. É a instituição que cria as condições para a sustentabilidade das práticas de gestão de dados, assegurando que existem meios técnicos e humanos adequados para manter a continuidade do programa. O seu compromisso institucional é determinante para que a gestão de dados seja reconhecida como um eixo estratégico e não apenas como uma atividade acessória.

Os estudantes e a comunidade científica participam em projetos de formação e sensibilização, contribuindo para a disseminação de boas práticas. A sua integração nos processos de gestão de dados promove a renovação de competências e garante que novas gerações de investigadores estão preparadas para lidar com os desafios da ciência aberta e da gestão responsável da informação.

Finalmente, os stakeholders externos, incluindo decisores políticos e sociedade civil, desempenham um papel crucial na valorização e aplicação dos dados. Ao utilizarem a informação científica para fundamentar decisões e promover a conservação ambiental, reforçam o impacto social da investigação. A ligação entre ciência e sociedade é fortalecida quando os dados são disponibilizados de forma transparente e acessível, permitindo que sejam utilizados para enfrentar desafios ambientais e apoiar políticas públicas.

 

 

DESCRIÇÃO

O projeto de doutoramento em curso tem como foco central o desenvolvimento de um sistema inovador de monitorização remota para idosos, concebido para responder às necessidades específicas de uma população frequentemente vulnerável, sobretudo aqueles que residem em regiões mais isoladas e que dependem, em grande medida, de cuidadores informais ou familiares. Trata-se de um esforço científico e tecnológico que procura conciliar duas dimensões fundamentais: por um lado, a segurança e o acompanhamento contínuo dos idosos; por outro, a proteção da sua privacidade e dignidade, assegurando que o processo de recolha e utilização de dados não compromete direitos individuais.

Para atingir estes objetivos, o sistema recorre a sensores ambientais e a imagens de profundidade, em detrimento de imagens convencionais RGB. Esta opção metodológica é particularmente relevante, uma vez que as imagens de profundidade permitem captar padrões de movimento e comportamento sem revelar características físicas identificáveis, como traços faciais ou detalhes pessoais. Assim, garante-se que o monitoramento é eficaz na deteção de situações de risco, mas não invasivo, preservando a identidade dos indivíduos.

O sistema foi concebido para detetar precocemente situações de emergência, como quedas ou movimentos que possam indicar risco iminente, emitindo alertas automáticos para familiares, cuidadores ou profissionais de saúde. Esta funcionalidade tem como objetivo reduzir o tempo de resposta em situações críticas, aumentando a probabilidade de intervenção rápida e eficaz.

Um dos principais resultados esperados do projeto é a criação de um dataset público, cuidadosamente estruturado e anonimizado, que se distingue pela sua relevância científica e social. Este dataset é composto por gravações de ações quotidianas — como caminhar, sentar, levantar ou pegar em objetos — e por simulações de quedas, abrangendo um conjunto de cerca de vinte ações distintas. A disponibilização deste recurso pretende colmatar uma lacuna existente na área, uma vez que não há datasets atualizados e específicos que possam ser utilizados para treinar algoritmos de predição de quedas e padrões de comportamento em idosos.

A criação deste dataset público tem uma dupla finalidade: por um lado, servir de base ao treino e validação dos algoritmos de inteligência artificial desenvolvidos no âmbito do projeto; por outro, promover a reutilização por outros investigadores, incentivando a partilha de conhecimento e a colaboração científica. Ao disponibilizar dados de forma transparente e acessível, o projeto contribui para o avanço da investigação em áreas como saúde digital, envelhecimento ativo e monitorização remota, reforçando os princípios da ciência aberta.

TRÊS LIÇÕES APRENDIDAS

Centralidade da ética e da privacidade

A investigação científica que envolve dados humanos, em particular dados pessoais e ligados a condições de saúde, coloca inevitavelmente a ética e a privacidade no centro das suas preocupações. Trabalhar com este tipo de informação exige não apenas o cumprimento rigoroso de regulamentos como o Regulamento Geral de Proteção de Dados (RGPD), mas também um compromisso profundo com o respeito pela dignidade das pessoas envolvidas. A proteção da identidade e da integridade dos participantes é um princípio estruturante que deve orientar todas as fases do projeto, desde a conceção até à divulgação dos resultados. Neste contexto, a submissão do projeto ao comité de ética revelou-se uma etapa essencial, não apenas como requisito formal, mas como mecanismo de validação das práticas adotadas. Este processo permitiu identificar potenciais fragilidades, reforçar a confiança dos participantes voluntários e assegurar que a investigação decorre dentro de padrões elevados de responsabilidade e transparência. Assim, a dimensão ética não é apenas um requisito legal, mas um elemento que confere credibilidade científica e social ao trabalho desenvolvido.

Planeamento da gestão de dados desde o início

Paralelamente, a experiência demonstrou que o planeamento da gestão de dados desde o início é determinante para garantir a sua reutilização e relevância futura. A ausência de planeamento inicial compromete seriamente a utilidade dos datasets, tornando-os menos transparentes e dificultando a sua integração em novos projetos. Por isso, é fundamental que a documentação, a organização e a padronização sejam definidas antes da recolha, estabelecendo regras claras para nomeação de ficheiros, armazenamento seguro e anonimização dos dados. Este cuidado inicial assegura que os datasets não apenas cumprem requisitos de qualidade, mas também se tornam reutilizáveis e interoperáveis, permitindo que outros investigadores possam beneficiar da informação produzida sem necessidade de repetir processos ou recolher novamente dados junto dos participantes. 

Flexibilidade na investigação aplicada

Por fim, a investigação aplicada, sobretudo quando envolve voluntários, exige uma elevada capacidade de flexibilidade. Projetos desta natureza implicam lidar com imprevistos, ritmos distintos entre participantes e desafios logísticos que não podem ser totalmente antecipados. A organização de sessões de recolha de dados, a disponibilidade de espaços adequados ou a coordenação de voluntários são exemplos de aspetos que frequentemente exigem ajustamentos. A capacidade de adaptação revelou-se fundamental para garantir a continuidade e a qualidade da investigação, permitindo que os objetivos sejam alcançados mesmo em contextos dinâmicos e imprevisíveis. Esta flexibilidade não diminui o rigor científico; pelo contrário, assegura que a investigação se mantém relevante e eficaz, respondendo às exigências do mundo real e às particularidades de cada participante. Trabalhar com pessoas significa lidar com variabilidade e complexidade, e é precisamente nesta capacidade de adaptação que reside a força da investigação aplicada e a boa recolha de dados.

TRÊS DESAFIOS FUTUROS

Garantia da interoperabilidade e reutilização dos dados

A investigação científica contemporânea enfrenta o desafio de assegurar a interoperabilidade e reutilização dos dados produzidos. A criação de datasets não pode ser vista apenas como um resultado imediato de um projeto, mas como um recurso de longo prazo que deve manter padrões elevados de qualidade, consistência e anonimização. Para que os dados possam ser utilizados por outros investigadores, é fundamental que sejam estruturados de forma clara, documentados com rigor e acompanhados de metadados que permitam compreender o seu contexto de produção. A interoperabilidade garante que os datasets possam ser integrados em diferentes sistemas e comparados com outras séries temporais, ampliando o seu valor científico e evitando que a informação se torne obsoleta ou limitada ao âmbito restrito de um único estudo.

Sustentabilidade da informação sensível

A par desta preocupação, surge a necessidade de assegurar a sustentabilidade da informação sensível. A preservação de dados humanos, especialmente quando relacionados com saúde ou comportamento, exige cuidados adicionais de natureza técnica e legal. É imprescindível garantir que os dados sejam armazenados em sistemas seguros, protegidos contra acessos não autorizados e preservados de forma a manter a sua integridade ao longo do tempo. A sustentabilidade implica também assegurar que os dados permanecem acessíveis e utilizáveis, mesmo após o término dos projetos que lhes deram origem. Este compromisso requer investimentos contínuos em infraestrutura tecnológica, formação de profissionais especializados e definição de políticas institucionais que assegurem a longevidade da informação. Só assim é possível garantir que os dados sensíveis não apenas sobrevivem ao ciclo de vida imediato da investigação, mas continuam a ser recursos valiosos para futuras gerações de cientistas e decisores.

Promoção da partilha colaborativa de dados

Finalmente, a criação de datasets públicos deve ser acompanhada por uma estratégia clara de promoção da partilha colaborativa de dados. A disponibilização aberta da informação não é suficiente por si só; é necessário fomentar práticas que incentivem a colaboração internacional, evitando duplicação de esforços e fortalecendo a ciência aberta. A partilha colaborativa permite que investigadores de diferentes instituições e países utilizem os mesmos recursos, ampliando o impacto da investigação e promovendo sinergias entre projetos. Além disso, contribui para reduzir a necessidade de recolher novamente dados junto de participantes, minimizando a intrusão e respeitando a dignidade das pessoas envolvidas. A ciência aberta, apoiada por datasets públicos e colaborativos, reforça a transparência, aumenta a credibilidade da investigação e promove uma cultura de responsabilidade coletiva na produção e utilização do conhecimento.

CINCO QUESTÕES SOBRE GDI

Como define, implementa e avalia as práticas de gestão de dados de investigação?

A implementação das práticas de gestão de dados no projeto foi estruturada de forma progressiva, incorporando aprendizagens obtidas ao longo do processo. Após uma experiência inicial marcada por limitações na reutilização da informação, tornou-se evidente a necessidade de desenvolver planos de gestão de dados claros e consistentes. Estes planos passaram a orientar todas as etapas da recolha e organização da informação, assegurando que os datasets criados fossem não apenas úteis para o investigador principal, mas também reutilizáveis por outros membros da comunidade científica.

Um dos aspetos centrais da implementação foi a definição prévia de regras de nomeação, armazenamento e anonimização dos vídeos. Cada gravação foi cuidadosamente catalogada, seguindo convenções estabelecidas que permitiam identificar ações específicas sem comprometer a privacidade dos participantes. O armazenamento foi realizado em repositórios físicos, evitando o uso de plataformas em nuvem que poderiam representar riscos adicionais de segurança e de eventual exposição indevida dos dados. A anonimização constituiu uma prioridade, garantindo que não existisse qualquer possibilidade de rastreio ou identificação dos voluntários envolvidos.

Outro passo fundamental foi a submissão do projeto ao comité de ética, assegurando que todas as práticas adotadas estavam em conformidade com regulamentos nacionais e internacionais. Este processo não só reforçou a credibilidade científica do trabalho, como também permitiu identificar e corrigir potenciais fragilidades na gestão dos dados, fortalecendo a confiança dos participantes e da instituição.

No que respeita à avaliação das práticas de gestão de dados, o primeiro momento crítico foi a identificação de falhas na criação do dataset original, que não cumpria plenamente os requisitos de reutilização e interoperabilidade. A correção dessas falhas no segundo dataset representou uma evolução significativa, demonstrando a importância da aprendizagem contínua e da adaptação metodológica.

A avaliação incluiu ainda a validação ética e institucional das práticas, confirmando que os procedimentos seguiam padrões de qualidade e responsabilidade. Este processo de validação foi essencial para consolidar a confiança na investigação e para assegurar que os dados produzidos poderiam ser partilhados de forma segura e transparente.

Quais os principais benefícios dessas práticas?

A organização e reutilização dos dados constituem elementos centrais para aumentar a eficiência científica e garantir que a informação recolhida cumpre o seu verdadeiro propósito. Quando os dados são devidamente estruturados, documentados e armazenados, tornam-se mais fáceis de consultar, analisar e integrar em novos projetos. Esta organização evita redundâncias, reduz inconsistências e assegura que o esforço investido na recolha inicial não se perde, mas se transforma num recurso duradouro. A reutilização, por sua vez, amplia o impacto da investigação, permitindo que os mesmos dados sejam aplicados em diferentes contextos e por diversos investigadores, potenciando novas descobertas sem necessidade de repetir processos dispendiosos e intrusivos.

A adoção destas práticas promove também transparência e credibilidade, fatores essenciais para consolidar a confiança da comunidade científica e dos stakeholders externos. A clareza nos métodos de recolha, tratamento e disponibilização dos dados garante que os resultados obtidos podem ser verificados e replicados, reforçando a robustez das conclusões. Esta transparência não beneficia apenas o investigador responsável, mas tem um impacto positivo para outros investigadores que passam a ter acesso a informação fiável e bem documentada. A credibilidade científica é, assim, fortalecida, posicionando os projetos que seguem estas práticas como referências de qualidade e responsabilidade.

A criação de datasets públicos representa um contributo decisivo para ampliar o valor coletivo da investigação. Ao disponibilizar dados de forma aberta e acessível, promove-se a ciência colaborativa e evita-se a duplicação de esforços, permitindo que diferentes equipas e instituições utilizem os mesmos recursos para responder a questões diversas. Estes datasets públicos tornam-se património científico partilhado, fomentando a interdisciplinaridade, incentivando colaborações internacionais e reforçando os princípios da ciência aberta. Além disso, contribuem para reduzir a necessidade de recolher novamente dados junto de participantes.

Em que medida a gestão de dados de investigação contribui para a otimização do processo de investigação?

A adoção de práticas estruturadas de gestão de dados tem efeitos diretos e significativos na redução de redundâncias e inconsistências, evitando a necessidade de recolhas repetidas e assegurando maior eficiência científica. Quando os dados são devidamente organizados e documentados, tornam-se mais fáceis de consultar e reutilizar, permitindo que os investigadores aproveitem plenamente a informação já existente. Este processo não só poupa tempo e recursos, como também diminui a probabilidade de erros ou duplicações, garantindo que os resultados obtidos são consistentes e fiáveis. A racionalização da recolha e utilização dos dados traduz-se, assim, em ganhos concretos para a investigação, aumentando a produtividade e a qualidade das análises realizadas.

Outro contributo fundamental destas práticas é a aceleração do treino e validação de algoritmos de inteligência artificial. A disponibilidade de datasets bem estruturados e anonimizados permite que os modelos sejam treinados de forma mais rápida e eficaz, sem necessidade de criar continuamente novas bases de dados. A qualidade e a organização da informação facilitam o processo de validação, assegurando que os algoritmos podem ser testados em condições robustas e replicáveis. Este fator é particularmente relevante em áreas como a saúde digital ou a monitorização remota, onde a fiabilidade dos algoritmos é determinante para garantir segurança e confiança nos resultados. Ao acelerar o treino e a validação, estas práticas contribuem para reduzir o tempo entre a investigação e a aplicação prática, tornando os avanços tecnológicos mais acessíveis e úteis.

A gestão estruturada de dados facilita a transição dos resultados para ambientes reais, aumentando a sua aplicabilidade e impacto social. A existência de datasets organizados e reutilizáveis permite que os sistemas desenvolvidos em contexto académico sejam mais facilmente adaptados a cenários concretos, como casas de idosos ou instituições de saúde. Esta transição é essencial para que a investigação não permaneça confinada ao laboratório, mas se traduza em soluções práticas que respondam a necessidades sociais urgentes. Ao garantir que os dados são fiáveis, transparentes e reutilizáveis, cria-se uma ponte entre ciência e sociedade, promovendo a inovação tecnológica e reforçando o impacto positivo da investigação na vida das pessoas.

Que vantagens e condicionantes aponta na partilha de dados de investigação?

A adoção de práticas rigorosas de gestão de dados científicos apresenta um conjunto significativo de vantagens que reforçam a qualidade e o impacto da investigação. Em primeiro lugar, destaca-se a robustez científica, resultante da aplicação de metodologias consistentes e da observância de princípios éticos. A credibilidade é fortalecida quando os dados são recolhidos, tratados e disponibilizados de forma transparente, permitindo que os resultados sejam verificados e replicados por outros investigadores. Esta confiança, sustentada por práticas éticas, posiciona os projetos como referências de qualidade e responsabilidade, aumentando a sua relevância no panorama científico.

Outro benefício reside no potencial para colaborações internacionais, que se torna mais evidente quando os dados são organizados e disponibilizados em formatos interoperáveis. A partilha de datasets estruturados e anonimizados facilita a integração em redes científicas globais, promovendo sinergias entre instituições e ampliando o alcance dos resultados. Este fator contribui para um maior impacto institucional, reforçando a visibilidade das organizações envolvidas e consolidando a sua posição como atores relevantes na produção de conhecimento.

A gestão de dados representa ainda um contributo direto para a ciência aberta e para a inovação tecnológica. Ao disponibilizar datasets públicos e reutilizáveis, promove-se a transparência e a democratização do acesso à informação, permitindo que diferentes comunidades científicas e tecnológicas utilizem os mesmos recursos para desenvolver novas soluções. Esta prática não só acelera o avanço da investigação, como também fomenta a inovação em áreas aplicadas, aumentando o impacto social da ciência.

Contudo, estas vantagens são acompanhadas por condicionantes que não podem ser ignoradas. A implementação de práticas robustas exige a disponibilidade de recursos humanos especializados, capazes de lidar com questões técnicas e éticas complexas. A formação e retenção destes profissionais constituem desafios permanentes, essenciais para garantir a qualidade e sustentabilidade da gestão de dados.

A complexidade logística e tecnológica é outro fator condicionante, uma vez que a recolha, armazenamento e anonimização de dados implicam investimentos contínuos em infraestrutura digital, equipamentos e sistemas de segurança. Estes processos exigem planeamento detalhado e capacidade de adaptação, de modo a assegurar que os dados permanecem íntegros e acessíveis ao longo do tempo.

Por fim, a eficácia da gestão de dados depende da conformidade legal e da colaboração voluntária dos participantes. O cumprimento rigoroso das normas jurídicas e éticas é indispensável para proteger os direitos individuais, mas implica também um esforço constante de sensibilização e envolvimento dos voluntários. Sem esta adesão colaborativa, torna-se difícil garantir a consistência e a representatividade dos datasets, limitando o seu potencial científico e social.

De que forma os diferentes atores envolvidos no processo de investigação estão comprometidos com a gestão de dados de investigação?

Os investigadores desempenham um papel central, sendo responsáveis pela recolha, organização e disponibilização dos dados. Cabe-lhes garantir que a informação é obtida de forma rigorosa, documentada e conforme os protocolos estabelecidos, assegurando que os datasets criados possam ser utilizados tanto no presente como em futuras investigações. A sua participação ativa é essencial para que os dados sejam credíveis e representativos, constituindo a base sobre a qual se constrói todo o processo científico.

A coordenação científica e os orientadores têm como responsabilidade supervisionar prioridades estratégicas e assegurar a conformidade ética do processo. Este nível de coordenação garante que os objetivos da investigação estão alinhados com as necessidades institucionais e sociais, promovendo a integração interdisciplinar e reforçando a credibilidade dos resultados. A supervisão ética e metodológica constitui um elemento essencial para que a investigação decorra dentro de padrões elevados de responsabilidade.

A instituição desempenha um papel de suporte fundamental, fornecendo recursos logísticos, financeiros e organizacionais. É a instituição que cria as condições para a sustentabilidade das práticas de gestão de dados, disponibilizando infraestruturas adequadas e promovendo formação especializada para investigadores e técnicos. O compromisso institucional é determinante para que a gestão de dados seja reconhecida como uma prioridade estratégica e não apenas como uma atividade acessória.

Os estudantes e a comunidade científica participam em projetos de sensibilização e disseminação de boas práticas, contribuindo para a renovação de competências e para a consolidação de uma cultura de responsabilidade partilhada. 

Por fim, os stakeholders externos, incluindo cuidadores, decisores políticos e sociedade civil, utilizam os dados para fundamentar decisões e promover impacto social. A disponibilização de informação fiável e transparente permite que políticas públicas sejam melhor informadas, que práticas de cuidado sejam mais eficazes e que a sociedade reconheça o valor da investigação científica. Esta ligação entre ciência e sociedade reforça o impacto social da investigação e legitima o investimento em práticas de gestão de dados robustas e sustentáveis.

 

 

PROJETO

Projeto de Doutoramento sobre Monitorização Remota de ldosos

ENTIDADES

Instituto Politécnico de Bragança

INVESTIGADORA
ENTREVISTADA
A INVESTIGADORA
RESPONDE

(Vídeo disponível em breve)

CINCO QUESTÕES SOBRE GDI

DOMÍNIOS CIENTÍFICOS

Engenharia e Tecnologia

ETAPAS DO CICLO DE VIDA DOS DADOS

Processamento

Preservação

Reutilização

DATA DE RECOLHA

Novembro de 2025

Como transformar a gestão de dados de investigação de obrigação burocrática em ferramenta estratégica?

De que forma a formação inicial pode garantir que futuras gerações de investigadores adotem estas práticas naturalmente?

Que mecanismos podem reforçar o reconhecimento e a integridade na reutilização de dados em acesso aberto?

DESCRIÇÃO

A gestão de dados de investigação e a sua abertura à comunidade científica e a outras comunidades interessadas tem vindo a ganhar crescente relevância e era uma temática já conhecida, nomeadamente através da experiência de participação em projetos Twinning.

Contudo, o marco decisivo neste processo ocorreu com a aprovação de um projeto  na Universidade de Aveiro centrado na análise epigenética e que envolve dados de sequenciação, tradicionalmente depositados em plataformas internacionais amplamente utilizadas. Estes dados são frequentemente reutilizados por diversos investigadores, permitindo novas abordagens a problemas já estudados ou a questões emergentes, reforçando o valor da partilha e da reutilização da informação científica.

O projeto EPIBOOST – BOOSting excellence in environmental EPIgenetics está enquadrado no Programa Horizonte Europa que tornou a prática de acesso abeto aos dados obrigatória. Este enquadramento institucional trouxe novos desafios formais, exigindo maior rigor na implementação das boas práticas de gestão de dados e no cumprimento das obrigações estabelecidas nos grant agreements.

O processo coincidiu, igualmente, com a entrada em funcionamento do repositório institucional da Universidade de Aveiro, que não estava inicialmente previsto nos planos de gestão de dados, mas que acabou por ser integrado. Esta integração representou simultaneamente um desafio e uma oportunidade: permitiu alinhar práticas institucionais com as exigências europeias e criar condições para aprendizagem conjunta entre investigadores e equipas técnicas, num contexto em que a linguagem e a estruturação dos planos de gestão de dados ainda correspondiam obstáculos, no sentido em que os investigadores estavam pouco familiarizados com estes novos requisitos.

A decisão de privilegiar o repositório institucional reforçou a aposta na capacitação, objetivo central dos projetos Twinning. Estes projetos não se limitam ao desenvolvimento científico, mas promovem igualmente competências transversais, incluindo a gestão da ciência e dos dados de investigação. 

A experiência de implementação das práticas de gestão de dados de investigação no contexto do Horizonte Europa revelou-se exigente, mas também profundamente enriquecedora. Num cenário em que os fluxos institucionais ainda não estavam plenamente definidos, os investigadores pouco treinados e o apoio especializado limitado, o processo constituiu uma oportunidade de aprendizagem coletiva. Apesar das dificuldades iniciais e da perceção de que se tratava de mais uma exigência burocrática, a prática demonstrou o seu valor e contribuiu para a criação de uma cultura mais sólida e eficiente de gestão de dados.

TRÊS LIÇÕES APRENDIDAS

A prática desmistifica a perceção burocrática

A gestão de dados de investigação só se torna clara e compreensível quando é efetivamente praticada. O contacto direto com os requisitos e procedimentos permitiu ultrapassar a ideia inicial de que se tratava apenas de uma obrigação administrativa sem benefícios. A experiência mostrou que, ao experimentar e aplicar, é possível reconhecer o potencial e as vantagens da gestão estruturada de dados, transformando-a de um fardo numa ferramenta útil.

Fluxos de registo estruturados aumentam a eficiência

A ausência de fluxos claros de registo e organização de dados gera perdas de tempo e descontinuidade nos projetos, sobretudo quando há rotatividade de investigadores. A implementação de processos formais, como a preparação de dossiês para depósito em acesso aberto, revelou-se uma estratégia eficaz para monitorizar o progresso da investigação e assegurar continuidade. Estes fluxos não apenas reduzem falhas, como também tornam a própria investigação mais eficiente e transparente.

Capacitação gera cultura e sustentabilidade

A obrigatoriedade de adotar boas práticas de gestão de dados impulsionou a formação da equipa e estimulou a criação de hábitos que beneficiarão as gerações futuras de investigadores. O treino e a adaptação inicial, embora exigentes, abriram caminho para que os novos investigadores encarem estas práticas como parte natural do processo científico. Assim, a experiência não só fortaleceu a equipa atual, como contribuiu para institucionalizar uma cultura de gestão de dados que assegura maior eficiência e sustentabilidade da investigação.

TRÊS DESAFIOS FUTUROS

Reforço do apoio institucional especializado

Um dos principais obstáculos prende-se com a ausência de equipas dedicadas de data stewards capazes de apoiar coordenadores e gestores de projetos, sobretudo em consórcios internacionais de grande dimensão. A inexistência deste suporte técnico coloca sobre os investigadores responsabilidades para as quais não estão plenamente preparados, como a definição de vocabulários ou a harmonização de práticas entre parceiros. O futuro exige que as instituições invistam em estruturas estáveis de apoio especializado, garantindo consistência e qualidade na gestão de dados.

Integração da formação em currículos académicos

A gestão de dados de investigação deve ser incorporada desde cedo nos percursos formativos, começando na licenciatura e aprofundando-se no mestrado e doutoramento. A ausência desta preparação inicial faz com que os investigadores encarem estas práticas como exigências adicionais e burocráticas. Ao contrário, se forem treinados desde o início, adotarão naturalmente estas metodologias como parte integrante da investigação, tornando os processos mais eficientes e sustentáveis. Este desafio implica uma mudança curricular e pedagógica significativa.

Reconhecimento e proteção da autoria dos dados

Apesar das vantagens do acesso aberto, subsiste um conflito entre o esforço de quem gera dados e a reutilização por terceiros sem o devido reconhecimento. A falta de mecanismos eficazes para garantir citações e rastrear reutilizações fragiliza a confiança dos investigadores e cria barreiras psicológicas à abertura. O futuro passa por desenvolver ferramentas e práticas que assegurem integridade e reconhecimento, promovendo a cultura de que um dataset tem o mesmo valor e estatuto de uma publicação científica.

Estes três desafios — apoio institucional especializado, formação académica estruturada e reconhecimento da autoria dos dados — representam pontos críticos para a consolidação de uma cultura de gestão de dados robusta e sustentável. Enfrentá-los será determinante para que as instituições e os investigadores possam não apenas cumprir requisitos formais, mas também transformar a gestão de dados num verdadeiro motor de eficiência, colaboração e inovação científica.

CINCO QUESTÕES SOBRE GDI

Como define, implementa e avalia as práticas de gestão de dados de investigação?

A implementação de boas práticas na gestão de dados de investigação exige uma abordagem estruturada e integrada, capaz de responder às exigências formais dos financiadores e, ao mesmo tempo, de promover eficiência e qualidade nos processos científicos.

Um primeiro passo fundamental consiste na definição de fluxos claros, através da criação de dossiês e templates específicos para o depósito de dados. Esta prática assegura uniformidade e continuidade, permitindo que diferentes investigadores ou equipas possam dar seguimento ao trabalho sem perda de informação ou inconsistência nos registos.

Complementarmente, a formação prática (hands-on) revela-se essencial. Ao utilizar os próprios dados dos investigadores em exercícios de depósito e gestão, o processo torna-se mais concreto e aplicável, facilitando a aprendizagem e a apropriação das metodologias. Esta abordagem prática contribui para desmistificar a perceção de burocracia e reforça a utilidade da gestão de dados como ferramenta de apoio à investigação.

Outro elemento crítico é a integração institucional, que passa pela implementação de repositórios institucionais e pelo alinhamento com os requisitos formais dos financiadores, como os estabelecidos no Horizonte Europa. Esta integração garante não apenas conformidade legal e contratual, mas também reforça a credibilidade da instituição e a sua capacidade de participar em projetos internacionais de grande dimensão.

Por fim, a avaliação contínua desempenha um papel central na consolidação destas práticas. A monitorização da eficácia deve ser realizada através da análise da capacidade de reutilização dos dados, da adesão das equipas e da redução de falhas nos processos de investigação. Este acompanhamento permite identificar pontos de melhoria, ajustar estratégias e assegurar que a gestão de dados evolui em consonância com as necessidades da comunidade científica e com as exigências regulatórias.

Quais os principais benefícios dessas práticas?

A adoção de práticas estruturadas de gestão de dados de investigação tem demonstrado benefícios claros tanto para os investigadores como para as instituições.

Um dos aspetos mais relevantes é a desmistificação do processo. Ao serem aplicadas de forma sistemática, estas práticas deixam de ser percecionadas como meros requisitos burocráticos e passam a ser entendidas como ferramentas úteis, capazes de apoiar diretamente a investigação. Esta mudança de perceção é essencial para promover a adesão e para consolidar uma cultura de dados mais madura e eficiente.

Outro benefício evidente é a eficiência. A existência de registos claros e fluxos definidos reduz significativamente as perdas de tempo associadas à rotatividade de investigadores e à ausência de documentação estruturada. Com dados organizados e acessíveis, torna-se possível assegurar continuidade nos projetos, evitando duplicação de esforços e facilitando a interpretação e prosseguimento do trabalho por diferentes membros da equipa.

A capacitação constitui igualmente um resultado central. A implementação destas práticas promove o desenvolvimento de competências transversais em investigadores e técnicos, fortalecendo a cultura institucional e criando condições para que futuras gerações de cientistas integrem naturalmente a gestão de dados nos seus processos de trabalho. Este investimento em formação e prática contribui para a sustentabilidade e para a qualidade da investigação a longo prazo.

Por fim, destaca-se a conformidade com as exigências legais e contratuais dos financiadores. O cumprimento rigoroso destas normas não só evita riscos de incumprimento, como reforça a credibilidade das instituições e a sua capacidade de participar em projetos internacionais competitivos. A gestão de dados, neste sentido, deixa de ser apenas uma obrigação formal e passa a representar uma vantagem estratégica.

Em que medida a gestão de dados de investigação contribui para a otimização do processo de investigação?

O impacto da gestão estruturada de dados na otimização do processo de investigação é significativo e multifacetado, refletindo-se diretamente na eficiência e na qualidade dos resultados científicos.

Em primeiro lugar, destaca-se a continuidade. A existência de fluxos de registo bem definidos permite que diferentes membros da equipa avancem sem interrupções, mesmo em contextos de rotatividade ou substituição de investigadores. Esta prática assegura que o conhecimento acumulado não se perde e que o trabalho pode prosseguir de forma consistente e integrada.

A monitorização constitui outro benefício central. Dossiês e planos de gestão de dados funcionam como ferramentas de acompanhamento do progresso científico, permitindo avaliar etapas concluídas, identificar lacunas e garantir que os objetivos do projeto são cumpridos. Esta capacidade de acompanhamento sistemático fortalece a transparência e facilita a tomada de decisões estratégicas.

No que respeita à qualidade, a organização e acessibilidade dos dados aumentam a fiabilidade dos resultados e abrem espaço para novas abordagens investigativas. Dados bem estruturados não apenas reduzem erros e inconsistências, como também potenciam a reutilização e a exploração de hipóteses adicionais, ampliando o impacto da investigação.

Por fim, a agilidade é um efeito direto da formação adequada dos investigadores. Quando estes dominam as práticas de gestão de dados, conseguem integrá-las naturalmente no seu trabalho, sem atrasos adicionais ou perceção de burocracia. A gestão de dados torna-se, assim, parte integrante do processo científico, contribuindo para maior rapidez e eficiência na produção de conhecimento.

Em conjunto, estes elementos demonstram que a gestão de dados não é apenas um requisito formal, mas um fator determinante para a otimização da investigação, assegurando continuidade, monitorização rigorosa, qualidade acrescida e maior agilidade na execução dos projetos.

Que vantagens e condicionantes aponta na partilha de dados de investigação?

A gestão de dados de investigação apresenta um conjunto de vantagens que reforçam a qualidade e a sustentabilidade da ciência, mas também enfrenta condicionantes que exigem atenção e investimento estratégico por parte das instituições.

Entre as principais vantagens, destaca-se a maior eficiência e transparência nos processos científicos. A adoção de fluxos claros e práticas de registo estruturado permite reduzir falhas, assegurar continuidade e tornar os resultados mais fiáveis e acessíveis. Paralelamente, a implementação destas práticas contribui para a formação de novas gerações de investigadores, que desde cedo se adaptam às exigências da gestão de dados e passam a encarar estas metodologias como parte natural da investigação. Este processo formativo garante que, no futuro, a cultura de dados estará plenamente integrada nas rotinas científicas.

Outro benefício relevante é o reforço da credibilidade institucional e da competitividade em projetos internacionais. Instituições que demonstram capacidade de gerir dados de forma eficiente e conforme às exigências dos financiadores posicionam-se melhor para liderar ou integrar consórcios de grande dimensão, aumentando a sua visibilidade e relevância no panorama científico global.

Contudo, estas vantagens são acompanhadas por condicionantes que não podem ser ignorados. A falta de recursos humanos especializados, nomeadamente data stewards, limita a capacidade de apoio técnico e coloca sobre os investigadores responsabilidades adicionais para as quais nem sempre estão preparados. A isto somam-se os custos elevados de formação e a resistência inicial dos investigadores, que muitas vezes percecionam a gestão de dados como uma exigência burocrática sem benefícios imediatos.

Existe ainda um conflito psicológico e cultural em torno da abertura e reutilização dos dados sem reconhecimento adequado. Muitos investigadores sentem que o esforço investido na produção de dados não é devidamente valorizado quando estes são reutilizados sem citação, o que gera barreiras à plena adesão ao acesso aberto.

 Finalmente, a necessidade de políticas institucionais claras e obrigatórias surge como um fator crítico: sem diretrizes firmes e consistentes, a adesão tende a ser desigual e dependente da motivação individual, comprometendo a eficácia das práticas.

Em síntese, a gestão de dados de investigação oferece ganhos significativos em eficiência, formação e credibilidade, mas só poderá atingir o seu pleno potencial se forem enfrentados os desafios relacionados com recursos humanos, formação, cultura científica e políticas institucionais.

De que forma os diferentes atores envolvidos no processo de investigação estão comprometidos com a gestão de dados de investigação?

O papel dos diferentes atores na gestão de dados de investigação é determinante para assegurar a eficácia, a sustentabilidade e a credibilidade das práticas adotadas. Cada interveniente contribui de forma complementar para a criação de uma cultura sólida de dados, capaz de responder às exigências científicas e institucionais.

As instituições têm a responsabilidade de garantir recursos humanos dedicados, definir perfis funcionais específicos e investir em programas de formação contínua. Além disso, devem criar políticas claras e obrigatórias que assegurem a adesão dos investigadores e promovam a integração da gestão de dados como parte essencial da atividade científica.

Os investigadores desempenham um papel central ao adotar práticas de gestão desde o início das suas carreiras, participando em formações e contribuindo para a consolidação da cultura de dados. A sua adesão e envolvimento são fundamentais para que estas práticas deixem de ser percecionadas como burocráticas e passem a ser encaradas como ferramentas de apoio à investigação.

Os data stewards assumem uma função técnica especializada, apoiando os projetos na definição de vocabulários, na harmonização de procedimentos e na garantia da qualidade dos planos de gestão. A sua intervenção é essencial para assegurar consistência e rigor, sobretudo em consórcios internacionais de grande dimensão.

Os financiadores têm igualmente um papel estratégico, ao definir requisitos claros e promover a cultura de dados como parte integrante da investigação. Ao estabelecer normas e critérios de avaliação, contribuem para que a gestão de dados seja reconhecida como elemento indispensável à qualidade e à transparência científica.

Por fim, os centros de competências oferecem formação inicial e contínua, adaptada às necessidades dos investigadores e à evolução das regras de financiamento. Estes centros funcionam como espaços de apoio e capacitação, garantindo que as práticas de gestão de dados acompanham as mudanças do ecossistema científico e regulatório.

Em conjunto, estes atores formam um ecossistema interdependente, no qual cada papel é essencial para que a gestão de dados de investigação se afirme como prática consolidada, eficiente e sustentável, contribuindo para o avanço da ciência e para o reforço da credibilidade institucional.

 

 

De que forma a interoperabilidade reforça o impacto científico e social do portal BIOS?

Quais os principais desafios para garantir a sustentabilidade institucional e evitar a dependência exclusiva das equipas científicas?

Como a integração da ciência cidadã e a normalização dos formatos contribuem para a valorização e reutilização dos dados de biodiversidade?

DESCRIÇÃO

O portal BIOS – Biodiversidade dos Açores teve início em 2004, no contexto de um projeto INTERREG que envolveu as regiões das Canárias, Açores, Madeira e Cabo Verde. A proposta inicial visava a criação de uma plataforma de biodiversidade comum, interoperável e comunicável entre todas estas regiões.

Apesar do sucesso inicial, o projeto não teve continuidade em Cabo Verde e na Madeira. No primeiro caso, a ausência de condições operacionais e de capacidade científica dificultou o avanço. No segundo, questões de política interna e reservas relativamente à partilha de dados de biodiversidade impediram a consolidação da iniciativa. Ainda assim, foram produzidas listagens taxonómicas em todas as regiões, incluindo duas para os Açores (2005 e 2010) e uma para a Madeira (2008), elaborada com a colaboração de equipas locais e nacionais.

Nas Canárias, o projeto evoluiu de forma consistente, resultando na criação de uma ferramenta de partilha de dados de elevada relevância para a gestão territorial e para as políticas públicas de conservação. Nos Açores, o percurso foi distinto: após um envolvimento inicial do Governo Regional, a continuidade do projeto passou a ser assegurada pela equipa científica local, que integrou o Portal Biota a nível nacional como infraestrutura reconhecida pela Fundação para a Ciência e a Tecnologia (FCT).

Atualmente, o BIOS é considerado uma infraestrutura oficial do Governo Regional dos Açores e encontra-se em processo de candidatura a financiamento no âmbito das infraestruturas regionais, prevendo-se um apoio significativo para a sua manutenção e desenvolvimento.

A experiência acumulada ao longo do projeto permitiu identificar três questões centrais no domínio da gestão e partilha de dados de investigação:

Disponibilização e interoperabilidade dos dados: a necessidade de assegurar que os sistemas criados sejam compatíveis e comunicáveis entre diferentes regiões e instituições.

Sustentabilidade institucional: a importância de garantir apoio político e recursos humanos adequados para a manutenção das infraestruturas de dados, evitando dependência exclusiva das equipas científicas.

Valorização e aplicação dos dados: a relevância de promover a utilização dos dados de biodiversidade em políticas públicas, planeamento territorial e iniciativas de conservação, reforçando o impacto social e científico da partilha de informação.

O projeto BIOS representa um percurso de mais de duas décadas de trabalho colaborativo, marcado por avanços significativos na disponibilização de dados de biodiversidade e pela consolidação de uma infraestrutura científica regional. A experiência evidencia tanto o potencial da partilha de dados para a ciência e para a sociedade, como os desafios institucionais e políticos que ainda se colocam à sua plena integração e sustentabilidade.

TRÊS LIÇÕES APRENDIDAS

Limitações dos sistemas iniciais

Os primeiros modelos de gestão de dados assentavam em software instalado localmente e em servidores dedicados, o que implicava custos elevados de manutenção e exigia equipas técnicas especializadas para garantir o funcionamento. A natureza fechada destes sistemas criava barreiras significativas: apenas utilizadores com conhecimentos avançados conseguiam aceder ou manipular os dados, o que reduzia drasticamente o potencial de reutilização. Além disso, a ausência de mecanismos de interoperabilidade dificultava a integração com outras bases de dados e plataformas, fragmentando a informação e limitando a sua circulação. Como consequência, os dados permaneciam isolados em silos institucionais, sem alcançar a comunidade científica mais ampla nem a sociedade, que poderia beneficiar do seu valor.

Necessidade de plataformas online abertas

A evolução tecnológica e a crescente valorização da ciência aberta evidenciaram a necessidade de migrar para plataformas acessíveis diretamente pela internet. Estas soluções eliminaram a dependência de software especializado, tornando o processo de disponibilização e carregamento de dados mais intuitivo e inclusivo. A acessibilidade universal passou a ser um princípio estruturante, permitindo que investigadores, gestores de dados e cidadãos acedam às informações sem barreiras técnicas. Além disso, a interoperabilidade tornou-se uma característica central, facilitando a integração com sistemas internacionais e potenciando colaborações transfronteiriças. Exemplos como o Atlas of Living Australia demonstraram que a abertura não só amplia o alcance dos dados, como também fortalece a confiança da comunidade científica e da sociedade na sua utilização.

Integração da ciência cidadã e normalização dos formatos

A incorporação de ferramentas de ciência cidadã, como o iNaturalist, trouxe uma dimensão participativa inédita, permitindo que qualquer pessoa contribua para a recolha e disponibilização de dados. Este envolvimento da sociedade aumentou a diversidade e a escala da informação recolhida, enriquecendo os repositórios científicos com dados provenientes de múltiplos contextos. 

Paralelamente, a adoção de padrões internacionais como o Darwin Core foi decisiva para assegurar a interoperabilidade, permitindo que os dados sejam reutilizados em diferentes plataformas e contextos — desde portais regionais e nacionais até bases globais e publicações científicas. A normalização dos formatos também facilitou a criação de data papers, que conferem reconhecimento académico ao trabalho de recolha e gestão de dados, reforçando a credibilidade e a visibilidade dos resultados. Este alinhamento entre participação cidadã e padronização técnica consolidou uma cultura de abertura e confiança, essencial para a valorização dos dados científicos.

TRÊS DESAFIOS FUTUROS

Recursos humanos e sustentabilidade da equipa

A escassez de recursos humanos dedicados à manutenção da infraestrutura constitui um dos maiores entraves à sua consolidação. Apesar de fases de financiamento terem permitido a contratação temporária de bolseiros, que apoiaram investigadores na preparação de dados e data papers, a ausência de mecanismos de apoio continuado para pessoal técnico especializado compromete a estabilidade da equipa. Esta intermitência gera descontinuidade no trabalho, dificulta a retenção de competências e impede a criação de rotinas sólidas de gestão de dados. Sem uma equipa estável e qualificada, torna-se difícil assegurar a eficiência na mobilização, curadoria e disponibilização dos dados, o que fragiliza a credibilidade e a capacidade de resposta da infraestrutura perante desafios crescentes.

Infraestrutura tecnológica e capacidade institucional

A limitação da capacidade técnica das instituições para gerir servidores, garantir requisitos de rede e assegurar padrões de segurança representa outro obstáculo significativo. A inexistência de condições adequadas obriga ao recurso a empresas externas para a gestão da infraestrutura, financiadas com verbas de investigação que deveriam ser canalizadas para atividades científicas. Esta dependência externa aumenta os custos operacionais e reduz a autonomia do projeto, tornando-o vulnerável a flutuações de mercado e à disponibilidade de serviços contratados. Além disso, a falta de uma base tecnológica sólida dentro da instituição dificulta a integração da infraestrutura em estratégias mais amplas de ciência aberta e gestão de dados, limitando o seu impacto e alcance.

Institucionalização e continuidade a longo prazo

Garantir que a infraestrutura seja assumida de forma institucional pelo Governo Regional ou por entidades nacionais é um desafio crítico para a sua sustentabilidade. Atualmente, a continuidade depende sobretudo da visão e dedicação das equipas de investigação, sem integração plena nas estruturas oficiais. Esta dependência de lideranças individuais coloca em risco a perenidade do projeto, especialmente perante a eventual saída ou reforma dos investigadores que o impulsionam. A institucionalização é, portanto, essencial para assegurar estabilidade, financiamento regular e reconhecimento formal da infraestrutura como parte integrante das políticas científicas e tecnológicas. Só através desta integração será possível garantir relevância a longo prazo, consolidar a confiança da comunidade científica e da sociedade, e transformar a infraestrutura num recurso estratégico para o desenvolvimento regional e nacional.

CINCO QUESTÕES SOBRE GDI

Como define, implementa e avalia as práticas de gestão de dados de investigação?

A gestão de dados de investigação é assegurada através de um processo estruturado que combina normas internacionais, mecanismos de validação em múltiplos níveis e práticas de revisão contínua. O objetivo central é garantir que os dados recolhidos, sejam provenientes de ciência cidadã, de projetos de estudantes de doutoramento e mestrado ou de equipas de investigação, tenham qualidade científica, consistência taxonómica e credibilidade para serem reutilizados em diferentes contextos.

A recolha de dados, orientada por standards previamente definidos como o Darwin Core, estabelece regras claras sobre formatos, categorias e metodologias de registo. Esta normalização facilita a uniformização dos dados, reduz ambiguidades e assegura que diferentes equipas e contextos de recolha possam produzir informação compatível e interoperável. O uso de tabelas e modelos estruturados constitui um benefício adicional pois orienta investigadores e cidadãos na forma correta de recolher e descrever os dados promovendo consistência desde o início do processo.

A qualidade dos dados é avaliada em quatro níveis complementares. No nível inicial os orientadores de alunos de doutoramento e mestrado asseguram que os dados recolhidos têm validade científica e rigor taxonómico; no nível intermédio a própria plataforma de gestão GBIF deteta erros estruturais ou taxonómicos durante a submissão obrigando à sua correção antes da integração definitiva; no nível avançado, revistas científicas especializadas como o  Biodiversity Data Journal realizam uma revisão detalhada das tabelas e metadados identificando inconsistências que devem ser corrigidas e recarregadas. No último nível, os data papers publicados permitem ainda uma última revisão pelos pares garantindo que os dados disponibilizados cumprem critérios de qualidade e podem ser reutilizados com confiança.

Assim, a avaliação e implementação das práticas de gestão de dados de investigação assentam numa combinação de normalização técnica validação, em múltiplos níveis e revisão contínua. Este modelo garante não apenas a qualidade e credibilidade dos dados mas também a sua valorização científica e social ao permitir que sejam reutilizados em diferentes contextos e reconhecidos como parte integrante da produção académica

Quais os principais benefícios dessas práticas?

A principal vantagem decorre da adoção de standards internacionais na organização dos dados que imprime versatilidade, permitindo que a mesma base de informação seja utilizada para múltiplos fins sem necessidade de duplicação de esforços. Quando os dados são estruturados de acordo com normas como o Darwin Core, tornam-se imediatamente aplicáveis em diferentes contextos, desde a gestão interna de projetos de investigação até à disponibilização em plataformas internacionais.

O percurso de utilização dos dados, desde a primeira fase na qual os alunos de mestrado e doutoramento asseguram eles próprios a qualidade da recolha, passando pelos processos de validação automática do GBIF e /ou a integração em portais regionais, até à sua publicação em plataformas de data papers demonstra que um único produto inicial — a base de dados organizada segundo standards — pode sustentar quatro níveis distintos de utilização: investigação individual dos alunos, integração em plataformas globais, disponibilização em portais regionais e publicação científica.

Este modelo revela-se particularmente vantajoso porque reduz a necessidade de intervenção constante dos orientadores, que passam a focar-se na supervisão científica geral, enquanto os alunos desenvolvem autonomia na gestão dos seus dados. A uniformização e a reutilização em múltiplos contextos reforçam não apenas a eficiência da investigação, mas também a credibilidade e o impacto dos resultados produzidos.

Em que medida a gestão de dados de investigação contribui para a otimização do processo de investigação?

A implementação de práticas estruturadas de gestão de dados tem um efeito direto na otimização do processo científico. Ao trabalhar com dados organizados segundo standards internacionais, os estudantes desenvolvem não apenas competências técnicas, mas também uma maior consciência da importância da qualidade e da consistência da informação que produzem. O facto de saberem que os seus dados serão submetidos a diferentes níveis de validação e revisão — desde a supervisão dos orientadores até à avaliação em plataformas internacionais e revistas científicas — incentiva-os a adotar uma postura mais rigorosa e sistemática na recolha, organização e análise da informação.

Este processo contribui para a eficiência da investigação, uma vez que dados bem estruturados podem ser facilmente integrados em softwares de análise estatística, modelos de investigação ou bases de dados globais. A uniformização reduz redundâncias e erros, permitindo que os investigadores concentrem esforços na interpretação científica e não na resolução de problemas técnicos.

Além disso, a experiência adquirida pelos estudantes na gestão de dados segundo normas reconhecidas internacionalmente constitui uma aprendizagem duradoura. Mesmo após concluírem os seus estudos ou seguirem outros percursos profissionais, levam consigo boas práticas de organização, documentação e partilha de informação, que podem ser aplicadas em diferentes contextos científicos ou profissionais.

Este impacto é também de natureza formativa e heurística, pois promove uma cultura de rigor, transparência e eficiência que ultrapassa o âmbito imediato da investigação académica. A gestão de dados deixa de ser apenas uma exigência técnica e passa a ser entendida como parte integrante da prática científica, contribuindo para a credibilidade dos resultados e para a sustentabilidade da ciência aberta.

Que vantagens e condicionantes aponta na partilha de dados de investigação?

A partilha de dados de investigação constitui um elemento central para a valorização científica e social da informação produzida. Atualmente, os dados recolhidos podem ser disponibilizados e reutilizados de forma ampla, desde que seja garantido o devido crédito aos seus autores. Esta abertura promove transparência, reforça a credibilidade dos resultados e facilita a integração em plataformas regionais, nacionais e internacionais, ampliando o impacto da investigação.

Do ponto de vista académico, a partilha permite que estudantes e investigadores utilizem os mesmos conjuntos de dados em diferentes fases do trabalho científico, desde análises estatísticas até publicações em data papers. A disponibilização em portais assegura visibilidade internacional e contribui para a consolidação de boas práticas de ciência aberta.

Embora a regra geral seja a abertura, existem situações específicas em que condicionantes éticas ou de privacidade exigem ajustamentos. Um exemplo recente ocorreu com dados de monitorização de térmitas nos Açores, recolhidos ao longo de 15 anos. Inicialmente, os registos incluíam a localização precisa das ocorrências, mas foi identificado o risco de que essa informação pudesse ser utilizada de forma indevida, por exemplo em transações imobiliárias. Para mitigar este problema, os dados foram disponibilizados com menor resolução espacial, agregando pontos num raio de 500 metros.

Este caso ilustra que, em determinadas circunstâncias, a proteção da privacidade ou a salvaguarda de interesses sociais pode exigir a redução da precisão dos dados. No entanto, mesmo com estas limitações, foi possível garantir a sua disponibilização, preservando o valor científico e assegurando a reutilização em contextos de investigação.

De que forma os diferentes atores envolvidos no processo de investigação estão comprometidos com a gestão de dados de investigação?

A gestão de dados de investigação envolve múltiplos atores, cada um com responsabilidades e níveis distintos de compromisso. No caso dos estudantes de mestrado e doutoramento, o envolvimento é direto e prático, uma vez que são eles que recolhem, organizam e estruturam os dados segundo standards internacionais. Este processo não só garante a qualidade e a consistência da informação, como também promove a aprendizagem de boas práticas que se tornam parte integrante da sua formação científica.

Os orientadores desempenham um papel complementar, assegurando a supervisão científica geral e validando a credibilidade dos dados produzidos. Embora não estejam envolvidos em todos os detalhes técnicos, apoiam os estudantes na adoção de metodologias rigorosas e na integração dos dados em contextos mais amplos, como publicações ou plataformas internacionais.

Ao nível institucional, a Universidade dos Açores demonstra abertura à partilha de dados e já possui experiência consolidada na gestão de repositórios de publicações. Contudo, a sua capacidade instalada em termos de servidores e infraestrutura tecnológica é limitada, o que obriga ao recurso a empresas externas para assegurar a manutenção e segurança da plataforma. Apesar destas restrições, não existe resistência à disponibilização dos dados, havendo colaboração por parte dos serviços internos, nomeadamente o serviço de informática, que responde de forma eficiente às necessidades operacionais.

No plano político, o Governo Regional dos Açores ainda não assumiu plenamente a responsabilidade pela institucionalização da infraestrutura de dados, o que fragiliza a sustentabilidade a longo prazo. A continuidade depende sobretudo da dedicação das equipas de investigação, sem integração formal nas estruturas oficiais. Esta situação revela que o compromisso existe, mas é desigual: forte ao nível das equipas e dos estudantes, moderado ao nível da universidade e ainda incipiente ao nível governamental.

Em síntese, o processo de gestão de dados de investigação é sustentado por uma rede de atores que, embora com diferentes graus de envolvimento, partilham uma sensibilidade crescente para a importância da ciência aberta. O desafio futuro reside em transformar este compromisso em políticas institucionais e governamentais que assegurem estabilidade, recursos e reconhecimento formal da infraestrutura como parte integrante do sistema científico.

 

 

Como pode a partilha de dados transformar rotinas internas de investigação?

De que forma a organização dos dados reforça a continuidade e coesão das equipas?

Será a estruturação dos dados uma ferramenta metodológica tão importante quanto a recolha?

Como transformar a gestão de dados científicos numa prática valorizada e duradoura?

DESCRIÇÃO

O projeto de investigação em cognição comparada desenvolve trabalho de análise do comportamento tirando partido do contínuo entre espécies humanas e não humanas, com o objetivo de compreender processos psicológicos fundamentais como perceção, memória, aprendizagem, ou tomada de decisão. A abordagem adotada é comparativa e integradora, explorando diferentes espécies para identificar estratégias cognitivas e regras de comportamento adaptativo. As questões centrais incluem a forma como os organismos extraem informação relevante do ambiente, como navegam em contextos complexos e como tomam decisões entre opções disponíveis.

Os dados recolhidos são essencialmente quantitativos, incluindo métricas como frequência de respostas, escolhas entre alternativas, taxas de acerto e erro, e latência de resposta. Estas variáveis, baseadas em contagens e tempos, permitem inferir processos cognitivos subjacentes ao comportamento observado, constituindo uma base sólida para a análise científica.

O interesse em publicar os dados associados às publicações científicas levou ao desenvolvimento de práticas internas de organização e gestão. Embora os métodos de recolha se tenham mantido estáveis, a forma como os dados são tratados após a recolha sofreu melhorias significativas. Durante anos, foram enfrentadas dificuldades na sistematização dos dados, especialmente em momentos de transição de membros da equipa. A ausência de um sistema estruturado dificultava o acesso posterior aos dados e comprometia a continuidade da investigação. Em resposta, foram adotadas medidas que visam garantir a preservação, acessibilidade e reutilização dos dados, com vista à sua publicação em repositórios institucionais e à integração em práticas alinhadas com os princípios da ciência aberta.

TRÊS LIÇÕES APRENDIDAS

A partilha como prática transformadora

Uma das principais mudanças no grupo de investigação foi a adoção sistemática da partilha de dados através do repositório institucional. Esta prática, inicialmente vista como uma tarefa altruísta — feita para beneficiar outros investigadores — revelou-se crítica para a evolução das metodologias internas. Atualmente, tudo o que é produzido é publicado no repositório, com o apoio fundamental dos serviços de documentação e biblioteca, que disponibilizam ferramentas e orientações essenciais.

A existência de uma infraestrutura já montada foi uma das grandes lições: não é necessário reinventar a roda! O sistema de repositório oferece opções de categorização e formatos padronizados que facilitam a organização e publicação dos dados. Esta estrutura externa ajuda a ultrapassar a tendência natural de trabalhar apenas para consumo interno, promovendo uma organização mais clara e acessível.

Organização e inteligibilidade dos dados

Mesmo para o próprio investigador, os dados podem perder inteligibilidade ao longo do tempo. Torná-los compreensíveis para terceiros é, simultaneamente, uma forma eficaz de organizar o trabalho e de garantir a sua longevidade. A partilha obriga à sistematização, o que melhora a fluidez dentro do grupo de investigação.

Em estudos com animais, por exemplo, onde as recolhas são diárias e prolongadas, a organização dos dados permite que qualquer membro da equipa possa substituir outro em caso de ausência, sem comprometer a continuidade da investigação. Esta prática reforça a coesão e a eficiência do grupo.

Comunicação científica e reflexão metodológica

Outra lição apreendida é o impacto na comunicação científica. Explicar processos complexos de forma clara e acessível exige reflexão sobre a estrutura dos dados e sobre a melhor forma de os apresentar. Este exercício de descentração — pensar como os outros vão interpretar o que foi feito — ajuda os investigadores a olhar para os seus próprios dados com maior clareza.

A organização da informação, portanto, não é apenas uma questão técnica, mas uma ferramenta de pensamento. Ao integrar os dados em sistemas externos, o grupo deparou-se com desafios de enquadramento: onde é que este tipo de investigação se insere? Quão próxima está de outras áreas? 

Mesmo quando há motivação para organizar, a realidade da investigação é caótica, e os sistemas padronizados ajudam a transformar essa complexidade em estrutura.

TRÊS DESAFIOS FUTUROS

Superar barreiras terminológicas e disciplinaridades fragmentadas

Um dos desafios mais persistentes na ciência contemporânea é a fragmentação terminológica entre disciplinas que, embora distintas, partilham conceitos e metodologias semelhantes. Exemplifica-se esta realidade com o conceito de priming na psicologia, equivalente ao search image na etologia — duas designações para o mesmo fenómeno. Esta duplicação terminológica dificulta o diálogo interdisciplinar e impede a construção de conhecimento partilhado.

A partilha de dados, acompanhada de metadados rigorosos, surge como uma estratégia fundamental para ultrapassar estas barreiras. Ao tornar os dados acessíveis e bem descritos, abre-se espaço para que investigadores de diferentes áreas possam reinterpretá-los, reutilizá-los e estabelecer novas conexões. A criação de pontes entre disciplinas exige, portanto, não apenas abertura conceptual, mas também práticas de documentação e partilha que favoreçam a inteligibilidade e a interoperabilidade dos dados.

Reequilibrar a relação entre investigação básica e aplicada

Outro desafio crítico prende-se com a crescente assimetria entre investigação básica e aplicada, especialmente em áreas como a psicologia. A pressão por resultados com aplicação imediata tem levado ao desinvestimento em estudos fundamentais, comprometendo o avanço científico a longo prazo. Pretende-se, muitas vezes, colher os frutos da ciência sem investir na plantação das sementes.

A partilha de dados pode funcionar como um mecanismo de reequilíbrio, permitindo que resultados de investigação básica sejam reutilizados em contextos aplicados, mesmo quando a sua utilidade não era evidente no momento da recolha. No entanto, esta ponte entre vertentes exige também uma mudança nos critérios de avaliação científica, que devem reconhecer o valor intrínseco da investigação fundamental.

Além disso, dentro da própria psicologia, a ligação entre investigação básica e aplicada é frequentemente frágil. A partilha estruturada de dados pode contribuir para reforçar essa ligação, promovendo uma maior circulação de conhecimento entre subáreas e facilitando a tradução de descobertas em soluções práticas.

Decidir o que partilhar e como garantir sustentabilidade

A decisão sobre o que partilhar — e em que condições — constitui um dos dilemas mais complexos da gestão de dados. Em estudos experimentais, como os realizados com animais, os dados recolhidos incluem múltiplas variáveis (escolhas, latências, taxas de acerto), nem todas tratadas ou publicadas. Embora os dados brutos possam ter valor futuro, a sua partilha implica custos significativos de organização, curadoria e interpretação.

Muitos desses dados “invisíveis” existem e podem ser recuperados, mas a sua disponibilização exige um esforço adicional que nem sempre é viável. A alternativa — não os partilhar — limita o potencial de reutilização científica. Assim, torna-se necessário encontrar um equilíbrio entre exaustividade e viabilidade, definindo critérios claros para a seleção, tratamento e preservação dos dados.

CINCO QUESTÕES SOBRE GDI

Como define, implementa e avalia as práticas de gestão de dados de investigação?

A implementação das práticas de gestão de dados no grupo de investigação em psicologia tem seguido uma abordagem gradual, prática e centrada na melhoria contínua. Em vez de aguardar por soluções perfeitas, o grupo iniciou com procedimentos simples, que foram sendo refinados à medida que a experiência se acumulava. Um exemplo claro deste processo evolutivo é a inclusão progressiva de elementos como o software de recolha nos depósitos de dados, com revisões retroativas sempre que necessário. Esta lógica iterativa permite ajustar e melhorar continuamente os procedimentos, sem comprometer a continuidade do trabalho.

A avaliação das práticas é feita de forma interna e prática, com destaque para a estratégia de envolver estudantes no processo. Ao realizarem o seu primeiro depósito de dados com instruções mínimas, os estudantes são incentivados a explorar a base de dados existente, o que permite testar a inteligibilidade da documentação e identificar oportunidades de melhoria. Embora não se trate de uma avaliação formal, esta abordagem funciona como um mecanismo eficaz de autoavaliação e aprendizagem.

Do ponto de vista técnico, o grupo reconhece desafios relacionados com a interoperabilidade dos formatos utilizados, nomeadamente o uso de ficheiros Excel. A reflexão sobre formatos mais adequados e alinhados com os princípios FAIR está em curso, integrando-se num esforço mais amplo de conformidade com boas práticas internacionais.

Uma decisão estruturante foi a integração do depósito de dados como parte obrigatória do processo de publicação científica. Nenhum artigo é submetido sem que os dados estejam previamente depositados num repositório institucional, o qual gera automaticamente um código de referência (identificador persistente) a ser incluído na publicação. Esta prática reforça a normalização do depósito e assegura a rastreabilidade dos dados.

Apesar da ausência de incentivos formais específicos para a gestão de dados — frequentemente vista como uma tarefa com custos imediatos e benefícios diferidos — o grupo conseguiu integrar esta prática no sistema de incentivos já existente, associando-a diretamente à publicação científica. Esta estratégia contribui para a sustentabilidade da prática, tornando o depósito de dados uma etapa natural do ciclo de investigação.

Quais os principais benefícios dessas práticas?

Os benefícios decorrentes da abordagem adotada para a gestão de dados são amplos e estruturantes, refletindo-se tanto na qualidade do trabalho científico como na sua sustentabilidade a longo prazo. Em primeiro lugar, destaca-se a promoção de uma organização eficaz dos dados, que permite não apenas o seu armazenamento sistemático, mas também a preservação da integridade e da rastreabilidade da informação recolhida ao longo dos projetos. Esta organização facilita o acesso futuro aos dados, mesmo em contextos de rotatividade de equipa, assegurando a continuidade da investigação e a valorização dos resultados obtidos.

A reutilização dos dados é outro benefício central, possibilitada pela sua estruturação clara e pela adoção de práticas que favorecem a partilha em ambientes académicos reconhecidos. Ao tornar os dados acessíveis e compreensíveis para terceiros, abre-se espaço para novas análises, comparações e colaborações, ampliando o impacto da investigação original e fomentando a produção de conhecimento cumulativo.

A transparência do processo científico é igualmente reforçada, uma vez que os dados passam a estar disponíveis para verificação, validação e reutilização por outros investigadores. Esta abertura contribui para a credibilidade dos resultados e para a construção de uma ciência mais ética, responsável e alinhada com os princípios da integridade académica.

Importa também sublinhar que a gestão de dados é conduzida de forma prática e adaptada à realidade de um grupo pequeno, o que permite uma maior agilidade na implementação de rotinas e na resposta a desafios operacionais. A utilização de estratégias comportamentais, coerentes com o campo de estudo, tem sido eficaz na transformação de práticas pontuais em hábitos sustentáveis, promovendo uma cultura interna de responsabilidade e compromisso com a qualidade.

Esta coerência entre os princípios que orientam a investigação e as práticas adotadas no seu quotidiano contribui para uma cultura institucional de abertura e partilha, em sintonia com os valores da ciência aberta e com os desafios contemporâneos da produção científica. Ao integrar a gestão de dados como parte integrante do processo de investigação, reforça-se a ideia de que a produção de conhecimento não termina na publicação, mas prolonga-se na forma como os dados são preservados, disponibilizados e reutilizados.

Em que medida a gestão de dados de investigação contribui para a otimização do processo de investigação?

A gestão e partilha de dados têm um impacto direto na otimização do processo de trabalho científico, sobretudo nas fases posteriores à recolha inicial. Embora os métodos de recolha não tenham sido alterados, a organização dos dados após essa etapa beneficiou significativamente da implementação de práticas estruturadas. A estandardização dos procedimentos permitiu reduzir a carga administrativa, facilitar a comunicação entre membros da equipa e reutilizar estruturas previamente desenvolvidas. Estes ganhos traduzem-se em poupança de tempo e recursos, promovendo maior eficiência na condução dos estudos e na gestão quotidiana dos projetos.

Para além da eficiência operacional, a gestão de dados também contribui para a otimização ética da investigação, especialmente em contextos que envolvem animais não humanos. A partilha de dados já recolhidos por outros grupos permite evitar novas recolhas que impliquem exposição dos animais a procedimentos invasivos, alinhando-se com o princípio dos 3Rs — redução, substituição e refinamento. Esta prática reforça o compromisso com uma investigação responsável, respeitando os direitos dos sujeitos envolvidos e promovendo uma utilização mais racional dos recursos científicos.

Mesmo em estudos com participantes humanos, a reutilização de dados previamente organizados e acessíveis permite evitar redundâncias, acelerar o progresso científico e partir de bases já consolidadas. Esta abordagem favorece a continuidade da investigação, facilita a replicação de estudos e contribui para a construção de conhecimento cumulativo, com benefícios claros para a qualidade e a sustentabilidade da produção científica.

Que vantagens e condicionantes aponta na partilha de dados de investigação?

A partilha de dados de investigação apresenta um conjunto robusto de vantagens que contribuem para a qualidade, integridade e impacto da produção científica. Um dos benefícios mais imediatos é a organização e sistematização dos dados. O simples facto de preparar os dados para partilha obriga à sua estruturação clara, o que melhora a eficiência interna dos projetos e facilita a comunicação entre os membros da equipa. Esta prática promove uma cultura de rigor e transparência, com efeitos positivos na gestão quotidiana da investigação.

A partilha de dados também responde a uma responsabilidade pública fundamental. Quando a investigação é financiada por fundos públicos, existe uma obrigação ética de tornar os dados acessíveis e inteligíveis, reforçando o compromisso com a ciência aberta e com a prestação de contas à sociedade. Neste sentido, a disponibilização dos dados é encarada não apenas como uma boa prática, mas como um dever cívico e académico.

Outro aspeto relevante é o potencial motivador da partilha, sobretudo para investigadores em início de carreira. Ao transformar os dados num produto científico adicional, com valor próprio e possibilidade de citação, esta prática contribui para a valorização do trabalho desenvolvido e para o reconhecimento do esforço investido na sua produção e curadoria.

Do ponto de vista metodológico, a partilha de dados permite a validação cruzada de resultados, especialmente em áreas como a psicologia, onde os fenómenos estudados são frequentemente inferidos de forma indireta. A comparação entre diferentes tarefas e metodologias reduz vieses, fortalece a validade dos resultados e promove uma ciência mais robusta. A reprodutibilidade é igualmente beneficiada, uma vez que a disponibilização dos dados facilita o processo de revisão científica e permite replicações mais rigorosas.

Apesar destes benefícios, persistem condicionantes relevantes que limitam a adoção generalizada da partilha de dados. Um dos principais desafios prende-se com os custos associados à preparação, tratamento e publicação dos dados. Este processo exige tempo, esforço e competências específicas, o que pode tornar inviável a partilha integral de todos os conjuntos de dados. É, por isso, necessário encontrar um equilíbrio entre a utilidade da partilha e a sustentabilidade do esforço envolvido.

A sobrecarga dos investigadores constitui outro obstáculo significativo. Para além das exigências da investigação, os profissionais acumulam responsabilidades de ensino, captação de financiamento, extensão científica e gestão administrativa. A gestão de dados surge como mais uma tarefa num contexto já altamente exigente, o que pode comprometer a sua priorização.

Por fim, a ausência de incentivos formais nos sistemas de avaliação académica limita o reconhecimento institucional destas práticas. Enquanto a publicação de artigos continua a ser o principal critério de valorização curricular, a gestão e partilha de dados permanecem pouco visíveis, o que dificulta a sua integração plena nas rotinas científicas.

De que forma os diferentes atores envolvidos no processo de investigação estão comprometidos com a gestão de dados de investigação?

A transformação das práticas de gestão de dados na investigação científica depende do envolvimento articulado de múltiplos atores institucionais e individuais. A eficácia dessas práticas não se mede apenas pela sua implementação pontual, mas pela sua consolidação ao longo do tempo e pela capacidade de gerar mudanças comportamentais sustentadas. Neste contexto, o papel dos incentivos, do reconhecimento institucional e da criação de condições favoráveis à mudança é determinante.

As iniciativas de promoção da gestão de dados são particularmente eficazes junto de investigadores que já reconhecem o valor da partilha, mas ainda não a integram nas suas rotinas. Para este grupo, exemplos inspiradores e boas práticas podem funcionar como catalisadores de mudança. No entanto, para que essa mudança se torne estrutural, é necessário ir além da inspiração e atuar sobre o contexto em que os comportamentos científicos se desenvolvem.

A imposição de regras pode ser um ponto de partida útil, mas não é suficiente por si só. A valorização simbólica e institucional das práticas de gestão de dados — através de prémios, reconhecimento curricular ou indicadores específicos — é essencial para tornar essas práticas desejáveis e não apenas obrigatórias. A motivação dos investigadores está muitas vezes ligada à perceção de recompensa, seja ela material, reputacional ou simbólica. Assim, o desenho dos sistemas de avaliação científica deve refletir essa realidade, reconhecendo o trabalho invisível que sustenta os resultados visíveis.

A psicologia do incentivo oferece uma lente útil para compreender este fenómeno. Tal como outros animais, os humanos respondem a estímulos e recompensas. Se o sistema valoriza a quantidade de publicações, os investigadores tenderão a priorizar volume. Se, por outro lado, forem recompensadas práticas como a partilha de dados, a transparência e a colaboração, essas tornar-se-ão mais frequentes. Esta lógica exige uma revisão crítica das métricas atualmente utilizadas, evitando que se tornem metas distorcidas que comprometem a integridade do processo científico.

As instituições desempenham um papel central neste processo. Para além de disponibilizarem formação e plataformas técnicas, devem criar condições estruturais que favoreçam a adoção de boas práticas. Os serviços de documentação e bibliotecas, por exemplo, são atores fundamentais na operacionalização da gestão de dados, mas o seu contributo nem sempre é devidamente reconhecido. A mudança de comportamento exige mais do que capacitação: exige contexto, regras claras e valorização institucional.

A persistência é outro fator crítico. Mesmo quando os resultados não são imediatamente visíveis, a continuidade das ações é essencial para consolidar uma cultura de ciência aberta. A ausência de reconhecimento pode gerar desânimo, especialmente quando o esforço investido parece não produzir efeitos. No entanto, é precisamente essa persistência — muitas vezes silenciosa — que sustenta a transformação a longo prazo.

 

 

Como gerir dados históricos e comunitários de forma ética, acessível e cientificamente válida?
Estão as infraestruturas digitais preparadas para acolher dados das ciências sociais e humanas?
Que desafios levanta a curadoria de testemunhos orais enquanto dados de investigação?

DESCRIÇÃO

O projeto constitui uma investigação histórica centrada na arquitetura e na sua relação com as comunidades locais. A iniciativa parte da observação de elementos já identificados por outros estudos, mas que revelam camadas de significado ainda não plenamente exploradas. Trata-se de um campo específico, com desafios próprios, sobretudo no que se refere à acessibilidade e à gestão dos dados gerados. 

Este trabalho levanta questões relevantes sobre a capacidade das instituições para lidar com dados provenientes das ciências sociais e humanas. Observa-se, ainda hoje, uma predominância de abordagens centradas nas ciências exatas e naturais, o que dificulta a adaptação de metodologias e infraestruturas às exigências das ciências sociais. Tal limitação tem representado um dos principais desafios enfrentados, exigindo constante negociação e ajustamento de práticas. 

A questão central que orienta o projeto é: de que forma a história da arquitetura pode contribuir para que as comunidades continuem a utilizar edifícios públicos? Para responder a esta pergunta, foram desenvolvidos dois projetos complementares: um projeto financiado pela Fundação para a Ciência e a Tecnologia (FCT), com foco nas regiões do Alentejo e Algarve; um projeto financiado pelo European Research Council (ERC), de maior escala, abrangendo todo o território português e incluindo também impactos provenientes de Espanha. 

Enquanto o projeto FCT se concentrou no sul do país, o projeto ERC dedicou-se ao centro e norte. Em ambos os casos, foram aplicadas metodologias tradicionais de investigação histórica, complementadas pela recolha de testemunhos orais — memórias, experiências e narrativas associadas à vivência em edifícios públicos. 

Dessa abordagem resultaram dois conjuntos principais de dados: dados de oralidade: transcrições de entrevistas com membros das comunidades, que requerem cuidados éticos e legais, especialmente no que diz respeito à privacidade e à gestão de dados sensíveis; dados históricos tradicionais: documentação, registos e fontes que integram a base de dados do projeto. 

Estes dados estão organizados na plataforma digital Arquitetura Aqui, composta por um site e uma base. A infraestrutura foi concebida com base nos princípios do acesso aberto, permitindo a disponibilização pública da maior quantidade possível de dados, sem comprometer a sua integridade ou confidencialidade. 

A plataforma inclui mecanismos de controlo que asseguram a segurança dos dados partilhados. Desde o início, os projetos foram estruturados segundo os princípios da ciência cidadã, tanto na recolha como na disseminação da informação. O site permite que qualquer pessoa contribua com memórias, experiências e, idealmente, dados mais específicos, como datas ou referências locais. 

Apesar dos desafios associados ao envolvimento do público na vertente técnica da história, a recolha de testemunhos orais tem sido bem-sucedida. As equipas de investigação visitaram comunidades, realizaram entrevistas e, em alguns casos, receberam contributos posteriores que foram integrados na base de dados. Esta dinâmica tem enriquecido significativamente os resultados do projeto. 

Atualmente, decorre no Iscte o processo de integração dos dados no repositório institucional. Após o depósito inicial, os dados são validados e disponibilizados publicamente, reforçando o compromisso com o acesso aberto. Uma parte significativa da coleção externa do repositório é composta por dados produzidos no âmbito deste projeto.  

TRÊS LIÇÕES APRENDIDAS

Categorização de dados qualitativos

A forma de categorizar e sistematizar dados qualitativos, especialmente em áreas como a história, a antropologia ou outras disciplinas das ciências sociais e humanas, exigem que seja feita uma curva de aprendizagem acentuada.

As ferramentas digitais disponíveis para gestão de dados foram, em grande parte, concebidas com base em modelos quantitativos, orientadas para a organização de séries numéricas, medições laboratoriais ou dados estatísticos. Essa orientação limita a sua aplicabilidade direta a dados que emergem de processos interpretativos, como testemunhos orais, narrativas históricas ou leituras de arquivo.

Consequentemente, foi necessário adaptar essas ferramentas, criando categorias artificiais. Este processo exige não apenas criatividade metodológica, mas também uma reflexão crítica sobre os limites da categorização e sobre o risco de simplificação excessiva. A gestão eficaz destes dados requer soluções flexíveis, capazes de respeitar a complexidade e a natureza contextual da informação recolhida.

Consentimento informado em contextos de trabalho de campo

A aplicação prática dos protocolos éticos, nomeadamente no que diz respeito ao consentimento informado, enfrenta obstáculos específicos em contextos informais, rurais ou comunitários. Embora os princípios éticos que regem a investigação estejam bem definidos em documentos institucionais e normativos, a sua implementação no terreno nem sempre é linear. Em muitos casos, os participantes não estão familiarizados com os procedimentos formais de consentimento, ou os próprios contextos de interação não favorecem abordagens padronizadas. Na prática, é quase impossível iniciar uma conversa espontânea com membros de uma comunidade — por exemplo, numa aldeia isolada da serra — e começar por pedir que assinem um documento formal antes de partilharem memórias sobre a escola primária, o lavadouro ou o mercado local. Esse tipo de abordagem quebra a relação de confiança e afasta as pessoas. Mas a intenção é fazer história com as pessoas, não apenas sobre elas — uma história construída de baixo para cima, com base nas suas experiências e testemunhos.

Nestes cenários, torna-se necessário desenvolver estratégias adaptadas, que respeitem simultaneamente os princípios éticos e a realidade sociocultural dos participantes. Isso pode incluir o uso de consentimento verbal, a explicação informal dos objetivos da investigação, ou a negociação contínua da participação ao longo do processo. É essencial articular os procedimentos éticos e legais com a realidade prática da investigação de campo. Ainda assim, e apesar de se ter conseguido estabilizar esse processo, muitas conversas e contributos ficaram de fora por não se ter conseguido cumprir os requisitos formais a tempo. Para futuros projetos, será fundamental incluir no planeamento tempo e recursos dedicados à definição clara dos procedimentos éticos e à formação prática das equipas. 

Formação e tempo dedicado à gestão de dados

A gestão de dados de investigação, especialmente quando envolve informação sensível ou qualitativa, exige tempo, planeamento e capacitação técnica das equipas envolvidas. Trata-se de uma dimensão que deve ser considerada desde a fase inicial dos projetos, com alocação de recursos específicos e definição clara de responsabilidades. A ausência de formação adequada pode comprometer a qualidade da curadoria, a segurança da informação e a conformidade com as políticas institucionais e legais.

Além disso, a gestão de dados não se limita ao armazenamento ou organização técnica — envolve decisões metodológicas, éticas e comunicacionais que requerem competências especializadas. A formação contínua das equipas, aliada ao apoio institucional, é essencial para garantir que os dados recolhidos sejam tratados com o rigor necessário e possam ser reutilizados, partilhados e valorizados como parte integrante da produção científica. Mas, as ações de formação existentes são muitas vezes demasiado abstratas e genéricas. Seria muito útil que fossem mais concretas, ligadas às realidades específicas de cada disciplina, e que partissem dos problemas reais enfrentados no terreno.

TRÊS DESAFIOS FUTUROS

Clarificação dos limites dos dados pessoais na investigação histórica

A investigação histórica enfrenta uma lacuna significativa na definição e tratamento de dados pessoais, especialmente no que diz respeito a figuras públicas e documentos administrativos. A ausência de diretrizes claras sobre o estatuto jurídico e ético destes dados pode gerar entraves à investigação, dificultando o acesso, a reutilização e a publicação de fontes relevantes. Em muitos casos, documentos que são tecnicamente públicos — como atas, relatórios ou correspondência institucional — contêm informações que podem ser interpretadas como dados pessoais, o que levanta dúvidas sobre os limites da sua divulgação.

Este desafio exige uma abordagem equilibrada entre o direito à informação e a proteção da privacidade, com especial atenção ao contexto histórico, à função pública dos sujeitos envolvidos e à finalidade científica da investigação. A clarificação normativa e institucional destes limites é essencial para garantir segurança jurídica aos investigadores e para promover práticas éticas e transparentes na gestão de dados históricos.

Saber o que pode, ou não, ser incluído, como anonimizar dados, e como garantir a conformidade legal é um esforço adicional que exige tempo e atenção. 

Preservação digital a longo prazo

Embora os repositórios institucionais ofereçam garantias importantes em termos de preservação digital, subsistem incertezas quanto à sustentabilidade de plataformas próprias desenvolvidas por projetos de investigação. Estas plataformas, muitas vezes criadas com financiamento temporário, enfrentam riscos associados à obsolescência tecnológica, à descontinuidade de manutenção e à falta de integração com infraestruturas institucionais permanentes.

A longo prazo, a preservação dos dados depende da sua migração para sistemas estáveis, interoperáveis e reconhecidos institucionalmente. É fundamental que os projetos prevejam desde o início estratégias de preservação que incluam o depósito em repositórios certificados, a atribuição de identificadores persistentes e a adoção de formatos normalizados. A articulação entre plataformas próprias e repositórios institucionais deve ser pensada como uma complementaridade, garantindo simultaneamente inovação e sustentabilidade.

Reconhecimento académico da produção de dados em bruto

A produção de dados de investigação, especialmente qualitativos, continua a ser subvalorizada nos sistemas de avaliação científica. Apesar de constituírem uma componente essencial em projetos de ciência cidadã e em investigações que envolvem comunidades, os dados em bruto — como testemunhos orais, registos históricos ou documentação recolhida — são frequentemente vistos como auxiliares ou preparatórios, e não como resultados científicos em si.

Este enquadramento limita o reconhecimento do trabalho de recolha, curadoria e publicação de dados, que exige competências especializadas e contribui diretamente para o avanço do conhecimento. É necessário promover uma mudança cultural e institucional que valorize os dados como produtos científicos legítimos, com critérios próprios de qualidade, citabilidade e impacto. A atribuição de identificadores persistentes, o depósito em repositórios e a adoção de licenças claras são passos fundamentais nesse processo, mas devem ser acompanhados por políticas de avaliação que reconheçam a diversidade das práticas científicas.

CINCO QUESTÕES SOBRE GDI

Como define, implementa e avalia as práticas de gestão de dados de investigação?

A instituição implementa as suas práticas de gestão de dados com base numa Política de Gestão e Partilha de Dados de Investigação, em vigor desde 2023. Esta política estabelece as diretrizes para o armazenamento, partilha e citação de dados produzidos na comunidade científica da instituição. Todos os dados são acompanhados por identificadores persistentes e pela atribuição de licenças adequadas, garantindo a rastreabilidade, a transparência e o cumprimento das normas éticas e legais aplicáveis.

Para além desta política geral, cada projeto de investigação segue procedimentos específicos de gestão de dados, adequados à natureza e sensibilidade da informação recolhida. No caso particular dos projetos que envolvem dados pessoais — como registos de voz, impressões ou memórias —, são obtidos consentimentos informados dos participantes, assegurando o tratamento ético e responsável dos dados.

Os dados são armazenados numa base de dados própria, cujo nível de visibilidade e acesso é definido de acordo com o tipo de informação contida. Parte destes dados pode estar publicamente acessível, enquanto outros permanecem restritos para salvaguardar a privacidade e a confidencialidade dos participantes.

A avaliação das práticas de gestão de dados é realizada de forma contínua, assegurando a conformidade com a política institucional, com os requisitos dos financiadores e com as boas práticas internacionais de ciência aberta e gestão responsável de dados.

Quais os principais benefícios dessas práticas?

A adoção sistemática de práticas de gestão e partilha de dados científicos representa um avanço significativo na consolidação da ciência aberta. A associação de publicações a repositórios institucionais não só reforça a visibilidade dos dados gerados, como também facilita o seu acesso por parte da comunidade científica e da sociedade em geral. Esta integração contribui diretamente para a transparência dos processos de investigação e para a democratização do conhecimento.

Para além da acessibilidade, estas práticas promovem uma cultura de consciência e responsabilidade ética, alinhando os objetivos científicos com princípios fundamentais de integridade, reprodutibilidade e equidade. A gestão adequada dos dados permite garantir que os resultados são compreensíveis, verificáveis e reutilizáveis, fortalecendo a confiança nas evidências produzidas.

Outro benefício estrutural reside na preservação e fidelidade dos dados ao longo do tempo. A reabilitação de conjuntos de dados, a sua conservação em ambientes seguros e a manutenção da sua integridade são elementos essenciais para assegurar a continuidade da investigação e a valorização do trabalho científico.

Por fim, o impacto real destas práticas é visível na utilização efetiva dos dados por outros investigadores, na criação de novas abordagens e na ampliação do alcance dos projetos. A partilha ativa de dados transforma-se, assim, num motor de inovação, colaboração e reconhecimento institucional.

Em que medida a gestão de dados de investigação contribui para a otimização do processo de investigação?

A integração de práticas de gestão de dados desde as fases iniciais do projeto contribui de forma decisiva para a eficiência e solidez do processo científico. Quando o planeamento da investigação é concebido com base em princípios de acesso aberto, torna-se possível estruturar desde o início uma base de dados alinhada com os objetivos do projeto e com os requisitos de transparência e reprodutibilidade. Esta abordagem proativa evita retrabalho, assegura a coerência dos dados recolhidos e facilita a sua posterior validação e partilha.

As validações e integrações realizadas ao longo do percurso não alteraram a lógica do processo, mas reforçaram a sua robustez e a permanência dos dados em ambientes digitais sustentáveis. Estes mecanismos funcionam como camadas adicionais de fiabilidade, assegurando que os dados mantêm a sua integridade e relevância ao longo do tempo.

A atribuição de identificadores persistentes, como os DOI (Digital Object Identifiers), desempenha um papel fundamental neste contexto. Para além de garantirem a validação formal dos dados, permitem a sua citação adequada e a partilha em plataformas académicas reconhecidas, assegurando a rastreabilidade, a visibilidade e a longevidade dos resultados produzidos.

Que vantagens e condicionantes aponta na partilha de dados de investigação?

A implementação de práticas de gestão e partilha de dados traz vantagens significativas para a investigação científica. Entre os principais benefícios destaca-se o aumento da visibilidade dos dados produzidos, que potencia a sua reutilização por outros investigadores e projetos. Esta abertura contribui para o fortalecimento de uma cultura de colaboração, promovendo o intercâmbio de metodologias, fontes e resultados. Além disso, permite a complementaridade entre projetos com abordagens distintas, ampliando o impacto e a diversidade da produção científica.

No entanto, persistem condicionantes relevantes que limitam a adoção plena destas práticas, especialmente em áreas como a história. A resistência cultural à divulgação de fontes primárias continua a ser um obstáculo, refletindo preocupações com a autoria intelectual e a preservação de abordagens tradicionais. A falta de recursos, interesse ou autorização para partilhar documentos originais agrava esta limitação, dificultando a abertura dos dados em formatos acessíveis e reutilizáveis.

Adicionalmente, verifica-se uma inflexibilidade nas ferramentas institucionais, muitas vezes concebidas para dados quantitativos, o que dificulta a integração de dados qualitativos e interpretativos. Esta realidade evidencia a necessidade de uma perspetiva mais atualizada sobre as práticas em humanidades digitais, que reconheça a especificidade dos dados produzidos em contextos comunitários, históricos e multidisciplinares.

De que forma os diferentes atores envolvidos no processo de investigação estão comprometidos com a gestão de dados de investigação?

A consolidação de práticas eficazes de gestão e partilha de dados depende da atuação coordenada de diversos atores institucionais e científicos. Os investigadores desempenham um papel central, sendo os principais responsáveis pela definição metodológica e pela disponibilização dos dados. A sua visão sobre a abertura e reutilização dos materiais de investigação é determinante para o sucesso de qualquer iniciativa de ciência aberta.

A equipa de projeto, especialmente quando composta por investigadores com uma postura aberta e colaborativa, pode ser um motor de inovação. A predisposição para experimentar novas abordagens têm sido fatores decisivos na adoção de práticas mais transparentes e inclusivas.

As instituições, por sua vez, têm a responsabilidade de liderar esta transformação, criando condições estruturais e políticas que favoreçam a integração dos dados em ambientes académicos reconhecidos. Em contextos orientados para as ciências sociais, como o Iscte, essa liderança é particularmente relevante para garantir que os dados qualitativos e interpretativos sejam valorizados e corretamente enquadrados.

As bibliotecas assumem um papel técnico e estratégico, apoiando na categorização dos dados e na sua integração nos repositórios institucionais. Este apoio é essencial para garantir que os dados sejam organizados de forma adequada e acessível.

Por fim, a comunidade científica tem um papel crítico na validação e reconhecimento de abordagens alternativas, como aquelas que cruzam história com arquitetura e envolvem diretamente as comunidades locais. O reconhecimento da diversidade metodológica e da riqueza dos dados qualitativos é fundamental para ampliar os horizontes da ciência aberta e promover uma cultura de partilha mais inclusiva e representativa.

O Consórcio Re.Data lança uma nova ação dirigida a líderes e gestores de topo das Instituições de Ensino Superior (IES), com o objetivo de promover a adoção de estratégias institucionais de Ciência Aberta e Gestão de Dados de Investigação.

Este programa é promovido pelo Consórcio Re.Data e destina-se a membros do Grupo Nacional de Interesse em Políticas e Estratégias de Ciência Aberta, aos Centros de Competências Re.Data, bem como a líderes e decisores institucionais, profissionais com responsabilidades de direção e gestão de serviços, e outros profissionais de apoio à direção.

O programa de liderança realiza-se em formato híbrido e inclui três momentos principais:

  • 13 de novembro (online, 14h-15h30) – Sessão de Abertura: introdução ao quadro conceptual de liderança institucional em Ciência Aberta e Gestão de Dados de Investigação.
  • 20 de novembro (online, 14h-15h30) – Sessão de Mentoria: apresentação de estudos de caso europeus e promoção da troca de experiências entre participantes e especialistas.
  • 27 de novembro – Sessão presencial no Instituto Politécnico de Bragança, 14h-15h30 para consolidação das aprendizagens e definição de ações institucionais, com momentos de trabalho colaborativo.

A participação é gratuita, mediante candidatura através do formulário disponível aqui: [Formulário de candidatura]

Serão selecionados 20 participantes de todo o país, com base na motivação, experiência profissional e envolvimento com o projeto Re.Data. Em caso de empate, serão considerados critérios adicionais como distribuição geográfica e equilíbrio de género.

O período de candidaturas decorre entre 27 de outubro e 6 de novembro. Os candidatos selecionados serão notificados a 7 de novembro, data em que será também publicado o programa final.

Este programa pretende reforçar o compromisso institucional com práticas científicas abertas e estruturadas, contribuindo para um ecossistema de investigação mais transparente, colaborativo e acessível.

 

A adoção dos princípios FAIR promove a transparência, a reutilização e a interoperabilidade dos dados científicos, fortalecendo a qualidade e o impacto dos resultados das investigações. A correta publicação dos dados assegura também o cumprimento de políticas institucionais e de financiadores, fomentando a colaboração e a inovação.

A Rede para a Gestão de Dados de Investigação abriu inscrições para três edições do workshop, que versa sobre a temática “Como Publicar os Dados da Sua Investigação e Tornar os Dados FAIR“, dirigidas a diferentes áreas científicas.

Estas iniciativas apresentam-se como uma oportunidade imprescindível para investigadores, doutorandos, docentes e pessoal de apoio à investigação adquirirem conhecimentos práticos e atualizados sobre a publicação e gestão adequada de dados científicos, em consonância com os princípios FAIR (Findable, Accessible, Interoperable, Reusable).

As sessões foram planeadas com foco em três áreas disciplinares distintas: Ciências Sociais e Humanas: 17 de outubro de 2025, na Universidade NOVA de Lisboa (NOVA FCSH); Engenharia e Tecnologia: 24 de outubro de 2025, no Instituto Politécnico de Bragança, e Ciências da Vida: 11 de novembro de 2025, na Universidade de Coimbra.

A participação é gratuita, com vagas limitadas, pelo que se recomenda a inscrição atempada.

Os workshops terão uma duração aproximada de 3,5 horas, combinando momentos teóricos, complementados com exercícios práticos, que facilitam a aplicação dos conceitos aprendidos. Pretende-se assim, capacitar os participantes com conhecimentos  sobre os princípios FAIR e a sua relevância na investigação, no âmbito das boas práticas de Ciência Aberta, ensinar competências para a identificação e seleção de repositórios adequados para a publicação de dados, conforme as exigências disciplinares, adquirir competências para avaliação e otimização da compatibilidade FAIR dos dados produzidos durante os projetos de investigação, e fornecer orientação na elaboração de documentação e metadados, incluindo a redação do ficheiro README, fundamental para a acessibilidade e reutilização dos dados.

O consórcio Re.Data mantém-se comprometido com a promoção das melhores práticas na gestão dos dados científicos, contribuindo para o fortalecimento da Ciência Aberta em Portugal.

 

relatório da rede portugus de data stewardJá foi publicado o primeiro “Relatório sobre a operacionalização da Rede Portuguesa de Data Stewards” na nossa comunidade Zenodo. Este é um marco importante para o projeto Re.Data, uma vez que destaca o papel inovador da Rede Portuguesa de Data Stewards (RPDS) que pretende promover a gestão colaborativa de dados de investigação em Portugal.

A RPDS foi criada para com o objetivo de consolidar e fortalecer uma comunidade de profissionais dedicados ao apoio à gestão de dados científicos, promovendo colaboração entre instituições, formação contínua e partilha de boas práticas. Com uma estrutura organizacional participativa e sem custos de adesão, é através do envolvimento dos seus membros nas reuniões regulares que se pretende organizar sessões online e eventos que respondam às suas necessidades de cada um..

No relatório, é possível consultar com detalhe o modo de organização, funcionamento e plano de atividades da Rede, evidenciando o compromisso do Re.Data com a modernização e internacionalização das práticas de gestão de dados científicos. Este relatório é um entregável do projeto Re.Data, que tem vindo a impulsionar a gestão responsável e eficiente dos dados de investigação em Portugal. Para consultar, basta aceder a https://zenodo.org/records/16571614

 

De que modo os dados contribuem para a prevenção de doenças provocadas por insetos? 

Como podem os dados contribuir para o reforço da resposta das autoridades de saúde? 

Qual a relevância da normalização de procedimentos em projetos de consórcio?

Qual o ponto de equilíbrio entre a proteção de dados e a investigação socialmente relevante?

DESCRIÇÃO

O projeto propõe-se aprofundar o conhecimento sobre os fatores ambientais e socioeconómicos que influenciam a propagação de doenças causadas por agentes patogénicos transmitidos por flebótomos, cuja incidência tem aumentado devido às mudanças climáticas e alterações ambientais.

Entre os seus objetivos principais estão o desenvolvimento de um sistema de alerta precoce para monitorizar e prever alterações na distribuição e sazonalidade destes insetos vetores, a avaliação do risco de transmissão dos agentes patogénicos e a análise do impacto socioeconómico das doenças associadas. O projeto visa ainda apoiar a definição de políticas de adaptação e mitigação, promovendo respostas integradas e baseadas em evidência científica. 

Ao fornecer avaliações de risco mais fiáveis e melhorar a previsão da distribuição presente e futura das doenças causadas por agentes patogénicos transmitidos por flebótomos, pretende reforçar a eficácia da resposta das autoridades de saúde.

TRÊS LIÇÕES APRENDIDAS

Normalização dos procedimentos de recolha e manutenção de dados por todos os membros do consórcio

Num consórcio de investigação, onde múltiplas instituições colaboram na produção e análise de dados, a normalização dos procedimentos de recolha, armazenamento e manutenção de dados é essencial para garantir a consistência, a qualidade e a integridade dos resultados. A adoção de metodologias comuns permite que os dados sejam comparáveis e interoperáveis, independentemente da sua origem, facilitando a integração e a análise conjunta. Esta uniformização reduz redundâncias, minimiza erros e assegura que todos os membros do consórcio operam com base em critérios técnicos e éticos partilhados. Além disso, contribui para a eficiência operacional e para a credibilidade científica do projeto.

Partilha de dados sustentada por documentação apropriada

A partilha de dados é um dos pilares da ciência colaborativa, mas deve ser realizada com responsabilidade e transparência. Tanto no contexto interno do consórcio como em interações com entidades externas, é fundamental que os dados sejam acompanhados de documentação rigorosa, incluindo metadados, termos de uso, licenças e acordos de confidencialidade. Esta documentação assegura que os dados são compreendidos no seu contexto original, utilizados de forma ética e em conformidade com os direitos e deveres das partes envolvidas. Além de proteger os interesses institucionais e individuais dos investigadores, esta prática promove a confiança mútua, a rastreabilidade e a valorização do trabalho científico desenvolvido.

Importância da aplicação prática dos princípios FAIR

A aplicação dos princípios FAIR na gestão de dados científicos é cada vez mais reconhecida como uma boa prática essencial para maximizar o valor da investigação. Tornar os dados encontráveis (Findable) implica o uso de identificadores persistentes e metadados descritivos; garantir que são acessíveis (Accessible) requer a definição clara de condições de acesso e uso; assegurar que são interoperáveis (Interoperable) envolve a utilização de formatos e vocabulários padronizados; e promover a sua reutilização (Reusable) exige documentação completa e licenças adequadas. A implementação destes princípios não só facilita a reutilização dos dados por outros investigadores, como também contribui para uma ciência mais aberta, eficiente e sustentável, alinhada com as exigências de financiadores e políticas públicas de investigação.

 

TRÊS DESAFIOS FUTUROS

Garantir a continuidade da aplicação dos princípios FAIR, promovendo a sua integração efetiva em práticas de ciência aberta

A aplicação dos princípios FAIR (Findable, Accessible, Interoperable, Reusable) deve ser entendida não como uma etapa pontual, mas como um compromisso contínuo ao longo de todo o ciclo de vida dos dados. A sua integração efetiva nas práticas de ciência aberta exige o desenvolvimento de políticas institucionais claras, a capacitação dos investigadores e a adoção de ferramentas tecnológicas que facilitem a sua implementação. Ao garantir que os dados permanecem localizáveis, acessíveis, interoperáveis e reutilizáveis, mesmo após o término dos projetos, promove-se a longevidade do conhecimento científico e a sua disseminação responsável.

Assegurar a continuidade dos procedimentos e a manutenção de um servidor fiável para o armazenamento seguro dos dados

A infraestrutura tecnológica desempenha um papel determinante na preservação e acessibilidade dos dados. A manutenção de um servidor fiável, seguro e com capacidade de longo prazo é essencial para garantir que os dados recolhidos não se perdem, permanecem acessíveis e podem ser reutilizados por outros investigadores ou em novos contextos. Esta continuidade operacional deve ser acompanhada por procedimentos bem documentados, planos de preservação digital e mecanismos de redundância que assegurem a integridade e a confidencialidade da informação armazenada.

Conciliar a aplicação rigorosa das boas práticas de proteção de dados com a promoção de investigação socialmente relevante, garantindo que uma não comprometa a outra

A proteção de dados, especialmente quando se trata de dados pessoais ou sensíveis, é uma exigência ética e legal incontornável. No entanto, esta proteção não deve ser vista como um obstáculo à produção de investigação socialmente relevante. Pelo contrário, é possível — e desejável — encontrar um equilíbrio entre o respeito pelos direitos dos participantes e a geração de conhecimento com impacto social. A aplicação rigorosa das boas práticas de anonimização, consentimento informado e gestão ética dos dados permite que a investigação avance de forma responsável, sem comprometer a confiança pública nem a qualidade científica.

CINCO QUESTÕES SOBRE GDI

Questões respondidas por Pádraic Fleming – Research Manager and Cluster Lead – Health da Trilateral Research
(www.trilateralresearch.com), parceiro responsável pelo DMP
Como define, implementa e avalia as práticas de gestão de dados de investigação?

O projeto CLIMOS tem um parceiro dedicado, a Trilateral Research, responsável por aconselhar, monitorizar e relatar as práticas de gestão de dados ao longo da duração do projeto. Um plano de gestão de dados (DMP) do CLIMOS foi produzido até ao mês 6 do projeto de 3 anos, delineando o plano, políticas, processos e procedimentos do consórcio sobre a recolha, armazenamento, acesso, partilha, proteção, retenção e destruição de dados durante e após o fim do projeto. O plano especificou que dados seriam recolhidos e se seriam partilhados ou tornados de acesso aberto e como seriam curados e preservados (incluindo após o fim do projeto) em conformidade com as Diretrizes de Gestão de Dados FAIR do Horizonte Europa. O DMP abordou tanto os dados de investigação quanto as publicações revistas por pares. O DMP é mantido como um documento vivo, atualizado iterativamente ao longo da duração do projeto, com atualizações submetidas à Comissão Europeia no mês 18 e novamente planeadas para o final do projeto. O parceiro coordenador do consórcio é responsável pela gestão do armazenamento de documentos administrativos e de investigação não sensíveis do projeto, num SharePoint institucional seguro e conforme com o GDPR, uma prática aceite pela Comissão Europeia. O coordenador do projeto também mantém a supervisão das práticas de gestão de dados e apoia ativamente o parceiro responsável pela gestão de dados.

Quais os principais benefícios dessas práticas?

Ter um parceiro de projeto dedicado garante continuidade e padronização em termos de processos e procedimentos, além de fornecer uma fonte confiável para os parceiros recorrerem para conselhos e apoio contínuos. Ter um DMP produzido no início do projeto estabelece uma base para o que são “boas práticas de gestão de dados”, garantindo que todos os parceiros tenham informações, diretrizes, regulamentos, processos e procedimentos consistentes e atualizados para implementar, bem como informações práticas, como detalhes de contacto dos responsáveis/oficinas de proteção de dados institucionais, além de uma consciência das políticas e procedimentos institucionais. A nível de projeto, a preparação e atualização iterativa do DMP garante que os parceiros do projeto considerem proativamente o seu papel e responsabilidades individuais em relação aos dados, conjuntos de dados, fluxos de dados, requisitos de dados, interdependências, entre muitos outros aspetos relacionados com os princípios FAIR. 

Em que medida a gestão de dados de investigação contribui para a otimização do processo de investigação?

Ter tarefas dedicadas à gestão de dados incorporadas no plano do projeto desde a fase de proposta, passando pela implementação do projeto, bem como um parceiro de projeto dedicado, simplifica o processo de investigação, garantindo que processos e procedimentos padronizados estejam em vigor desde o início. Além disso, facilita que os parceiros do projeto contemplem e planeiem antecipadamente a investigação de campo, levando em consideração, por exemplo, o trabalho preparatório que precisa ser realizado antes do início da recolha de dados. Isto inclui folhas de informação do projeto padronizadas, processos e modelos de consentimento, acordos de partilha de dados e outros requisitos específicos da tarefa que também podem ser específicos do país ou da instituição.

Que vantagens e condicionantes aponta na partilha de dados de investigação?

O acordo de concessão do consórcio e o acordo do consórcio servem como um contrato juridicamente vinculativo, com obrigações relacionadas com a boa gestão de dados e práticas seguras de dados. A vantagem destes documentos é que os parceiros estão protegidos desde o início, mas também têm obrigações a cumprir desde o início. Além deste documento juridicamente vinculativo, as práticas seguras e seguras de partilha de dados, tanto dentro como fora do consórcio de investigação, são uma das primeiras coisas a serem estabelecidas. Com base nisso, ter práticas claras de partilha de dados garante que todos os requisitos legais sejam cumpridos ao longo da duração do projeto, contando não apenas com a orientação do parceiro de projeto dedicado, mas também trabalhando em colaboração com os escritórios de proteção de dados em cada uma das instituições parceiras, conforme necessário. Como parte das práticas seguras e seguras entre os parceiros do projeto, um repositório centralizado de armazenamento de dados para documentos do projeto (administrativos e relacionados com a investigação) é gerido pela instituição coordenadora do projeto desde o início. Isto é cuidadosamente gerido e mantido ao longo da duração do projeto. Em termos de dados de investigação, foram estabelecidos processos e acordos de partilha de dados separados, dependendo do tipo de dados, da relação controlador-processador de dados, entre outras considerações para uma boa gestão de dados. Estas restrições garantem práticas seguras e seguras, dado o grande número de parceiros dentro e fora da UE. Esta diversidade complica valores essenciais subjacentes à investigação responsável e inovação, por exemplo, reprodutibilidade e transparência da investigação, qualidade e precisão, responsabilidade, preservação a longo prazo, bem como considerações práticas como a capacidade de publicar em revistas de alto impacto. Como resultado, abordagens padronizadas para a gestão de dados são fundamentais para garantir a integridade dos resultados da investigação. 

De que forma os diferentes atores envolvidos no processo de investigação estão comprometidos com a gestão de dados de investigação?

Todos os parceiros são legalmente obrigados a manter a conformidade com o GDPR assim que o Acordo de Concessão e o Acordo do Consórcio são assinados. Na prática, existem pacotes de trabalho, tarefas e entregas dedicadas associadas à gestão de dados. Esta estrutura garante a participação ativa de cada parceiro, com o parceiro de projeto dedicado à gestão de dados, que se relaciona regularmente diretamente com cada parceiro em termos de recolha de informações relacionadas com a gestão de dados a nível individual. Relatar regularmente à Comissão Europeia demonstra a importância atribuída à boa gestão de dados e atua como uma motivação para os parceiros manterem-se em conformidade com as práticas acordadas.