Como equilibrar o acesso aberto com a proteção de dados pessoais sensíveis na investigação científica?

Por que o exercício de proteção de dados é considerado valioso mesmo quando não há riscos evidentes?

Que fatores contribuem para a subvalorização dos riscos na partilha de dados por investigadores/as?

Como uma licença “Para o Bem Maior” poderia transformar a reutilização de dados científicos?

DESCRIÇÃO

No contexto da Universidade da Beira Interior (UBI), é destacado o projeto C4MSSData@UBI – Centro para a Gestão e Partilha Segura de Dados de Investigação, como uma iniciativa recente que tem contribuído significativamente para a consolidação das práticas de gestão de dados de investigação. 

Contudo, a evolução destas práticas na UBI resulta também de um percurso institucional sustentado ao longo dos últimos anos, com especial incidência nas áreas da ética e da proteção de dados, no âmbito do qual são identificáveis três boas práticas:

Requisitos Éticos para Divulgação de Projetos
Desde há mais de oito anos, encontra-se instituída na UBI a obrigatoriedade de obtenção de parecer da Comissão de Ética para a divulgação de pedidos de participação em projetos de investigação. Esta medida antecipa e acompanha práticas atualmente adotadas por diversas instituições de ensino superior e investigação, reforçando o compromisso com a integridade científica e a proteção dos participantes.

Articulação entre Ética e Proteção de Dados
Verifica-se uma articulação eficaz entre a Comissão de Ética e o Gabinete de Cibersegurança e Proteção de Dados. Esta colaboração traduz-se, por exemplo, na exigência de Avaliações de Impacto sobre a Proteção de Dados (AIPD) para determinados pedidos de parecer e projetos submetidos à Comissão de Ética. Em sentido inverso, o Encarregado da Proteção de Dados pode solicitar pareceres éticos para projetos que lhe são apresentados, promovendo uma abordagem integrada e coerente entre os domínios da ética e da proteção de dados.

Automatização Parcial no Processamento de AIPD
O processo de tramitação das declarações de AIPD inclui uma fase inicial semi-automatizada. As respostas inseridas num questionário digital são transformadas automaticamente em documentos nos formatos DOCX e PDF, os quais são enviados para o/a proponente e para o Encarregado da Proteção de Dados. Este procedimento visa facilitar a revisão, melhoria e eventual emissão de parecer, promovendo eficiência e rastreabilidade documental.

TRÊS LIÇÕES APRENDIDAS

A experiência acumulada na interseção entre acesso aberto, partilha de dados e proteção de dados tem revelado um conjunto de aprendizagens relevantes para a prática científica e para a definição de políticas institucionais. Destacam-se, em particular, três lições fundamentais:

Tensão entre Acesso Aberto e Proteção de Dados
A conciliação entre os princípios do acesso aberto, a promoção da partilha de dados e o cumprimento das exigências legais e éticas da proteção de dados revela-se complexa e, por vezes, contraditória. A coexistência destes objetivos exige um equilíbrio delicado, frequentemente difícil de alcançar, sobretudo em contextos que envolvem dados pessoais sensíveis.

Valor Intrínseco do Exercício de Proteção de Dados
Independentemente da necessidade efetiva de anonimização ou de outras medidas de mitigação, o exercício de análise e reflexão sobre a proteção de dados constitui, por si só, uma prática valiosa. Este processo funciona como mecanismo de consciencialização e permite, em muitos casos, identificar vulnerabilidades ou riscos que, de outro modo, poderiam passar despercebidos. Assim, a proteção de dados assume também um papel preventivo e educativo no ciclo de vida da investigação.

Perceções Limitadas sobre Riscos na Investigação Científica
A investigação científica, sendo geralmente orientada por motivações altruístas e de benefício coletivo, tende a desvalorizar os riscos associados à recolha, tratamento e partilha de dados. É comum que investigadores/as, focados/as na prossecução de um bem maior — como a cura de uma doença —, não compreendam as restrições ao acesso imediato a dados pessoais, nem antecipem os potenciais impactos negativos da sua partilha. Parte desta perceção resulta da suposição de que todos os intervenientes partilham os mesmos objetivos éticos. A inexistência de mecanismos legais que permitam condicionar a reutilização de dados exclusivamente a fins de interesse público — como seria o caso de uma hipotética licença “Para o Bem Maior” (PBM) — constitui uma lacuna sentida neste domínio.

TRÊS DESAFIOS FUTUROS

A evolução tecnológica e o crescimento exponencial da produção científica têm trazido novos desafios à gestão de dados de investigação. Destacam-se, neste contexto, três áreas críticas que exigem atenção e desenvolvimento de boas práticas:

Escalabilidade e Eficiência na Gestão de Grandes Conjuntos de Dados
O aumento significativo do volume de dados digitais, potenciado por avanços tecnológicos, tem permitido a construção de conjuntos de dados mais abrangentes e representativos, com benefícios evidentes para a robustez das conclusões científicas. No entanto, este crescimento acarreta desafios técnicos e logísticos, nomeadamente no que respeita ao armazenamento, ao acesso e à transmissão segura e eficiente desses dados.


Consciencialização Ética e Segurança na Era da Digitalização
A digitalização generalizada tem facilitado o acesso a dados, mas também pode ter contribuído para a diluição de certos mecanismos de controlo ético e de senso comum. Torna-se, por isso, essencial reforçar a consciencialização sobre os princípios éticos associados ao acesso, recolha, tratamento e partilha de dados, bem como sobre os requisitos de segurança que devem acompanhar todas as fases do seu ciclo de vida.


Autenticidade e Integridade dos Dados em Contextos de Inteligência Artificial
A crescente valorização da citação de dados como métrica de impacto pode incentivar, em alguns casos, a criação e disseminação de conjuntos de dados fictícios ou pouco rigorosos. Este fenómeno, já observado na publicação científica, tende a intensificar-se com o uso de inteligência artificial generativa. Embora tal risco seja mitigado em ambientes institucionais com práticas consolidadas e confiança nos investigadores, representa um desafio relevante para projetos que recorrem a dados disponíveis publicamente na Internet, exigindo mecanismos de verificação e validação mais robustos.

CINCO QUESTÕES SOBRE GDI

Como define, implementa e avalia as práticas de gestão de dados de investigação?

A definição e implementação das práticas de gestão de dados de investigação têm ocorrido de forma gradual e adaptativa, refletindo o dinamismo e a complexidade crescente deste domínio. Em muitos casos, as ações desenvolvidas são pontuais ou reativas, surgindo em resposta a situações específicas ou como alinhamento com orientações externas. A maioria dos documentos institucionais que regulam estas práticas são classificados como “documentos de trabalho” ou “em atualização”, assumindo a necessidade de revisão contínua.
Apesar da existência de esforços para estabelecer normas estáveis e duradouras, verifica-se que a adoção de metodologias ágeis e iterativas pode ser mais eficaz na atualidade, mesmo que introduza alguma instabilidade inicial. A gestão de dados de investigação beneficia particularmente desta abordagem, permitindo maior flexibilidade e adaptação às exigências emergentes.

Quais os principais benefícios dessas práticas?

A implementação sistemática de práticas de gestão de dados de investigação contribui para aumentar a confiança no ecossistema científico.  A interação entre investigadores/as e entidades institucionais (orientadores, comissões de ética, gabinetes de proteção de dados) promove uma reflexão aprofundada sobre os projetos desde as suas fases iniciais.
Por outro lado, permite uma melhor estruturação dos projetos, dado que as práticas de gestão induzem maior organização e planeamento, favorecendo a qualidade e a rastreabilidade dos processos científicos.
E possibilita ainda consciencialização sobre boas práticas, uma vez que a gestão de dados estimula a adoção de medidas associadas à proteção de dados, à documentação e à reutilização responsável.

Em que medida a gestão de dados de investigação contribui para a otimização do processo de investigação?

A gestão de dados de investigação otimiza o processo científico em diferentes fases:

Para quem utiliza os dados: Dados bem geridos estão prontos a usar, com mínima necessidade de transformação.

Para quem prepara os dados: Embora as tarefas de enriquecimento e organização possam parecer exigentes inicialmente, revelam-se vantajosas na fase de experimentação e reutilização, reduzindo retrabalho e aumentando a eficiência.

Que vantagens e condicionantes aponta na partilha de dados de investigação?

A partilha de dados de investigação apresenta benefícios e desafios:

Vantagens

Avanço científico: Contribui para o progresso da ciência e para o benefício da sociedade.

Reutilização e atribuição: Potencia o trabalho de quem produz os dados, promovendo a sua citação e valorização.

Condicionantes

Riscos de uso indevido: Possibilidade de utilização maliciosa dos dados, como personificação ou exploração indevida.

Resultados prejudiciais: Investigação baseada em dados partilhados pode, em casos extremos, gerar impactos negativos.

De que forma os diferentes atores envolvidos no processo de investigação estão comprometidos com a gestão de dados de investigação?

A comunidade científica da UBI demonstra crescente envolvimento com a gestão de dados de investigação. Embora o grau de compromisso varie entre atores, observa-se uma preocupação transversal com a melhoria contínua das práticas. Os órgãos de gestão institucional estão investidos na promoção de políticas e infraestruturas que sustentem este compromisso.