De que forma a interoperabilidade reforça o impacto científico e social do portal BIOS?

Quais os principais desafios para garantir a sustentabilidade institucional e evitar a dependência exclusiva das equipas científicas?

Como a integração da ciência cidadã e a normalização dos formatos contribuem para a valorização e reutilização dos dados de biodiversidade?

DESCRIÇÃO

O portal BIOS – Biodiversidade dos Açores teve início em 2004, no contexto de um projeto INTERREG que envolveu as regiões das Canárias, Açores, Madeira e Cabo Verde. A proposta inicial visava a criação de uma plataforma de biodiversidade comum, interoperável e comunicável entre todas estas regiões.

Apesar do sucesso inicial, o projeto não teve continuidade em Cabo Verde e na Madeira. No primeiro caso, a ausência de condições operacionais e de capacidade científica dificultou o avanço. No segundo, questões de política interna e reservas relativamente à partilha de dados de biodiversidade impediram a consolidação da iniciativa. Ainda assim, foram produzidas listagens taxonómicas em todas as regiões, incluindo duas para os Açores (2005 e 2010) e uma para a Madeira (2008), elaborada com a colaboração de equipas locais e nacionais.

Nas Canárias, o projeto evoluiu de forma consistente, resultando na criação de uma ferramenta de partilha de dados de elevada relevância para a gestão territorial e para as políticas públicas de conservação. Nos Açores, o percurso foi distinto: após um envolvimento inicial do Governo Regional, a continuidade do projeto passou a ser assegurada pela equipa científica local, que integrou o Portal Biota a nível nacional como infraestrutura reconhecida pela Fundação para a Ciência e a Tecnologia (FCT).

Atualmente, o BIOS é considerado uma infraestrutura oficial do Governo Regional dos Açores e encontra-se em processo de candidatura a financiamento no âmbito das infraestruturas regionais, prevendo-se um apoio significativo para a sua manutenção e desenvolvimento.

A experiência acumulada ao longo do projeto permitiu identificar três questões centrais no domínio da gestão e partilha de dados de investigação:

Disponibilização e interoperabilidade dos dados: a necessidade de assegurar que os sistemas criados sejam compatíveis e comunicáveis entre diferentes regiões e instituições.

Sustentabilidade institucional: a importância de garantir apoio político e recursos humanos adequados para a manutenção das infraestruturas de dados, evitando dependência exclusiva das equipas científicas.

Valorização e aplicação dos dados: a relevância de promover a utilização dos dados de biodiversidade em políticas públicas, planeamento territorial e iniciativas de conservação, reforçando o impacto social e científico da partilha de informação.

O projeto BIOS representa um percurso de mais de duas décadas de trabalho colaborativo, marcado por avanços significativos na disponibilização de dados de biodiversidade e pela consolidação de uma infraestrutura científica regional. A experiência evidencia tanto o potencial da partilha de dados para a ciência e para a sociedade, como os desafios institucionais e políticos que ainda se colocam à sua plena integração e sustentabilidade.

TRÊS LIÇÕES APRENDIDAS

Limitações dos sistemas iniciais

Os primeiros modelos de gestão de dados assentavam em software instalado localmente e em servidores dedicados, o que implicava custos elevados de manutenção e exigia equipas técnicas especializadas para garantir o funcionamento. A natureza fechada destes sistemas criava barreiras significativas: apenas utilizadores com conhecimentos avançados conseguiam aceder ou manipular os dados, o que reduzia drasticamente o potencial de reutilização. Além disso, a ausência de mecanismos de interoperabilidade dificultava a integração com outras bases de dados e plataformas, fragmentando a informação e limitando a sua circulação. Como consequência, os dados permaneciam isolados em silos institucionais, sem alcançar a comunidade científica mais ampla nem a sociedade, que poderia beneficiar do seu valor.

Necessidade de plataformas online abertas

A evolução tecnológica e a crescente valorização da ciência aberta evidenciaram a necessidade de migrar para plataformas acessíveis diretamente pela internet. Estas soluções eliminaram a dependência de software especializado, tornando o processo de disponibilização e carregamento de dados mais intuitivo e inclusivo. A acessibilidade universal passou a ser um princípio estruturante, permitindo que investigadores, gestores de dados e cidadãos acedam às informações sem barreiras técnicas. Além disso, a interoperabilidade tornou-se uma característica central, facilitando a integração com sistemas internacionais e potenciando colaborações transfronteiriças. Exemplos como o Atlas of Living Australia demonstraram que a abertura não só amplia o alcance dos dados, como também fortalece a confiança da comunidade científica e da sociedade na sua utilização.

Integração da ciência cidadã e normalização dos formatos

A incorporação de ferramentas de ciência cidadã, como o iNaturalist, trouxe uma dimensão participativa inédita, permitindo que qualquer pessoa contribua para a recolha e disponibilização de dados. Este envolvimento da sociedade aumentou a diversidade e a escala da informação recolhida, enriquecendo os repositórios científicos com dados provenientes de múltiplos contextos. 

Paralelamente, a adoção de padrões internacionais como o Darwin Core foi decisiva para assegurar a interoperabilidade, permitindo que os dados sejam reutilizados em diferentes plataformas e contextos — desde portais regionais e nacionais até bases globais e publicações científicas. A normalização dos formatos também facilitou a criação de data papers, que conferem reconhecimento académico ao trabalho de recolha e gestão de dados, reforçando a credibilidade e a visibilidade dos resultados. Este alinhamento entre participação cidadã e padronização técnica consolidou uma cultura de abertura e confiança, essencial para a valorização dos dados científicos.

TRÊS DESAFIOS FUTUROS

Recursos humanos e sustentabilidade da equipa

A escassez de recursos humanos dedicados à manutenção da infraestrutura constitui um dos maiores entraves à sua consolidação. Apesar de fases de financiamento terem permitido a contratação temporária de bolseiros, que apoiaram investigadores na preparação de dados e data papers, a ausência de mecanismos de apoio continuado para pessoal técnico especializado compromete a estabilidade da equipa. Esta intermitência gera descontinuidade no trabalho, dificulta a retenção de competências e impede a criação de rotinas sólidas de gestão de dados. Sem uma equipa estável e qualificada, torna-se difícil assegurar a eficiência na mobilização, curadoria e disponibilização dos dados, o que fragiliza a credibilidade e a capacidade de resposta da infraestrutura perante desafios crescentes.

Infraestrutura tecnológica e capacidade institucional

A limitação da capacidade técnica das instituições para gerir servidores, garantir requisitos de rede e assegurar padrões de segurança representa outro obstáculo significativo. A inexistência de condições adequadas obriga ao recurso a empresas externas para a gestão da infraestrutura, financiadas com verbas de investigação que deveriam ser canalizadas para atividades científicas. Esta dependência externa aumenta os custos operacionais e reduz a autonomia do projeto, tornando-o vulnerável a flutuações de mercado e à disponibilidade de serviços contratados. Além disso, a falta de uma base tecnológica sólida dentro da instituição dificulta a integração da infraestrutura em estratégias mais amplas de ciência aberta e gestão de dados, limitando o seu impacto e alcance.

Institucionalização e continuidade a longo prazo

Garantir que a infraestrutura seja assumida de forma institucional pelo Governo Regional ou por entidades nacionais é um desafio crítico para a sua sustentabilidade. Atualmente, a continuidade depende sobretudo da visão e dedicação das equipas de investigação, sem integração plena nas estruturas oficiais. Esta dependência de lideranças individuais coloca em risco a perenidade do projeto, especialmente perante a eventual saída ou reforma dos investigadores que o impulsionam. A institucionalização é, portanto, essencial para assegurar estabilidade, financiamento regular e reconhecimento formal da infraestrutura como parte integrante das políticas científicas e tecnológicas. Só através desta integração será possível garantir relevância a longo prazo, consolidar a confiança da comunidade científica e da sociedade, e transformar a infraestrutura num recurso estratégico para o desenvolvimento regional e nacional.

CINCO QUESTÕES SOBRE GDI

Como define, implementa e avalia as práticas de gestão de dados de investigação?

A gestão de dados de investigação é assegurada através de um processo estruturado que combina normas internacionais, mecanismos de validação em múltiplos níveis e práticas de revisão contínua. O objetivo central é garantir que os dados recolhidos, sejam provenientes de ciência cidadã, de projetos de estudantes de doutoramento e mestrado ou de equipas de investigação, tenham qualidade científica, consistência taxonómica e credibilidade para serem reutilizados em diferentes contextos.

A recolha de dados, orientada por standards previamente definidos como o Darwin Core, estabelece regras claras sobre formatos, categorias e metodologias de registo. Esta normalização facilita a uniformização dos dados, reduz ambiguidades e assegura que diferentes equipas e contextos de recolha possam produzir informação compatível e interoperável. O uso de tabelas e modelos estruturados constitui um benefício adicional pois orienta investigadores e cidadãos na forma correta de recolher e descrever os dados promovendo consistência desde o início do processo.

A qualidade dos dados é avaliada em quatro níveis complementares. No nível inicial os orientadores de alunos de doutoramento e mestrado asseguram que os dados recolhidos têm validade científica e rigor taxonómico; no nível intermédio a própria plataforma de gestão GBIF deteta erros estruturais ou taxonómicos durante a submissão obrigando à sua correção antes da integração definitiva; no nível avançado, revistas científicas especializadas como o  Biodiversity Data Journal realizam uma revisão detalhada das tabelas e metadados identificando inconsistências que devem ser corrigidas e recarregadas. No último nível, os data papers publicados permitem ainda uma última revisão pelos pares garantindo que os dados disponibilizados cumprem critérios de qualidade e podem ser reutilizados com confiança.

Assim, a avaliação e implementação das práticas de gestão de dados de investigação assentam numa combinação de normalização técnica validação, em múltiplos níveis e revisão contínua. Este modelo garante não apenas a qualidade e credibilidade dos dados mas também a sua valorização científica e social ao permitir que sejam reutilizados em diferentes contextos e reconhecidos como parte integrante da produção académica

Quais os principais benefícios dessas práticas?

A principal vantagem decorre da adoção de standards internacionais na organização dos dados que imprime versatilidade, permitindo que a mesma base de informação seja utilizada para múltiplos fins sem necessidade de duplicação de esforços. Quando os dados são estruturados de acordo com normas como o Darwin Core, tornam-se imediatamente aplicáveis em diferentes contextos, desde a gestão interna de projetos de investigação até à disponibilização em plataformas internacionais.

O percurso de utilização dos dados, desde a primeira fase na qual os alunos de mestrado e doutoramento asseguram eles próprios a qualidade da recolha, passando pelos processos de validação automática do GBIF e /ou a integração em portais regionais, até à sua publicação em plataformas de data papers demonstra que um único produto inicial — a base de dados organizada segundo standards — pode sustentar quatro níveis distintos de utilização: investigação individual dos alunos, integração em plataformas globais, disponibilização em portais regionais e publicação científica.

Este modelo revela-se particularmente vantajoso porque reduz a necessidade de intervenção constante dos orientadores, que passam a focar-se na supervisão científica geral, enquanto os alunos desenvolvem autonomia na gestão dos seus dados. A uniformização e a reutilização em múltiplos contextos reforçam não apenas a eficiência da investigação, mas também a credibilidade e o impacto dos resultados produzidos.

Em que medida a gestão de dados de investigação contribui para a otimização do processo de investigação?

A implementação de práticas estruturadas de gestão de dados tem um efeito direto na otimização do processo científico. Ao trabalhar com dados organizados segundo standards internacionais, os estudantes desenvolvem não apenas competências técnicas, mas também uma maior consciência da importância da qualidade e da consistência da informação que produzem. O facto de saberem que os seus dados serão submetidos a diferentes níveis de validação e revisão — desde a supervisão dos orientadores até à avaliação em plataformas internacionais e revistas científicas — incentiva-os a adotar uma postura mais rigorosa e sistemática na recolha, organização e análise da informação.

Este processo contribui para a eficiência da investigação, uma vez que dados bem estruturados podem ser facilmente integrados em softwares de análise estatística, modelos de investigação ou bases de dados globais. A uniformização reduz redundâncias e erros, permitindo que os investigadores concentrem esforços na interpretação científica e não na resolução de problemas técnicos.

Além disso, a experiência adquirida pelos estudantes na gestão de dados segundo normas reconhecidas internacionalmente constitui uma aprendizagem duradoura. Mesmo após concluírem os seus estudos ou seguirem outros percursos profissionais, levam consigo boas práticas de organização, documentação e partilha de informação, que podem ser aplicadas em diferentes contextos científicos ou profissionais.

Este impacto é também de natureza formativa e heurística, pois promove uma cultura de rigor, transparência e eficiência que ultrapassa o âmbito imediato da investigação académica. A gestão de dados deixa de ser apenas uma exigência técnica e passa a ser entendida como parte integrante da prática científica, contribuindo para a credibilidade dos resultados e para a sustentabilidade da ciência aberta.

Que vantagens e condicionantes aponta na partilha de dados de investigação?

A partilha de dados de investigação constitui um elemento central para a valorização científica e social da informação produzida. Atualmente, os dados recolhidos podem ser disponibilizados e reutilizados de forma ampla, desde que seja garantido o devido crédito aos seus autores. Esta abertura promove transparência, reforça a credibilidade dos resultados e facilita a integração em plataformas regionais, nacionais e internacionais, ampliando o impacto da investigação.

Do ponto de vista académico, a partilha permite que estudantes e investigadores utilizem os mesmos conjuntos de dados em diferentes fases do trabalho científico, desde análises estatísticas até publicações em data papers. A disponibilização em portais assegura visibilidade internacional e contribui para a consolidação de boas práticas de ciência aberta.

Embora a regra geral seja a abertura, existem situações específicas em que condicionantes éticas ou de privacidade exigem ajustamentos. Um exemplo recente ocorreu com dados de monitorização de térmitas nos Açores, recolhidos ao longo de 15 anos. Inicialmente, os registos incluíam a localização precisa das ocorrências, mas foi identificado o risco de que essa informação pudesse ser utilizada de forma indevida, por exemplo em transações imobiliárias. Para mitigar este problema, os dados foram disponibilizados com menor resolução espacial, agregando pontos num raio de 500 metros.

Este caso ilustra que, em determinadas circunstâncias, a proteção da privacidade ou a salvaguarda de interesses sociais pode exigir a redução da precisão dos dados. No entanto, mesmo com estas limitações, foi possível garantir a sua disponibilização, preservando o valor científico e assegurando a reutilização em contextos de investigação.

De que forma os diferentes atores envolvidos no processo de investigação estão comprometidos com a gestão de dados de investigação?

A gestão de dados de investigação envolve múltiplos atores, cada um com responsabilidades e níveis distintos de compromisso. No caso dos estudantes de mestrado e doutoramento, o envolvimento é direto e prático, uma vez que são eles que recolhem, organizam e estruturam os dados segundo standards internacionais. Este processo não só garante a qualidade e a consistência da informação, como também promove a aprendizagem de boas práticas que se tornam parte integrante da sua formação científica.

Os orientadores desempenham um papel complementar, assegurando a supervisão científica geral e validando a credibilidade dos dados produzidos. Embora não estejam envolvidos em todos os detalhes técnicos, apoiam os estudantes na adoção de metodologias rigorosas e na integração dos dados em contextos mais amplos, como publicações ou plataformas internacionais.

Ao nível institucional, a Universidade dos Açores demonstra abertura à partilha de dados e já possui experiência consolidada na gestão de repositórios de publicações. Contudo, a sua capacidade instalada em termos de servidores e infraestrutura tecnológica é limitada, o que obriga ao recurso a empresas externas para assegurar a manutenção e segurança da plataforma. Apesar destas restrições, não existe resistência à disponibilização dos dados, havendo colaboração por parte dos serviços internos, nomeadamente o serviço de informática, que responde de forma eficiente às necessidades operacionais.

No plano político, o Governo Regional dos Açores ainda não assumiu plenamente a responsabilidade pela institucionalização da infraestrutura de dados, o que fragiliza a sustentabilidade a longo prazo. A continuidade depende sobretudo da dedicação das equipas de investigação, sem integração formal nas estruturas oficiais. Esta situação revela que o compromisso existe, mas é desigual: forte ao nível das equipas e dos estudantes, moderado ao nível da universidade e ainda incipiente ao nível governamental.

Em síntese, o processo de gestão de dados de investigação é sustentado por uma rede de atores que, embora com diferentes graus de envolvimento, partilham uma sensibilidade crescente para a importância da ciência aberta. O desafio futuro reside em transformar este compromisso em políticas institucionais e governamentais que assegurem estabilidade, recursos e reconhecimento formal da infraestrutura como parte integrante do sistema científico.