Como pode a partilha de dados transformar rotinas internas de investigação?

De que forma a organização dos dados reforça a continuidade e coesão das equipas?

Será a estruturação dos dados uma ferramenta metodológica tão importante quanto a recolha?

Como transformar a gestão de dados científicos numa prática valorizada e duradoura?

DESCRIÇÃO

O projeto de investigação em cognição comparada desenvolve trabalho contínuo na análise do comportamento entre espécies humanas e não humanas, com o objetivo de compreender processos psicológicos fundamentais como perceção, memória, aprendizagem, tomada de decisão e esquecimento. A abordagem adotada é comparativa e integradora, explorando diferentes espécies para identificar estratégias cognitivas e regras de comportamento adaptativo. As questões centrais incluem a forma como os organismos extraem informação relevante do ambiente, como navegam em contextos complexos e como tomam decisões entre opções disponíveis.

Os dados recolhidos são essencialmente quantitativos, incluindo métricas como frequência de respostas, escolhas entre alternativas, taxas de acerto e erro, e latência de resposta. Estas variáveis, baseadas em contagens e tempos, permitem inferir processos cognitivos subjacentes ao comportamento observado, constituindo uma base sólida para a análise científica.

O interesse em publicar os dados associados às publicações científicas levou ao desenvolvimento de práticas internas de organização e gestão. Embora os métodos de recolha se tenham mantido estáveis, a forma como os dados são tratados após a recolha sofreu melhorias significativas. Durante anos, foram enfrentadas dificuldades na sistematização dos dados, especialmente em momentos de transição de membros da equipa. A ausência de um sistema estruturado dificultava o acesso posterior aos dados e comprometia a continuidade da investigação. Em resposta, foram adotadas medidas que visam garantir a preservação, acessibilidade e reutilização dos dados, com vista à sua publicação em repositórios institucionais e à integração em práticas alinhadas com os princípios da ciência aberta.

TRÊS LIÇÕES APRENDIDAS

A partilha como prática transformadora

Uma das principais mudanças no grupo de investigação foi a adoção sistemática da partilha de dados através do repositório institucional. Esta prática, inicialmente vista como uma tarefa altruísta — feita para beneficiar outros investigadores — revelou-se crítica para a evolução das metodologias internas. Atualmente, tudo o que é produzido é publicado no repositório, com o apoio fundamental dos serviços de documentação e biblioteca, que disponibilizam ferramentas e orientações essenciais.

A existência de uma infraestrutura já montada foi uma das grandes lições: não é necessário reinventar a roda! O sistema de repositório oferece opções de categorização e formatos padronizados que facilitam a organização e publicação dos dados. Esta estrutura externa ajuda a ultrapassar a tendência natural de trabalhar apenas para consumo interno, promovendo uma organização mais clara e acessível.

Organização e inteligibilidade dos dados

Mesmo para o próprio investigador, os dados podem perder inteligibilidade ao longo do tempo. Torná-los compreensíveis para terceiros é, simultaneamente, uma forma eficaz de organizar o trabalho e de garantir a sua longevidade. A partilha obriga à sistematização, o que melhora a fluidez dentro do grupo de investigação.

Em estudos com animais, por exemplo, onde as recolhas são diárias e prolongadas, a organização dos dados permite que qualquer membro da equipa possa substituir outro em caso de ausência, sem comprometer a continuidade da investigação. Esta prática reforça a coesão e a eficiência do grupo.

Comunicação científica e reflexão metodológica

Outra lição apreendida é o impacto na comunicação científica. Explicar processos complexos de forma clara e acessível exige reflexão sobre a estrutura dos dados e sobre a melhor forma de os apresentar. Este exercício de descentração — pensar como os outros vão interpretar o que foi feito — ajuda os investigadores a olhar para os seus próprios dados com maior clareza.

A organização da informação, portanto, não é apenas uma questão técnica, mas uma ferramenta de pensamento. Ao integrar os dados em sistemas externos, o grupo deparou-se com desafios de enquadramento: onde é que este tipo de investigação se insere? Quão próxima está de outras áreas? 

Mesmo quando há motivação para organizar, a realidade da investigação é caótica, e os sistemas padronizados ajudam a transformar essa complexidade em estrutura.

TRÊS DESAFIOS FUTUROS

Superar barreiras terminológicas e disciplinaridades fragmentadas

Um dos desafios mais persistentes na ciência contemporânea é a fragmentação terminológica entre disciplinas que, embora distintas, partilham conceitos e metodologias semelhantes. Exemplifica-se esta realidade com o conceito de priming na psicologia, equivalente ao search image na etologia — duas designações para o mesmo fenómeno. Esta duplicação terminológica dificulta o diálogo interdisciplinar e impede a construção de conhecimento partilhado.

A partilha de dados, acompanhada de metadados rigorosos, surge como uma estratégia fundamental para ultrapassar estas barreiras. Ao tornar os dados acessíveis e bem descritos, abre-se espaço para que investigadores de diferentes áreas possam reinterpretá-los, reutilizá-los e estabelecer novas conexões. A criação de pontes entre disciplinas exige, portanto, não apenas abertura conceptual, mas também práticas de documentação e partilha que favoreçam a inteligibilidade e a interoperabilidade dos dados.

Reequilibrar a relação entre investigação básica e aplicada

Outro desafio crítico prende-se com a crescente assimetria entre investigação básica e aplicada, especialmente em áreas como a psicologia. A pressão por resultados com aplicação imediata tem levado ao desinvestimento em estudos fundamentais, comprometendo o avanço científico a longo prazo. Pretende-se, muitas vezes, colher os frutos da ciência sem investir na plantação das sementes.

A partilha de dados pode funcionar como um mecanismo de reequilíbrio, permitindo que resultados de investigação básica sejam reutilizados em contextos aplicados, mesmo quando a sua utilidade não era evidente no momento da recolha. No entanto, esta ponte entre vertentes exige também uma mudança nos critérios de avaliação científica, que devem reconhecer o valor intrínseco da investigação fundamental.

Além disso, dentro da própria psicologia, a ligação entre investigação básica e aplicada é frequentemente frágil. A partilha estruturada de dados pode contribuir para reforçar essa ligação, promovendo uma maior circulação de conhecimento entre subáreas e facilitando a tradução de descobertas em soluções práticas.

Decidir o que partilhar e como garantir sustentabilidade

A decisão sobre o que partilhar — e em que condições — constitui um dos dilemas mais complexos da gestão de dados. Em estudos experimentais, como os realizados com animais, os dados recolhidos incluem múltiplas variáveis (escolhas, latências, taxas de acerto), nem todas tratadas ou publicadas. Embora os dados brutos possam ter valor futuro, a sua partilha implica custos significativos de organização, curadoria e interpretação.

Muitos desses dados “invisíveis” existem e podem ser recuperados, mas a sua disponibilização exige um esforço adicional que nem sempre é viável. A alternativa — não os partilhar — limita o potencial de reutilização científica. Assim, torna-se necessário encontrar um equilíbrio entre exaustividade e viabilidade, definindo critérios claros para a seleção, tratamento e preservação dos dados.

CINCO QUESTÕES SOBRE GDI

Como define, implementa e avalia as práticas de gestão de dados de investigação?

A implementação das práticas de gestão de dados no grupo de investigação em psicologia tem seguido uma abordagem gradual, prática e centrada na melhoria contínua. Em vez de aguardar por soluções perfeitas, o grupo iniciou com procedimentos simples, que foram sendo refinados à medida que a experiência se acumulava. Um exemplo claro deste processo evolutivo é a inclusão progressiva de elementos como o software de recolha nos depósitos de dados, com revisões retroativas sempre que necessário. Esta lógica iterativa permite ajustar e melhorar continuamente os procedimentos, sem comprometer a continuidade do trabalho.

A avaliação das práticas é feita de forma interna e prática, com destaque para a estratégia de envolver estudantes no processo. Ao realizarem o seu primeiro depósito de dados com instruções mínimas, os estudantes são incentivados a explorar a base de dados existente, o que permite testar a inteligibilidade da documentação e identificar oportunidades de melhoria. Embora não se trate de uma avaliação formal, esta abordagem funciona como um mecanismo eficaz de autoavaliação e aprendizagem.

Do ponto de vista técnico, o grupo reconhece desafios relacionados com a interoperabilidade dos formatos utilizados, nomeadamente o uso de ficheiros Excel. A reflexão sobre formatos mais adequados e alinhados com os princípios FAIR está em curso, integrando-se num esforço mais amplo de conformidade com boas práticas internacionais.

Uma decisão estruturante foi a integração do depósito de dados como parte obrigatória do processo de publicação científica. Nenhum artigo é submetido sem que os dados estejam previamente depositados num repositório institucional, o qual gera automaticamente um código de referência (identificador persistente) a ser incluído na publicação. Esta prática reforça a normalização do depósito e assegura a rastreabilidade dos dados.

Apesar da ausência de incentivos formais específicos para a gestão de dados — frequentemente vista como uma tarefa com custos imediatos e benefícios diferidos — o grupo conseguiu integrar esta prática no sistema de incentivos já existente, associando-a diretamente à publicação científica. Esta estratégia contribui para a sustentabilidade da prática, tornando o depósito de dados uma etapa natural do ciclo de investigação.

Quais os principais benefícios dessas práticas?

Os benefícios decorrentes da abordagem adotada para a gestão de dados são amplos e estruturantes, refletindo-se tanto na qualidade do trabalho científico como na sua sustentabilidade a longo prazo. Em primeiro lugar, destaca-se a promoção de uma organização eficaz dos dados, que permite não apenas o seu armazenamento sistemático, mas também a preservação da integridade e da rastreabilidade da informação recolhida ao longo dos projetos. Esta organização facilita o acesso futuro aos dados, mesmo em contextos de rotatividade de equipa, assegurando a continuidade da investigação e a valorização dos resultados obtidos.

A reutilização dos dados é outro benefício central, possibilitada pela sua estruturação clara e pela adoção de práticas que favorecem a partilha em ambientes académicos reconhecidos. Ao tornar os dados acessíveis e compreensíveis para terceiros, abre-se espaço para novas análises, comparações e colaborações, ampliando o impacto da investigação original e fomentando a produção de conhecimento cumulativo.

A transparência do processo científico é igualmente reforçada, uma vez que os dados passam a estar disponíveis para verificação, validação e reutilização por outros investigadores. Esta abertura contribui para a credibilidade dos resultados e para a construção de uma ciência mais ética, responsável e alinhada com os princípios da integridade académica.

Importa também sublinhar que a gestão de dados é conduzida de forma prática e adaptada à realidade de um grupo pequeno, o que permite uma maior agilidade na implementação de rotinas e na resposta a desafios operacionais. A utilização de estratégias comportamentais, coerentes com o campo de estudo, tem sido eficaz na transformação de práticas pontuais em hábitos sustentáveis, promovendo uma cultura interna de responsabilidade e compromisso com a qualidade.

Esta coerência entre os princípios que orientam a investigação e as práticas adotadas no seu quotidiano contribui para uma cultura institucional de abertura e partilha, em sintonia com os valores da ciência aberta e com os desafios contemporâneos da produção científica. Ao integrar a gestão de dados como parte integrante do processo de investigação, reforça-se a ideia de que a produção de conhecimento não termina na publicação, mas prolonga-se na forma como os dados são preservados, disponibilizados e reutilizados.

Em que medida a gestão de dados de investigação contribui para a otimização do processo de investigação?

A gestão e partilha de dados têm um impacto direto na otimização do processo de trabalho científico, sobretudo nas fases posteriores à recolha inicial. Embora os métodos de recolha não tenham sido alterados, a organização dos dados após essa etapa beneficiou significativamente da implementação de práticas estruturadas. A estandardização dos procedimentos permitiu reduzir a carga administrativa, facilitar a comunicação entre membros da equipa e reutilizar estruturas previamente desenvolvidas. Estes ganhos traduzem-se em poupança de tempo e recursos, promovendo maior eficiência na condução dos estudos e na gestão quotidiana dos projetos.

Para além da eficiência operacional, a gestão de dados também contribui para a otimização ética da investigação, especialmente em contextos que envolvem animais não humanos. A partilha de dados já recolhidos por outros grupos permite evitar novas recolhas que impliquem exposição dos animais a procedimentos invasivos, alinhando-se com o princípio dos 3Rs — redução, substituição e refinamento. Esta prática reforça o compromisso com uma investigação responsável, respeitando os direitos dos sujeitos envolvidos e promovendo uma utilização mais racional dos recursos científicos.

Mesmo em estudos com participantes humanos, a reutilização de dados previamente organizados e acessíveis permite evitar redundâncias, acelerar o progresso científico e partir de bases já consolidadas. Esta abordagem favorece a continuidade da investigação, facilita a replicação de estudos e contribui para a construção de conhecimento cumulativo, com benefícios claros para a qualidade e a sustentabilidade da produção científica.

Que vantagens e condicionantes aponta na partilha de dados de investigação?

A partilha de dados de investigação apresenta um conjunto robusto de vantagens que contribuem para a qualidade, integridade e impacto da produção científica. Um dos benefícios mais imediatos é a organização e sistematização dos dados. O simples facto de preparar os dados para partilha obriga à sua estruturação clara, o que melhora a eficiência interna dos projetos e facilita a comunicação entre os membros da equipa. Esta prática promove uma cultura de rigor e transparência, com efeitos positivos na gestão quotidiana da investigação.

A partilha de dados também responde a uma responsabilidade pública fundamental. Quando a investigação é financiada por fundos públicos, existe uma obrigação ética de tornar os dados acessíveis e inteligíveis, reforçando o compromisso com a ciência aberta e com a prestação de contas à sociedade. Neste sentido, a disponibilização dos dados é encarada não apenas como uma boa prática, mas como um dever cívico e académico.

Outro aspeto relevante é o potencial motivador da partilha, sobretudo para investigadores em início de carreira. Ao transformar os dados num produto científico adicional, com valor próprio e possibilidade de citação, esta prática contribui para a valorização do trabalho desenvolvido e para o reconhecimento do esforço investido na sua produção e curadoria.

Do ponto de vista metodológico, a partilha de dados permite a validação cruzada de resultados, especialmente em áreas como a psicologia, onde os fenómenos estudados são frequentemente inferidos de forma indireta. A comparação entre diferentes tarefas e metodologias reduz vieses, fortalece a validade dos resultados e promove uma ciência mais robusta. A reprodutibilidade é igualmente beneficiada, uma vez que a disponibilização dos dados facilita o processo de revisão científica e permite replicações mais rigorosas.

Apesar destes benefícios, persistem condicionantes relevantes que limitam a adoção generalizada da partilha de dados. Um dos principais desafios prende-se com os custos associados à preparação, tratamento e publicação dos dados. Este processo exige tempo, esforço e competências específicas, o que pode tornar inviável a partilha integral de todos os conjuntos de dados. É, por isso, necessário encontrar um equilíbrio entre a utilidade da partilha e a sustentabilidade do esforço envolvido.

A sobrecarga dos investigadores constitui outro obstáculo significativo. Para além das exigências da investigação, os profissionais acumulam responsabilidades de ensino, captação de financiamento, extensão científica e gestão administrativa. A gestão de dados surge como mais uma tarefa num contexto já altamente exigente, o que pode comprometer a sua priorização.

Por fim, a ausência de incentivos formais nos sistemas de avaliação académica limita o reconhecimento institucional destas práticas. Enquanto a publicação de artigos continua a ser o principal critério de valorização curricular, a gestão e partilha de dados permanecem pouco visíveis, o que dificulta a sua integração plena nas rotinas científicas.

De que forma os diferentes atores envolvidos no processo de investigação estão comprometidos com a gestão de dados de investigação?

A transformação das práticas de gestão de dados na investigação científica depende do envolvimento articulado de múltiplos atores institucionais e individuais. A eficácia dessas práticas não se mede apenas pela sua implementação pontual, mas pela sua consolidação ao longo do tempo e pela capacidade de gerar mudanças comportamentais sustentadas. Neste contexto, o papel dos incentivos, do reconhecimento institucional e da criação de condições favoráveis à mudança é determinante.

As iniciativas de promoção da gestão de dados são particularmente eficazes junto de investigadores que já reconhecem o valor da partilha, mas ainda não a integram nas suas rotinas. Para este grupo, exemplos inspiradores e boas práticas podem funcionar como catalisadores de mudança. No entanto, para que essa mudança se torne estrutural, é necessário ir além da inspiração e atuar sobre o contexto em que os comportamentos científicos se desenvolvem.

A imposição de regras pode ser um ponto de partida útil, mas não é suficiente por si só. A valorização simbólica e institucional das práticas de gestão de dados — através de prémios, reconhecimento curricular ou indicadores específicos — é essencial para tornar essas práticas desejáveis e não apenas obrigatórias. A motivação dos investigadores está muitas vezes ligada à perceção de recompensa, seja ela material, reputacional ou simbólica. Assim, o desenho dos sistemas de avaliação científica deve refletir essa realidade, reconhecendo o trabalho invisível que sustenta os resultados visíveis.

A psicologia do incentivo oferece uma lente útil para compreender este fenómeno. Tal como outros animais, os humanos respondem a estímulos e recompensas. Se o sistema valoriza a quantidade de publicações, os investigadores tenderão a priorizar volume. Se, por outro lado, forem recompensadas práticas como a partilha de dados, a transparência e a colaboração, essas tornar-se-ão mais frequentes. Esta lógica exige uma revisão crítica das métricas atualmente utilizadas, evitando que se tornem metas distorcidas que comprometem a integridade do processo científico.

As instituições desempenham um papel central neste processo. Para além de disponibilizarem formação e plataformas técnicas, devem criar condições estruturais que favoreçam a adoção de boas práticas. Os serviços de documentação e bibliotecas, por exemplo, são atores fundamentais na operacionalização da gestão de dados, mas o seu contributo nem sempre é devidamente reconhecido. A mudança de comportamento exige mais do que capacitação: exige contexto, regras claras e valorização institucional.

A persistência é outro fator crítico. Mesmo quando os resultados não são imediatamente visíveis, a continuidade das ações é essencial para consolidar uma cultura de ciência aberta. A ausência de reconhecimento pode gerar desânimo, especialmente quando o esforço investido parece não produzir efeitos. No entanto, é precisamente essa persistência — muitas vezes silenciosa — que sustenta a transformação a longo prazo.