Como gerir dados históricos e comunitários de forma ética, acessível e cientificamente válida?
Estão as infraestruturas digitais preparadas para acolher dados das ciências sociais e humanas?
Que desafios levanta a curadoria de testemunhos orais enquanto dados de investigação?
DESCRIÇÃO
O projeto constitui uma investigação histórica centrada na arquitetura e na sua relação com as comunidades locais. A iniciativa parte da observação de elementos já identificados por outros estudos, mas que revelam camadas de significado ainda não plenamente exploradas. Trata-se de um campo específico, com desafios próprios, sobretudo no que se refere à acessibilidade e à gestão dos dados gerados.
Este trabalho levanta questões relevantes sobre a capacidade das instituições para lidar com dados provenientes das ciências sociais e humanas. Observa-se, ainda hoje, uma predominância de abordagens centradas nas ciências exatas e naturais, o que dificulta a adaptação de metodologias e infraestruturas às exigências das ciências sociais. Tal limitação tem representado um dos principais desafios enfrentados, exigindo constante negociação e ajustamento de práticas.
A questão central que orienta o projeto é: de que forma a história da arquitetura pode contribuir para que as comunidades continuem a utilizar edifícios públicos? Para responder a esta pergunta, foram desenvolvidos dois projetos complementares: um projeto financiado pela Fundação para a Ciência e a Tecnologia (FCT), com foco nas regiões do Alentejo e Algarve; um projeto financiado pelo European Research Council (ERC), de maior escala, abrangendo todo o território português e incluindo também impactos provenientes de Espanha.
Enquanto o projeto FCT se concentrou no sul do país, o projeto ERC dedicou-se ao centro e norte. Em ambos os casos, foram aplicadas metodologias tradicionais de investigação histórica, complementadas pela recolha de testemunhos orais — memórias, experiências e narrativas associadas à vivência em edifícios públicos.
Dessa abordagem resultaram dois conjuntos principais de dados: dados de oralidade: transcrições de entrevistas com membros das comunidades, que requerem cuidados éticos e legais, especialmente no que diz respeito à privacidade e à gestão de dados sensíveis; dados históricos tradicionais: documentação, registos e fontes que integram a base de dados do projeto.
Estes dados estão organizados na plataforma digital Arquitetura Aqui, composta por um site e uma base. A infraestrutura foi concebida com base nos princípios do acesso aberto, permitindo a disponibilização pública da maior quantidade possível de dados, sem comprometer a sua integridade ou confidencialidade.
A plataforma inclui mecanismos de controlo que asseguram a segurança dos dados partilhados. Desde o início, os projetos foram estruturados segundo os princípios da ciência cidadã, tanto na recolha como na disseminação da informação. O site permite que qualquer pessoa contribua com memórias, experiências e, idealmente, dados mais específicos, como datas ou referências locais.
Apesar dos desafios associados ao envolvimento do público na vertente técnica da história, a recolha de testemunhos orais tem sido bem-sucedida. As equipas de investigação visitaram comunidades, realizaram entrevistas e, em alguns casos, receberam contributos posteriores que foram integrados na base de dados. Esta dinâmica tem enriquecido significativamente os resultados do projeto.
Atualmente, decorre no Iscte o processo de integração dos dados no repositório institucional. Após o depósito inicial, os dados são validados e disponibilizados publicamente, reforçando o compromisso com o acesso aberto. Uma parte significativa da coleção externa do repositório é composta por dados produzidos no âmbito deste projeto.
TRÊS LIÇÕES APRENDIDAS
Categorização de dados qualitativos
A forma de categorizar e sistematizar dados qualitativos, especialmente em áreas como a história, a antropologia ou outras disciplinas das ciências sociais e humanas, exigem que seja feita uma curva de aprendizagem acentuada.
As ferramentas digitais disponíveis para gestão de dados foram, em grande parte, concebidas com base em modelos quantitativos, orientadas para a organização de séries numéricas, medições laboratoriais ou dados estatísticos. Essa orientação limita a sua aplicabilidade direta a dados que emergem de processos interpretativos, como testemunhos orais, narrativas históricas ou leituras de arquivo.
Consequentemente, foi necessário adaptar essas ferramentas, criando categorias artificiais. Este processo exige não apenas criatividade metodológica, mas também uma reflexão crítica sobre os limites da categorização e sobre o risco de simplificação excessiva. A gestão eficaz destes dados requer soluções flexíveis, capazes de respeitar a complexidade e a natureza contextual da informação recolhida.
Consentimento informado em contextos de trabalho de campo
A aplicação prática dos protocolos éticos, nomeadamente no que diz respeito ao consentimento informado, enfrenta obstáculos específicos em contextos informais, rurais ou comunitários. Embora os princípios éticos que regem a investigação estejam bem definidos em documentos institucionais e normativos, a sua implementação no terreno nem sempre é linear. Em muitos casos, os participantes não estão familiarizados com os procedimentos formais de consentimento, ou os próprios contextos de interação não favorecem abordagens padronizadas. Na prática, é quase impossível iniciar uma conversa espontânea com membros de uma comunidade — por exemplo, numa aldeia isolada da serra — e começar por pedir que assinem um documento formal antes de partilharem memórias sobre a escola primária, o lavadouro ou o mercado local. Esse tipo de abordagem quebra a relação de confiança e afasta as pessoas. Mas a intenção é fazer história com as pessoas, não apenas sobre elas — uma história construída de baixo para cima, com base nas suas experiências e testemunhos.
Nestes cenários, torna-se necessário desenvolver estratégias adaptadas, que respeitem simultaneamente os princípios éticos e a realidade sociocultural dos participantes. Isso pode incluir o uso de consentimento verbal, a explicação informal dos objetivos da investigação, ou a negociação contínua da participação ao longo do processo. É essencial articular os procedimentos éticos e legais com a realidade prática da investigação de campo. Ainda assim, e apesar de se ter conseguido estabilizar esse processo, muitas conversas e contributos ficaram de fora por não se ter conseguido cumprir os requisitos formais a tempo. Para futuros projetos, será fundamental incluir no planeamento tempo e recursos dedicados à definição clara dos procedimentos éticos e à formação prática das equipas.
Formação e tempo dedicado à gestão de dados
A gestão de dados de investigação, especialmente quando envolve informação sensível ou qualitativa, exige tempo, planeamento e capacitação técnica das equipas envolvidas. Trata-se de uma dimensão que deve ser considerada desde a fase inicial dos projetos, com alocação de recursos específicos e definição clara de responsabilidades. A ausência de formação adequada pode comprometer a qualidade da curadoria, a segurança da informação e a conformidade com as políticas institucionais e legais.
Além disso, a gestão de dados não se limita ao armazenamento ou organização técnica — envolve decisões metodológicas, éticas e comunicacionais que requerem competências especializadas. A formação contínua das equipas, aliada ao apoio institucional, é essencial para garantir que os dados recolhidos sejam tratados com o rigor necessário e possam ser reutilizados, partilhados e valorizados como parte integrante da produção científica. Mas, as ações de formação existentes são muitas vezes demasiado abstratas e genéricas. Seria muito útil que fossem mais concretas, ligadas às realidades específicas de cada disciplina, e que partissem dos problemas reais enfrentados no terreno.
TRÊS DESAFIOS FUTUROS
Clarificação dos limites dos dados pessoais na investigação histórica
A investigação histórica enfrenta uma lacuna significativa na definição e tratamento de dados pessoais, especialmente no que diz respeito a figuras públicas e documentos administrativos. A ausência de diretrizes claras sobre o estatuto jurídico e ético destes dados pode gerar entraves à investigação, dificultando o acesso, a reutilização e a publicação de fontes relevantes. Em muitos casos, documentos que são tecnicamente públicos — como atas, relatórios ou correspondência institucional — contêm informações que podem ser interpretadas como dados pessoais, o que levanta dúvidas sobre os limites da sua divulgação.
Este desafio exige uma abordagem equilibrada entre o direito à informação e a proteção da privacidade, com especial atenção ao contexto histórico, à função pública dos sujeitos envolvidos e à finalidade científica da investigação. A clarificação normativa e institucional destes limites é essencial para garantir segurança jurídica aos investigadores e para promover práticas éticas e transparentes na gestão de dados históricos.
Saber o que pode, ou não, ser incluído, como anonimizar dados, e como garantir a conformidade legal é um esforço adicional que exige tempo e atenção.
Preservação digital a longo prazo
Embora os repositórios institucionais ofereçam garantias importantes em termos de preservação digital, subsistem incertezas quanto à sustentabilidade de plataformas próprias desenvolvidas por projetos de investigação. Estas plataformas, muitas vezes criadas com financiamento temporário, enfrentam riscos associados à obsolescência tecnológica, à descontinuidade de manutenção e à falta de integração com infraestruturas institucionais permanentes.
A longo prazo, a preservação dos dados depende da sua migração para sistemas estáveis, interoperáveis e reconhecidos institucionalmente. É fundamental que os projetos prevejam desde o início estratégias de preservação que incluam o depósito em repositórios certificados, a atribuição de identificadores persistentes e a adoção de formatos normalizados. A articulação entre plataformas próprias e repositórios institucionais deve ser pensada como uma complementaridade, garantindo simultaneamente inovação e sustentabilidade.
Reconhecimento académico da produção de dados em bruto
A produção de dados de investigação, especialmente qualitativos, continua a ser subvalorizada nos sistemas de avaliação científica. Apesar de constituírem uma componente essencial em projetos de ciência cidadã e em investigações que envolvem comunidades, os dados em bruto — como testemunhos orais, registos históricos ou documentação recolhida — são frequentemente vistos como auxiliares ou preparatórios, e não como resultados científicos em si.
Este enquadramento limita o reconhecimento do trabalho de recolha, curadoria e publicação de dados, que exige competências especializadas e contribui diretamente para o avanço do conhecimento. É necessário promover uma mudança cultural e institucional que valorize os dados como produtos científicos legítimos, com critérios próprios de qualidade, citabilidade e impacto. A atribuição de identificadores persistentes, o depósito em repositórios e a adoção de licenças claras são passos fundamentais nesse processo, mas devem ser acompanhados por políticas de avaliação que reconheçam a diversidade das práticas científicas.
CINCO QUESTÕES SOBRE GDI
Como define, implementa e avalia as práticas de gestão de dados de investigação?
A instituição implementa as suas práticas de gestão de dados com base numa Política de Gestão e Partilha de Dados de Investigação, em vigor desde 2023. Esta política estabelece as diretrizes para o armazenamento, partilha e citação de dados produzidos na comunidade científica da instituição. Todos os dados são acompanhados por identificadores persistentes e pela atribuição de licenças adequadas, garantindo a rastreabilidade, a transparência e o cumprimento das normas éticas e legais aplicáveis.
Para além desta política geral, cada projeto de investigação segue procedimentos específicos de gestão de dados, adequados à natureza e sensibilidade da informação recolhida. No caso particular dos projetos que envolvem dados pessoais — como registos de voz, impressões ou memórias —, são obtidos consentimentos informados dos participantes, assegurando o tratamento ético e responsável dos dados.
Os dados são armazenados numa base de dados própria, cujo nível de visibilidade e acesso é definido de acordo com o tipo de informação contida. Parte destes dados pode estar publicamente acessível, enquanto outros permanecem restritos para salvaguardar a privacidade e a confidencialidade dos participantes.
A avaliação das práticas de gestão de dados é realizada de forma contínua, assegurando a conformidade com a política institucional, com os requisitos dos financiadores e com as boas práticas internacionais de ciência aberta e gestão responsável de dados.
Quais os principais benefícios dessas práticas?
A adoção sistemática de práticas de gestão e partilha de dados científicos representa um avanço significativo na consolidação da ciência aberta. A associação de publicações a repositórios institucionais não só reforça a visibilidade dos dados gerados, como também facilita o seu acesso por parte da comunidade científica e da sociedade em geral. Esta integração contribui diretamente para a transparência dos processos de investigação e para a democratização do conhecimento.
Para além da acessibilidade, estas práticas promovem uma cultura de consciência e responsabilidade ética, alinhando os objetivos científicos com princípios fundamentais de integridade, reprodutibilidade e equidade. A gestão adequada dos dados permite garantir que os resultados são compreensíveis, verificáveis e reutilizáveis, fortalecendo a confiança nas evidências produzidas.
Outro benefício estrutural reside na preservação e fidelidade dos dados ao longo do tempo. A reabilitação de conjuntos de dados, a sua conservação em ambientes seguros e a manutenção da sua integridade são elementos essenciais para assegurar a continuidade da investigação e a valorização do trabalho científico.
Por fim, o impacto real destas práticas é visível na utilização efetiva dos dados por outros investigadores, na criação de novas abordagens e na ampliação do alcance dos projetos. A partilha ativa de dados transforma-se, assim, num motor de inovação, colaboração e reconhecimento institucional.
Em que medida a gestão de dados de investigação contribui para a otimização do processo de investigação?
A integração de práticas de gestão de dados desde as fases iniciais do projeto contribui de forma decisiva para a eficiência e solidez do processo científico. Quando o planeamento da investigação é concebido com base em princípios de acesso aberto, torna-se possível estruturar desde o início uma base de dados alinhada com os objetivos do projeto e com os requisitos de transparência e reprodutibilidade. Esta abordagem proativa evita retrabalho, assegura a coerência dos dados recolhidos e facilita a sua posterior validação e partilha.
As validações e integrações realizadas ao longo do percurso não alteraram a lógica do processo, mas reforçaram a sua robustez e a permanência dos dados em ambientes digitais sustentáveis. Estes mecanismos funcionam como camadas adicionais de fiabilidade, assegurando que os dados mantêm a sua integridade e relevância ao longo do tempo.
A atribuição de identificadores persistentes, como os DOI (Digital Object Identifiers), desempenha um papel fundamental neste contexto. Para além de garantirem a validação formal dos dados, permitem a sua citação adequada e a partilha em plataformas académicas reconhecidas, assegurando a rastreabilidade, a visibilidade e a longevidade dos resultados produzidos.
Que vantagens e condicionantes aponta na partilha de dados de investigação?
A implementação de práticas de gestão e partilha de dados traz vantagens significativas para a investigação científica. Entre os principais benefícios destaca-se o aumento da visibilidade dos dados produzidos, que potencia a sua reutilização por outros investigadores e projetos. Esta abertura contribui para o fortalecimento de uma cultura de colaboração, promovendo o intercâmbio de metodologias, fontes e resultados. Além disso, permite a complementaridade entre projetos com abordagens distintas, ampliando o impacto e a diversidade da produção científica.
No entanto, persistem condicionantes relevantes que limitam a adoção plena destas práticas, especialmente em áreas como a história. A resistência cultural à divulgação de fontes primárias continua a ser um obstáculo, refletindo preocupações com a autoria intelectual e a preservação de abordagens tradicionais. A falta de recursos, interesse ou autorização para partilhar documentos originais agrava esta limitação, dificultando a abertura dos dados em formatos acessíveis e reutilizáveis.
Adicionalmente, verifica-se uma inflexibilidade nas ferramentas institucionais, muitas vezes concebidas para dados quantitativos, o que dificulta a integração de dados qualitativos e interpretativos. Esta realidade evidencia a necessidade de uma perspetiva mais atualizada sobre as práticas em humanidades digitais, que reconheça a especificidade dos dados produzidos em contextos comunitários, históricos e multidisciplinares.
De que forma os diferentes atores envolvidos no processo de investigação estão comprometidos com a gestão de dados de investigação?
A consolidação de práticas eficazes de gestão e partilha de dados depende da atuação coordenada de diversos atores institucionais e científicos. Os investigadores desempenham um papel central, sendo os principais responsáveis pela definição metodológica e pela disponibilização dos dados. A sua visão sobre a abertura e reutilização dos materiais de investigação é determinante para o sucesso de qualquer iniciativa de ciência aberta.
A equipa de projeto, especialmente quando composta por investigadores com uma postura aberta e colaborativa, pode ser um motor de inovação. A predisposição para experimentar novas abordagens têm sido fatores decisivos na adoção de práticas mais transparentes e inclusivas.
As instituições, por sua vez, têm a responsabilidade de liderar esta transformação, criando condições estruturais e políticas que favoreçam a integração dos dados em ambientes académicos reconhecidos. Em contextos orientados para as ciências sociais, como o Iscte, essa liderança é particularmente relevante para garantir que os dados qualitativos e interpretativos sejam valorizados e corretamente enquadrados.
As bibliotecas assumem um papel técnico e estratégico, apoiando na categorização dos dados e na sua integração nos repositórios institucionais. Este apoio é essencial para garantir que os dados sejam organizados de forma adequada e acessível.
Por fim, a comunidade científica tem um papel crítico na validação e reconhecimento de abordagens alternativas, como aquelas que cruzam história com arquitetura e envolvem diretamente as comunidades locais. O reconhecimento da diversidade metodológica e da riqueza dos dados qualitativos é fundamental para ampliar os horizontes da ciência aberta e promover uma cultura de partilha mais inclusiva e representativa.
PROJETO
ENTIDADE
INVESTIGADOR
ENTREVISTADO
O INVESTIGADOR RESPONDE
CINCO QUESTÕES SOBRE GDI
DOMÍNIOS CIENTÍFICOS
Humanidades e Artes
ETAPAS DO CICLO DE VIDA DOS DADOS
Processamento
Partilha
Reutilização
DATA DE RECOLHA
Setembro de 2025




