DESCRIÇÃO

O projeto de doutoramento em curso tem como foco central o desenvolvimento de um sistema inovador de monitorização remota para idosos, concebido para responder às necessidades específicas de uma população frequentemente vulnerável, sobretudo aqueles que residem em regiões mais isoladas e que dependem, em grande medida, de cuidadores informais ou familiares. Trata-se de um esforço científico e tecnológico que procura conciliar duas dimensões fundamentais: por um lado, a segurança e o acompanhamento contínuo dos idosos; por outro, a proteção da sua privacidade e dignidade, assegurando que o processo de recolha e utilização de dados não compromete direitos individuais.

Para atingir estes objetivos, o sistema recorre a sensores ambientais e a imagens de profundidade, em detrimento de imagens convencionais RGB. Esta opção metodológica é particularmente relevante, uma vez que as imagens de profundidade permitem captar padrões de movimento e comportamento sem revelar características físicas identificáveis, como traços faciais ou detalhes pessoais. Assim, garante-se que o monitoramento é eficaz na deteção de situações de risco, mas não invasivo, preservando a identidade dos indivíduos.

O sistema foi concebido para detetar precocemente situações de emergência, como quedas ou movimentos que possam indicar risco iminente, emitindo alertas automáticos para familiares, cuidadores ou profissionais de saúde. Esta funcionalidade tem como objetivo reduzir o tempo de resposta em situações críticas, aumentando a probabilidade de intervenção rápida e eficaz.

Um dos principais resultados esperados do projeto é a criação de um dataset público, cuidadosamente estruturado e anonimizado, que se distingue pela sua relevância científica e social. Este dataset é composto por gravações de ações quotidianas — como caminhar, sentar, levantar ou pegar em objetos — e por simulações de quedas, abrangendo um conjunto de cerca de vinte ações distintas. A disponibilização deste recurso pretende colmatar uma lacuna existente na área, uma vez que não há datasets atualizados e específicos que possam ser utilizados para treinar algoritmos de predição de quedas e padrões de comportamento em idosos.

A criação deste dataset público tem uma dupla finalidade: por um lado, servir de base ao treino e validação dos algoritmos de inteligência artificial desenvolvidos no âmbito do projeto; por outro, promover a reutilização por outros investigadores, incentivando a partilha de conhecimento e a colaboração científica. Ao disponibilizar dados de forma transparente e acessível, o projeto contribui para o avanço da investigação em áreas como saúde digital, envelhecimento ativo e monitorização remota, reforçando os princípios da ciência aberta.

TRÊS LIÇÕES APRENDIDAS

Centralidade da ética e da privacidade

A investigação científica que envolve dados humanos, em particular dados pessoais e ligados a condições de saúde, coloca inevitavelmente a ética e a privacidade no centro das suas preocupações. Trabalhar com este tipo de informação exige não apenas o cumprimento rigoroso de regulamentos como o Regulamento Geral de Proteção de Dados (RGPD), mas também um compromisso profundo com o respeito pela dignidade das pessoas envolvidas. A proteção da identidade e da integridade dos participantes é um princípio estruturante que deve orientar todas as fases do projeto, desde a conceção até à divulgação dos resultados. Neste contexto, a submissão do projeto ao comité de ética revelou-se uma etapa essencial, não apenas como requisito formal, mas como mecanismo de validação das práticas adotadas. Este processo permitiu identificar potenciais fragilidades, reforçar a confiança dos participantes voluntários e assegurar que a investigação decorre dentro de padrões elevados de responsabilidade e transparência. Assim, a dimensão ética não é apenas um requisito legal, mas um elemento que confere credibilidade científica e social ao trabalho desenvolvido.

Planeamento da gestão de dados desde o início

Paralelamente, a experiência demonstrou que o planeamento da gestão de dados desde o início é determinante para garantir a sua reutilização e relevância futura. A ausência de planeamento inicial compromete seriamente a utilidade dos datasets, tornando-os menos transparentes e dificultando a sua integração em novos projetos. Por isso, é fundamental que a documentação, a organização e a padronização sejam definidas antes da recolha, estabelecendo regras claras para nomeação de ficheiros, armazenamento seguro e anonimização dos dados. Este cuidado inicial assegura que os datasets não apenas cumprem requisitos de qualidade, mas também se tornam reutilizáveis e interoperáveis, permitindo que outros investigadores possam beneficiar da informação produzida sem necessidade de repetir processos ou recolher novamente dados junto dos participantes. 

Flexibilidade na investigação aplicada

Por fim, a investigação aplicada, sobretudo quando envolve voluntários, exige uma elevada capacidade de flexibilidade. Projetos desta natureza implicam lidar com imprevistos, ritmos distintos entre participantes e desafios logísticos que não podem ser totalmente antecipados. A organização de sessões de recolha de dados, a disponibilidade de espaços adequados ou a coordenação de voluntários são exemplos de aspetos que frequentemente exigem ajustamentos. A capacidade de adaptação revelou-se fundamental para garantir a continuidade e a qualidade da investigação, permitindo que os objetivos sejam alcançados mesmo em contextos dinâmicos e imprevisíveis. Esta flexibilidade não diminui o rigor científico; pelo contrário, assegura que a investigação se mantém relevante e eficaz, respondendo às exigências do mundo real e às particularidades de cada participante. Trabalhar com pessoas significa lidar com variabilidade e complexidade, e é precisamente nesta capacidade de adaptação que reside a força da investigação aplicada e a boa recolha de dados.

TRÊS DESAFIOS FUTUROS

Garantia da interoperabilidade e reutilização dos dados

A investigação científica contemporânea enfrenta o desafio de assegurar a interoperabilidade e reutilização dos dados produzidos. A criação de datasets não pode ser vista apenas como um resultado imediato de um projeto, mas como um recurso de longo prazo que deve manter padrões elevados de qualidade, consistência e anonimização. Para que os dados possam ser utilizados por outros investigadores, é fundamental que sejam estruturados de forma clara, documentados com rigor e acompanhados de metadados que permitam compreender o seu contexto de produção. A interoperabilidade garante que os datasets possam ser integrados em diferentes sistemas e comparados com outras séries temporais, ampliando o seu valor científico e evitando que a informação se torne obsoleta ou limitada ao âmbito restrito de um único estudo.

Sustentabilidade da informação sensível

A par desta preocupação, surge a necessidade de assegurar a sustentabilidade da informação sensível. A preservação de dados humanos, especialmente quando relacionados com saúde ou comportamento, exige cuidados adicionais de natureza técnica e legal. É imprescindível garantir que os dados sejam armazenados em sistemas seguros, protegidos contra acessos não autorizados e preservados de forma a manter a sua integridade ao longo do tempo. A sustentabilidade implica também assegurar que os dados permanecem acessíveis e utilizáveis, mesmo após o término dos projetos que lhes deram origem. Este compromisso requer investimentos contínuos em infraestrutura tecnológica, formação de profissionais especializados e definição de políticas institucionais que assegurem a longevidade da informação. Só assim é possível garantir que os dados sensíveis não apenas sobrevivem ao ciclo de vida imediato da investigação, mas continuam a ser recursos valiosos para futuras gerações de cientistas e decisores.

Promoção da partilha colaborativa de dados

Finalmente, a criação de datasets públicos deve ser acompanhada por uma estratégia clara de promoção da partilha colaborativa de dados. A disponibilização aberta da informação não é suficiente por si só; é necessário fomentar práticas que incentivem a colaboração internacional, evitando duplicação de esforços e fortalecendo a ciência aberta. A partilha colaborativa permite que investigadores de diferentes instituições e países utilizem os mesmos recursos, ampliando o impacto da investigação e promovendo sinergias entre projetos. Além disso, contribui para reduzir a necessidade de recolher novamente dados junto de participantes, minimizando a intrusão e respeitando a dignidade das pessoas envolvidas. A ciência aberta, apoiada por datasets públicos e colaborativos, reforça a transparência, aumenta a credibilidade da investigação e promove uma cultura de responsabilidade coletiva na produção e utilização do conhecimento.

CINCO QUESTÕES SOBRE GDI

Como define, implementa e avalia as práticas de gestão de dados de investigação?

A implementação das práticas de gestão de dados no projeto foi estruturada de forma progressiva, incorporando aprendizagens obtidas ao longo do processo. Após uma experiência inicial marcada por limitações na reutilização da informação, tornou-se evidente a necessidade de desenvolver planos de gestão de dados claros e consistentes. Estes planos passaram a orientar todas as etapas da recolha e organização da informação, assegurando que os datasets criados fossem não apenas úteis para o investigador principal, mas também reutilizáveis por outros membros da comunidade científica.

Um dos aspetos centrais da implementação foi a definição prévia de regras de nomeação, armazenamento e anonimização dos vídeos. Cada gravação foi cuidadosamente catalogada, seguindo convenções estabelecidas que permitiam identificar ações específicas sem comprometer a privacidade dos participantes. O armazenamento foi realizado em repositórios físicos, evitando o uso de plataformas em nuvem que poderiam representar riscos adicionais de segurança e de eventual exposição indevida dos dados. A anonimização constituiu uma prioridade, garantindo que não existisse qualquer possibilidade de rastreio ou identificação dos voluntários envolvidos.

Outro passo fundamental foi a submissão do projeto ao comité de ética, assegurando que todas as práticas adotadas estavam em conformidade com regulamentos nacionais e internacionais. Este processo não só reforçou a credibilidade científica do trabalho, como também permitiu identificar e corrigir potenciais fragilidades na gestão dos dados, fortalecendo a confiança dos participantes e da instituição.

No que respeita à avaliação das práticas de gestão de dados, o primeiro momento crítico foi a identificação de falhas na criação do dataset original, que não cumpria plenamente os requisitos de reutilização e interoperabilidade. A correção dessas falhas no segundo dataset representou uma evolução significativa, demonstrando a importância da aprendizagem contínua e da adaptação metodológica.

A avaliação incluiu ainda a validação ética e institucional das práticas, confirmando que os procedimentos seguiam padrões de qualidade e responsabilidade. Este processo de validação foi essencial para consolidar a confiança na investigação e para assegurar que os dados produzidos poderiam ser partilhados de forma segura e transparente.

Quais os principais benefícios dessas práticas?

A organização e reutilização dos dados constituem elementos centrais para aumentar a eficiência científica e garantir que a informação recolhida cumpre o seu verdadeiro propósito. Quando os dados são devidamente estruturados, documentados e armazenados, tornam-se mais fáceis de consultar, analisar e integrar em novos projetos. Esta organização evita redundâncias, reduz inconsistências e assegura que o esforço investido na recolha inicial não se perde, mas se transforma num recurso duradouro. A reutilização, por sua vez, amplia o impacto da investigação, permitindo que os mesmos dados sejam aplicados em diferentes contextos e por diversos investigadores, potenciando novas descobertas sem necessidade de repetir processos dispendiosos e intrusivos.

A adoção destas práticas promove também transparência e credibilidade, fatores essenciais para consolidar a confiança da comunidade científica e dos stakeholders externos. A clareza nos métodos de recolha, tratamento e disponibilização dos dados garante que os resultados obtidos podem ser verificados e replicados, reforçando a robustez das conclusões. Esta transparência não beneficia apenas o investigador responsável, mas tem um impacto positivo para outros investigadores que passam a ter acesso a informação fiável e bem documentada. A credibilidade científica é, assim, fortalecida, posicionando os projetos que seguem estas práticas como referências de qualidade e responsabilidade.

A criação de datasets públicos representa um contributo decisivo para ampliar o valor coletivo da investigação. Ao disponibilizar dados de forma aberta e acessível, promove-se a ciência colaborativa e evita-se a duplicação de esforços, permitindo que diferentes equipas e instituições utilizem os mesmos recursos para responder a questões diversas. Estes datasets públicos tornam-se património científico partilhado, fomentando a interdisciplinaridade, incentivando colaborações internacionais e reforçando os princípios da ciência aberta. Além disso, contribuem para reduzir a necessidade de recolher novamente dados junto de participantes.

Em que medida a gestão de dados de investigação contribui para a otimização do processo de investigação?

A adoção de práticas estruturadas de gestão de dados tem efeitos diretos e significativos na redução de redundâncias e inconsistências, evitando a necessidade de recolhas repetidas e assegurando maior eficiência científica. Quando os dados são devidamente organizados e documentados, tornam-se mais fáceis de consultar e reutilizar, permitindo que os investigadores aproveitem plenamente a informação já existente. Este processo não só poupa tempo e recursos, como também diminui a probabilidade de erros ou duplicações, garantindo que os resultados obtidos são consistentes e fiáveis. A racionalização da recolha e utilização dos dados traduz-se, assim, em ganhos concretos para a investigação, aumentando a produtividade e a qualidade das análises realizadas.

Outro contributo fundamental destas práticas é a aceleração do treino e validação de algoritmos de inteligência artificial. A disponibilidade de datasets bem estruturados e anonimizados permite que os modelos sejam treinados de forma mais rápida e eficaz, sem necessidade de criar continuamente novas bases de dados. A qualidade e a organização da informação facilitam o processo de validação, assegurando que os algoritmos podem ser testados em condições robustas e replicáveis. Este fator é particularmente relevante em áreas como a saúde digital ou a monitorização remota, onde a fiabilidade dos algoritmos é determinante para garantir segurança e confiança nos resultados. Ao acelerar o treino e a validação, estas práticas contribuem para reduzir o tempo entre a investigação e a aplicação prática, tornando os avanços tecnológicos mais acessíveis e úteis.

A gestão estruturada de dados facilita a transição dos resultados para ambientes reais, aumentando a sua aplicabilidade e impacto social. A existência de datasets organizados e reutilizáveis permite que os sistemas desenvolvidos em contexto académico sejam mais facilmente adaptados a cenários concretos, como casas de idosos ou instituições de saúde. Esta transição é essencial para que a investigação não permaneça confinada ao laboratório, mas se traduza em soluções práticas que respondam a necessidades sociais urgentes. Ao garantir que os dados são fiáveis, transparentes e reutilizáveis, cria-se uma ponte entre ciência e sociedade, promovendo a inovação tecnológica e reforçando o impacto positivo da investigação na vida das pessoas.

Que vantagens e condicionantes aponta na partilha de dados de investigação?

A adoção de práticas rigorosas de gestão de dados científicos apresenta um conjunto significativo de vantagens que reforçam a qualidade e o impacto da investigação. Em primeiro lugar, destaca-se a robustez científica, resultante da aplicação de metodologias consistentes e da observância de princípios éticos. A credibilidade é fortalecida quando os dados são recolhidos, tratados e disponibilizados de forma transparente, permitindo que os resultados sejam verificados e replicados por outros investigadores. Esta confiança, sustentada por práticas éticas, posiciona os projetos como referências de qualidade e responsabilidade, aumentando a sua relevância no panorama científico.

Outro benefício reside no potencial para colaborações internacionais, que se torna mais evidente quando os dados são organizados e disponibilizados em formatos interoperáveis. A partilha de datasets estruturados e anonimizados facilita a integração em redes científicas globais, promovendo sinergias entre instituições e ampliando o alcance dos resultados. Este fator contribui para um maior impacto institucional, reforçando a visibilidade das organizações envolvidas e consolidando a sua posição como atores relevantes na produção de conhecimento.

A gestão de dados representa ainda um contributo direto para a ciência aberta e para a inovação tecnológica. Ao disponibilizar datasets públicos e reutilizáveis, promove-se a transparência e a democratização do acesso à informação, permitindo que diferentes comunidades científicas e tecnológicas utilizem os mesmos recursos para desenvolver novas soluções. Esta prática não só acelera o avanço da investigação, como também fomenta a inovação em áreas aplicadas, aumentando o impacto social da ciência.

Contudo, estas vantagens são acompanhadas por condicionantes que não podem ser ignoradas. A implementação de práticas robustas exige a disponibilidade de recursos humanos especializados, capazes de lidar com questões técnicas e éticas complexas. A formação e retenção destes profissionais constituem desafios permanentes, essenciais para garantir a qualidade e sustentabilidade da gestão de dados.

A complexidade logística e tecnológica é outro fator condicionante, uma vez que a recolha, armazenamento e anonimização de dados implicam investimentos contínuos em infraestrutura digital, equipamentos e sistemas de segurança. Estes processos exigem planeamento detalhado e capacidade de adaptação, de modo a assegurar que os dados permanecem íntegros e acessíveis ao longo do tempo.

Por fim, a eficácia da gestão de dados depende da conformidade legal e da colaboração voluntária dos participantes. O cumprimento rigoroso das normas jurídicas e éticas é indispensável para proteger os direitos individuais, mas implica também um esforço constante de sensibilização e envolvimento dos voluntários. Sem esta adesão colaborativa, torna-se difícil garantir a consistência e a representatividade dos datasets, limitando o seu potencial científico e social.

De que forma os diferentes atores envolvidos no processo de investigação estão comprometidos com a gestão de dados de investigação?

Os investigadores desempenham um papel central, sendo responsáveis pela recolha, organização e disponibilização dos dados. Cabe-lhes garantir que a informação é obtida de forma rigorosa, documentada e conforme os protocolos estabelecidos, assegurando que os datasets criados possam ser utilizados tanto no presente como em futuras investigações. A sua participação ativa é essencial para que os dados sejam credíveis e representativos, constituindo a base sobre a qual se constrói todo o processo científico.

A coordenação científica e os orientadores têm como responsabilidade supervisionar prioridades estratégicas e assegurar a conformidade ética do processo. Este nível de coordenação garante que os objetivos da investigação estão alinhados com as necessidades institucionais e sociais, promovendo a integração interdisciplinar e reforçando a credibilidade dos resultados. A supervisão ética e metodológica constitui um elemento essencial para que a investigação decorra dentro de padrões elevados de responsabilidade.

A instituição desempenha um papel de suporte fundamental, fornecendo recursos logísticos, financeiros e organizacionais. É a instituição que cria as condições para a sustentabilidade das práticas de gestão de dados, disponibilizando infraestruturas adequadas e promovendo formação especializada para investigadores e técnicos. O compromisso institucional é determinante para que a gestão de dados seja reconhecida como uma prioridade estratégica e não apenas como uma atividade acessória.

Os estudantes e a comunidade científica participam em projetos de sensibilização e disseminação de boas práticas, contribuindo para a renovação de competências e para a consolidação de uma cultura de responsabilidade partilhada. 

Por fim, os stakeholders externos, incluindo cuidadores, decisores políticos e sociedade civil, utilizam os dados para fundamentar decisões e promover impacto social. A disponibilização de informação fiável e transparente permite que políticas públicas sejam melhor informadas, que práticas de cuidado sejam mais eficazes e que a sociedade reconheça o valor da investigação científica. Esta ligação entre ciência e sociedade reforça o impacto social da investigação e legitima o investimento em práticas de gestão de dados robustas e sustentáveis.

 

 

PROJETO

Projeto de Doutoramento sobre Monitorização Remota de ldosos

ENTIDADES

Instituto Politécnico de Bragança

INVESTIGADORA
ENTREVISTADA
A INVESTIGADORA
RESPONDE

(Vídeo disponível em breve)

CINCO QUESTÕES SOBRE GDI

DOMÍNIOS CIENTÍFICOS

Engenharia e Tecnologia

ETAPAS DO CICLO DE VIDA DOS DADOS

Processamento

Preservação

Reutilização

DATA DE RECOLHA

Novembro de 2025