Uma chave para a análise de milhões de células individuais

Inteligência artificial em biomedicina

27.01.2025
Astrid Eckert / TUM

Fabian Theis, Professor de Modelação Matemática de Sistemas Biológicos.

O nosso corpo é constituído por cerca de 75 mil milhões de células individuais. Mas que função desempenha cada uma destas células e como é que as células de uma pessoa saudável diferem das de uma pessoa doente? Para tirar conclusões, é necessário analisar e interpretar grandes quantidades de dados. Para o efeito, são utilizados métodos de aprendizagem automática. Os investigadores da Universidade Técnica de Munique (TUM) e da Helmholtz Munich testaram agora a aprendizagem auto-supervisionada como uma abordagem promissora em mais de 20 milhões de células.

Nos últimos anos, os investigadores fizeram grandes progressos na tecnologia de célula única. Esta permite analisar os tecidos com base em células individuais e determinar as diferentes funções de cada tipo de célula. Estas análises podem ser utilizadas, por exemplo, para determinar de que forma o tabagismo, o cancro do pulmão ou a doença de Covid alteram as estruturas celulares individuais nos pulmões, comparando-as com células saudáveis.

Ao mesmo tempo, as análises estão a gerar volumes de dados cada vez maiores. Os métodos de aprendizagem automática destinam-se a ajudar a reinterpretar dados de conjuntos de dados existentes, a reconhecer informações significativas a partir dos padrões e a transferi-las para outras áreas.

A aprendizagem auto-supervisionada como uma nova abordagem

Fabian Theis, Professor de Modelação Matemática de Sistemas Biológicos, e a sua equipa realizaram um estudo para investigar se a aprendizagem auto-supervisionada é mais adequada para a análise de grandes quantidades de dados do que outros métodos. O estudo foi recentemente publicado na revista Natur Machine Intelligence. Esta forma de aprendizagem automática funciona com dados não rotulados. Não são necessários dados de amostra classificados à partida. Isto significa que os dados não têm de ser previamente atribuídos manualmente a grupos específicos. Os dados não rotulados estão disponíveis em grandes quantidades e permitem uma representação robusta de grandes quantidades de dados.

A aprendizagem auto-supervisionada baseia-se em dois métodos. Na chamada aprendizagem mascarada, parte dos dados de entrada é tornada irreconhecível e o modelo é treinado de forma a poder reconstruir as partes em falta. Os investigadores também utilizaram a aprendizagem contrastiva, em que o modelo aprende a juntar dados semelhantes e a separar dados diferentes.

A equipa testou ambos os métodos de aprendizagem auto-supervisionada em mais de 20 milhões de células individuais e comparou-os com os resultados dos métodos de aprendizagem clássicos. Ao avaliarem os diferentes métodos, os investigadores centraram-se em tarefas como a previsão de tipos de células ou a reconstrução da expressão genética.

Oportunidades para o desenvolvimento de células virtuais

Os resultados do estudo mostram que a aprendizagem auto-supervisionada oferece um valor acrescentado, nomeadamente para as tarefas de transferência. Por outras palavras, quando aplicada a conjuntos de dados mais pequenos, em que a informação é transferida de bases de dados maiores. Além disso, os resultados são prometedores para as previsões de células zero, ou seja, para tarefas que não tenham sido treinadas previamente. A comparação entre a aprendizagem mascarada e a aprendizagem contrastiva mostra que a aprendizagem mascarada é mais adequada para grandes conjuntos de dados unicelulares.

Utilizando os dados, os investigadores estão a trabalhar no desenvolvimento das chamadas células virtuais, ou seja, modelos informáticos abrangentes que mapeiam a diversidade das células em diferentes conjuntos de dados. Estes modelos são promissores para a análise das alterações celulares, por exemplo, como acontece no caso do cancro. Os resultados do estudo fornecem informações valiosas sobre o modo como esses modelos podem ser treinados de forma mais eficiente e melhorados.

Observação: Este artigo foi traduzido usando um sistema de computador sem intervenção humana. A LUMITOS oferece essas traduções automáticas para apresentar uma gama mais ampla de notícias atuais. Como este artigo foi traduzido com tradução automática, é possível que contenha erros de vocabulário, sintaxe ou gramática. O artigo original em Alemão pode ser encontrado aqui.

Publicação original

Outras notícias do departamento ciência