Una chiave per analizzare milioni di singole cellule
Intelligenza artificiale in biomedicina
Il nostro corpo è composto da circa 75 miliardi di cellule. Ma quale funzione svolge ciascuna di queste cellule e come si differenziano le cellule di una persona sana da quelle affette da una malattia? Per trarre conclusioni, è necessario analizzare e interpretare enormi quantità di dati. A questo scopo vengono utilizzati metodi di apprendimento automatico. I ricercatori dell'Università Tecnica di Monaco (TUM) e di Helmholtz Munich hanno ora testato l'apprendimento auto-supervisionato come approccio promettente su oltre 20 milioni di cellule.
Negli ultimi anni, i ricercatori hanno compiuto grandi progressi nella tecnologia a singola cellula. Ciò consente di analizzare i tessuti sulla base delle singole cellule e di determinare le diverse funzioni dei singoli tipi di cellule. Queste analisi possono essere utilizzate, ad esempio, per determinare come il fumo, il cancro ai polmoni o la malattia di Covid modificano le strutture delle singole cellule nei polmoni, confrontandole con le cellule sane.
Allo stesso tempo, le analisi generano volumi di dati sempre più grandi. I metodi di apprendimento automatico hanno lo scopo di aiutare a reinterpretare i dati provenienti da serie di dati esistenti, riconoscere informazioni significative dai modelli e trasferirle ad altre aree.
L'apprendimento auto-supervisionato come nuovo approccio
Fabian Theis, professore di Modellazione matematica dei sistemi biologici, e il suo team hanno condotto uno studio per verificare se l'apprendimento auto-supervisionato sia più adatto all'analisi di grandi quantità di dati rispetto ad altri metodi. Lo studio è stato recentemente pubblicato su Natur Machine Intelligence. Questa forma di apprendimento automatico funziona con dati non etichettati. Non sono necessari dati campione classificati in anticipo. Ciò significa che i dati non devono essere assegnati manualmente a gruppi specifici. I dati non etichettati sono disponibili in grandi quantità e consentono una rappresentazione robusta di grandi quantità di dati.
L'apprendimento auto-supervisionato si basa su due metodi. Nel cosiddetto apprendimento mascherato, una parte dei dati di input viene resa irriconoscibile e il modello viene addestrato in modo da poter ricostruire le parti mancanti. I ricercatori hanno anche utilizzato l'apprendimento contrastivo, in cui il modello impara a mettere insieme dati simili e a separare quelli dissimili.
Il team ha testato entrambi i metodi di apprendimento auto-supervisionato su oltre 20 milioni di singole cellule e li ha confrontati con i risultati dei metodi di apprendimento classici. Nel valutare i diversi metodi, i ricercatori si sono concentrati su compiti quali la previsione dei tipi di cellule o la ricostruzione dell'espressione genica.
Opportunità per lo sviluppo di cellule virtuali
I risultati dello studio dimostrano che l'apprendimento auto-supervisionato offre un valore aggiunto, in particolare per i compiti di trasferimento. In altre parole, quando viene applicato a insiemi di dati più piccoli in cui le informazioni vengono trasferite da database più grandi. Inoltre, i risultati sono promettenti per le previsioni di celle a colpo zero, cioè per compiti che non sono stati addestrati in precedenza. Il confronto tra l'apprendimento mascherato e quello contrastivo mostra che l'apprendimento mascherato è più adatto a grandi insiemi di dati a singola cellula.
Utilizzando i dati, i ricercatori stanno lavorando allo sviluppo delle cosiddette cellule virtuali, ossia modelli informatici completi che mappano la diversità delle cellule in diversi set di dati. Questi modelli sono promettenti per analizzare i cambiamenti cellulari, ad esempio, come nel caso del cancro. I risultati dello studio forniscono informazioni preziose su come tali modelli possano essere addestrati in modo più efficiente e ulteriormente migliorati.
Nota: questo articolo è stato tradotto utilizzando un sistema informatico senza intervento umano. LUMITOS offre queste traduzioni automatiche per presentare una gamma più ampia di notizie attuali. Poiché questo articolo è stato tradotto con traduzione automatica, è possibile che contenga errori di vocabolario, sintassi o grammatica. L'articolo originale in Tedesco può essere trovato qui.