Modèle de base efficace en termes de données pour la détection de biomarqueurs
Intelligence artificielle pour la pathologie clinique : une nouvelle approche multitâche
Selon l'Organisation mondiale de la santé (OMS), le nombre de cas de cancer a considérablement augmenté dans le monde. Des indicateurs clairs, connus sous le nom de biomarqueurs, sont la clé d'un diagnostic fiable et d'un traitement réussi. Les systèmes d'IA peuvent aider à identifier ce type de paramètres mesurables dans les images pathologiques. Des chercheurs de l'Institut Fraunhofer de médecine numérique MEVIS ont collaboré avec l'université RWTH d'Aix-la-Chapelle, l'université de Ratisbonne et l'école de médecine de Hanovre pour mettre au point un modèle de base à cet effet. Ce modèle économe en ressources analyse des échantillons de tissus de manière rapide et fiable, sur la base d'une fraction seulement des données d'apprentissage habituelles.
S'éloigner des grands volumes de données et de l'apprentissage auto-supervisé
Les modèles de base standard, tels que les grands modèles de langage utilisés pour ChatGPT, sont formés à l'aide d'ensembles de données importants et diversifiés, et s'auto-supervisent au fur et à mesure de leur apprentissage. Mais pour l'analyse d'images médicales, les données sont généralement rares et, en fait, les petites quantités de données disponibles dans les études cliniques constituent un défi majeur pour l'utilisation de l'IA. En outre, les centres cliniques diffèrent dans leur façon de traiter les préparations pathologiques et dans leurs populations de patients - avant même que la forme et les caractéristiques spécifiques des maladies ne soient prises en compte.
Tous ces facteurs font qu'il est plus difficile de détecter de manière fiable les modèles existants, et donc les caractéristiques pertinentes pour le diagnostic. Pour entraîner l'IA de manière efficace, il faut généralement disposer d'un grand nombre d'images d'entraînement d'origines différentes. Or, chaque image transversale d'un tissu pèse généralement plusieurs gigaoctets et contient des milliers de cellules différentes, mais ne reflète qu'une infime partie de la variabilité présente.
La spécialisation fait suite à une solide formation de base
Fraunhofer MEVIS a conçu une solution basée sur un pré-entraînement supervisé. "Nous développons une stratégie de formation pour l'IA fondamentale sur le modèle de la formation des pathologistes. Ils n'ont pas besoin de réapprendre ce qu'est un noyau à chaque fois. Il s'agit là de connaissances théoriques. Une fois que ces concepts ont été couverts, ils servent de base et peuvent être appliqués à différentes maladies", explique le Dr Johannes Lotz, expert du Fraunhofer MEVIS.
De la même manière, leur modèle d'IA subit une formation de base, apprenant des caractéristiques générales et des lois connues sous le nom de concepts de tissus à partir d'une vaste collection d'images de coupes de tissus créées à l'aide de diverses tâches. La combinaison de ces tâches permet d'obtenir les grands volumes de données nécessaires à l'apprentissage d'un modèle d'IA robuste et de grande taille. Les concepts tissulaires appris sont ensuite appliqués à une tâche spécifique dans une deuxième étape. De cette manière, les algorithmes peuvent identifier des biomarqueurs distinguant différents types de tumeurs, par exemple, le tout avec beaucoup moins de données.
"Dans notre solution, chaque ensemble de données a été annoté par un humain spécialement formé avec les informations qui doivent être apprises", explique Jan Raphael Schäfer, un expert en IA de Fraunhofer MEVIS qui travaille dans l'équipe de Lotz. "Nous donnons à notre modèle l'image et la réponse en même temps. Et nous le faisons pour de nombreuses tâches différentes simultanément, en utilisant une approche multitâche".
L'équipe utilise également une méthode d'enregistrement d'images développée à l'institut : HistokatFusion. Cette méthode permet de générer des données d'entraînement automatiquement annotées à partir d'études tissulaires telles que la coloration immunohistochimique, en utilisant des anticorps marqués pour visualiser des protéines ou d'autres structures. Pour ce faire, cette méthode combine des informations provenant de plusieurs images histopathologiques. Les experts intègrent ces annotations générées automatiquement dans la formation de leur modèle, ce qui accélère la collecte des données.
Des résultats remarquables avec seulement six pour cent des ressources
Par rapport aux modèles qui n'impliquent pas de formation supervisée, l'approche des chercheurs du Fraunhofer permet d'obtenir des résultats similaires avec seulement six pour cent des données de formation. "Étant donné que la quantité de données d'entraînement dans l'apprentissage profond est en corrélation avec l'effort d'entraînement et la puissance de traitement, nous avons constaté que nous avions besoin d'environ six pour cent des ressources généralement requises. En outre, nous n'avons besoin que d'environ 160 heures de formation, ce qui est un facteur de coût crucial. Cela signifie que nous pouvons former un modèle équivalent avec beaucoup moins d'efforts", explique M. Lotz.
La participation des experts Fraunhofer au concours international SemiCOL (Semi-supervised learning for colorectal cancer detection) pour la classification et la segmentation des cancers a montré à quel point ces modèles pré-entraînés peuvent être généralisés. L'équipe a remporté la partie classification du concours sans devoir procéder à des ajustements coûteux de son modèle et s'est finalement classée deuxième sur neuf équipes participantes.
Les tests de segmentation interactive d'images, dans lesquels les structures tissulaires sont automatiquement détectées et mesurées dans une image, montrent également que cette méthode a un grand potentiel. Le modèle n'a besoin que de quelques sections d'images pour étendre les concepts qu'il a déjà appris. Mais ce n'est pas tout. "Les modèles basés sur notre solution permettent de développer de nouveaux outils interactifs de formation à l'IA médicale qui permettent aux spécialistes d'interagir directement avec les solutions d'IA et de former rapidement des modèles pertinents, même sans aucune connaissance technique de base", explique M. Schäfer.
Libre accès et transférabilité
Les chercheurs publient le modèle pré-entraîné et le code pour l'apprentissage ultérieur sur différentes plateformes. Les spécialistes peuvent ainsi les utiliser à des fins non commerciales et développer leurs propres solutions. L'équipe travaille également avec des partenaires cliniques pour que la solution soit approuvée pour des applications médicales et pour la valider systématiquement. Les experts de Fraunhofer MEVIS sont convaincus qu'une fois dans la pratique clinique quotidienne, les systèmes utilisant leur modèle de base réduiront la charge de travail en pathologie et amélioreront le succès du traitement.
Note: Cet article a été traduit à l'aide d'un système informatique sans intervention humaine. LUMITOS propose ces traductions automatiques pour présenter un plus large éventail d'actualités. Comme cet article a été traduit avec traduction automatique, il est possible qu'il contienne des erreurs de vocabulaire, de syntaxe ou de grammaire. L'article original dans Anglais peut être trouvé ici.