Une chercheuse du HSBI développe une IA pour une segmentation cellulaire plus efficace - bonne par exemple pour la recherche pharmaceutique

24.04.2025
P. Pollmeier/HSBI

Les deux représentations microscopiques montrent les mêmes cellules souches pancréatiques, l'image de gauche étant floue et difficile à lire, tandis que celle de droite est plus claire et mieux adaptée à l'analyse grâce à la segmentation assistée par IA.

Les images de cellules segmentées sont extrêmement importantes dans la recherche et le diagnostic biomédicaux. Et extrêmement coûteuses. Certes, l'intelligence artificielle (IA) peut désormais se charger de la segmentation des cellules, mais elle a besoin pour cela d'un entraînement avec une grande quantité de données étiquetées : Des données qui doivent être étiquetées manuellement par les experts. La doctorante Eiram Mahera Sheikh étudie à l'université de Bielefeld, dans le cadre du réseau de recherche SAIL, comment accélérer intelligemment ce processus. Elle mise sur l'IA, plus précisément sur le Deep Active Learning, dès la préparation des données d'entraînement.

Les deux représentations appelées dans l'ordinateur sont des images des mêmes cellules biologiques. A gauche, l'image microscopique de quelques cellules souches pancréatiques sur un substrat poreux : les petites taches blanches, de taille variable, de forme allongée, légèrement floues sur un fond gris, sont les cellules individuelles. Ici, il n'est pas si facile de distinguer si un pixel appartient encore à la cellule ou déjà au fond. Eiram Mahera Sheikh attire l'attention des visiteurs sur le côté droit : même disposition des cellules, mais cette fois-ci colorées différemment et clairement délimitées par rapport au fond désormais noir. "Avec ce masque, l'image est beaucoup plus facile à utiliser pour l'analyse. Ici, les cellules sont clairement segmentées, et ce à l'aide de l'IA, c'est-à-dire de l'intelligence artificielle". Sheikh veut faire en sorte que ce processus puisse être encore plus efficace à l'avenir - et ce en rendant l'IA intelligente grâce à l'IA. En d'autres termes, elle veut permettre que l'entraînement nécessaire de l'IA de segmentation cellulaire se déroule plus rapidement que jusqu'à présent et recourt pour cela à son tour à un procédé d'IA.

P. Pollmeier/HSBI

L'IA doit identifier les régions de l'image qui sont particulièrement importantes pour l'apprentissage de la segmentation cellulaire. Ainsi, il ne serait plus nécessaire d'étiqueter manuellement tous les pixels de l'image, mais seulement ceux qui sont particulièrement précieux comme données d'apprentissage.

Précieux, entre autres, pour le traitement du cancer : la segmentation cellulaire fournit des connaissances sur les modifications au niveau cellulaire

Mais procédons par ordre : Après plusieurs années de travail, cette informaticienne de 33 ans d'origine indienne s'est spécialisée dans la science des données et l'IA dans le cadre d'un master. Elle a maintenant rejoint l'université de Bielefeld (HSBI) en tant que doctorante. Avec la segmentation cellulaire, elle a choisi un sujet qui revêt une grande importance dans la recherche et le diagnostic biomédicaux : "L'analyse d'images de cellules segmentées fournit des informations importantes sur les caractéristiques des cellules, sur les modifications pathologiques ou sur la manière dont les cellules réagissent à certaines substances actives", explique Eiram Mahera Sheikh. "Ce sont des informations qui sont importantes, par exemple, dans le traitement du cancer ou dans la recherche pharmacologique". Les recherches de Sheik se situent toutefois deux étapes plus tôt - pour ainsi dire à un méta-niveau. "Entre-temps, la segmentation cellulaire peut également être prise en charge par des IA. Ce qui m'intéresse, c'est l'entraînement de ces IA". Et cela a de la gueule...

Le doctorat sur la segmentation cellulaire est réalisé dans le cadre du réseau de recherche SAIL de l'OWL

Dans une salle de réunion de la HSBI, le professeur Dr Wolfram Schenck est assis. Concentré, il écoute les explications de Sheikh en regardant les images projetées sur le mur. Les résultats intermédiaires de la doctorante sont discutés. Le projet fait partie du réseau de recherche interdisciplinaire SAIL. Il s'agit de l'acronyme de SustAInable Life-Cicle of Intelligent Socio-Technical Systems - grossièrement traduit : Cycle de vie durable des systèmes socio-techniques intelligents. Dans le cadre de cette association financée par le Land de Rhénanie-du-Nord-Westphalie à hauteur de 14,8 millions d'euros, l'université de Bielefeld en tant que chef de file (direction du consortium), la HSBI, la TH OWL et l'université de Paderborn coopèrent dans le but de faire fonctionner les systèmes d'intelligence artificielle de manière transparente, sûre, durable et robuste tout au long de leur cycle de vie. Pour ce faire, une vision à 360 degrés de l'IA est adoptée : Les quelque 90 scientifiques du réseau se penchent sur la recherche fondamentale dans le domaine de l'IA, sur son impact sur l'homme et la société ainsi que sur des applications concrètes dans le domaine de l'industrie 4.0 et des soins de santé intelligents. Wolfram Schenck, professeur d'ingénierie informatique, directeur scientifique du cluster d'analyse des données du Center for Applied Data Science (CfADS) sur le campus de Gütersloh et porte-parole du HSBI dans le projet SAIL, supervise la promotion d'Eiram Mahera Sheik, qui se situe à l'interface de la recherche fondamentale et des soins de santé, mais qui fournit également des connaissances au-delà.

L'étiquetage des données d'image : Comment faire gagner du temps à des experts hautement spécialisés ?

Schenck explique les défis du travail de Sheik : "Pour apprendre la segmentation cellulaire, l'IA de segmentation cellulaire a besoin de beaucoup de données étiquetées pour l'entraînement. Il s'agit de données d'images au niveau des pixels, dotées d'informations supplémentaires et classifiées". Un processus complexe, car concrètement, cela signifie que pour chaque pixel d'une image de cellules biologiques, il faut déterminer s'il appartient par exemple à la classe "arrière-plan", à la classe "membrane" ou à la classe "corps cellulaire". Schenck précise : "Ce que l'on appelle l'étiquetage ne peut aujourd'hui être effectué que manuellement par des experts qui savent exactement ce que l'on voit". Membrane cellulaire ? Cellule morte ? Arrière-plan ? - Pixel par pixel, quelqu'un de compétent doit effectuer ce travail fastidieux et quelque peu monotone avant que l'IA ne puisse être préparée à la segmentation de certaines cellules.

"Comme ce travail prend beaucoup de temps et est monotone, les experts ne le font pas volontiers", objecte le Dr Constanze Schwan. "En outre, l'étiquetage est également très coûteux en raison de sa longueur et de l'intervention de spécialistes hautement formés". Schwan se joint à la discussion. L'informaticienne du programme Career@BI de la HSBI n'enseigne pas seulement au département d'ingénierie et de mathématiques, mais travaille en même temps dans le département de recherche de l'entreprise de biotechnologie Miltenyi Biotec à Göttingen. Elle fait part des besoins de la pratique : "Ce serait un grand progrès s'il existait un modèle ou un algorithme qui réduirait les dépenses pour l'étiquetage". Car les méthodes de segmentation existantes, qui conviennent par exemple à la conduite autonome, atteignent leurs limites dans le cas d'images microscopiques. Cela s'explique notamment par les structures plus complexes et plus fines que l'on trouve dans les images. Il s'agit souvent aussi de piles d'images sur un axe temporel pour des structures en 3D. "Ces images ou piles d'images contiennent souvent des structures complexes qui sont difficiles à segmenter", explique le Dr Alaa Othman, qui complète le tour de table. En tant que chef de groupe de recherche junior au sein du réseau SAIL, l'ingénieur électricien encadre la promotion de Sheik avec le professeur Schenck.

Progrès en vue : l'IA de Sheik trie les données d'entraînement non importantes à partir de

Pour contourner le problème des structures complexes et pour soulager les équipes de spécialistes qui doivent entraîner l'IA de segmentation cellulaire, Eiram Mahera Sheikh mise à son tour sur l'IA. "Il s'agit pour moi d'identifier les régions de l'image qui sont particulièrement importantes pour l'apprentissage de la segmentation cellulaire. Ainsi, il ne serait plus nécessaire d'étiqueter manuellement tous les pixels de l'image, mais seulement ceux qui sont particulièrement précieux comme données d'apprentissage". Un tel choix ciblé de données d'entraînement potentielles est appelé "apprentissage actif" ou "Active Learning", explique Schenck : "Et comme les algorithmes d'IA pour la segmentation cellulaire proviennent de ce que l'on appelle le 'Deep Learning', nous parlons ici aussi de 'Deep Active Learning'."

Sheikh a entre-temps identifié quelles sont les données d'entraînement précieuses : "Ce sont les plus incertaines, celles pour lesquelles l'algorithme d'IA a des difficultés, par exemple en raison du mauvais contraste de l'image ou en raison de cellules qui se chevauchent ou qui présentent une forme irrégulière". Seules ces dernières devraient donc être regardées et étiquetées à l'avenir par des experts, tandis que l'effort pourrait être économisé dans les cas évidents, car l'IA de Sheik a déjà procédé à l'étiquetage. "Au fond, l'IA de segmentation cellulaire apprend ainsi avec moins de données, mais de manière si efficace qu'elle peut quand même effectuer des segmentations cellulaires précises par la suite", résume Alaa Othman.

Transfert possible des connaissances à d'autres applications, par exemple à la conduite autonome

Reste la question de savoir comment déterminer l'importance des données d'entraînement potentielles. Faut-il considérer l'ensemble de l'image ? Ou faut-il prendre des décisions locales et partielles ? Le groupe s'engage dans une discussion qu'un profane n'est rapidement plus en mesure de suivre. "En fin de compte, le projet fait de la recherche fondamentale orientée vers l'application", explique Wolfram Schenck. En effet, les algorithmes développés par Eiram Mahera Sheikh pour le Deep Active Learning, qui divisent les données d'image en régions importantes et non importantes pour l'entraînement de l'IA et rendent ainsi la segmentation cellulaire globalement plus efficace et efficiente, peuvent également être utilisés pour d'autres cas d'application, par exemple dans l'imagerie médicale, la conduite autonome ou l'analyse d'images satellites. Schenck : "Ainsi, l'approche globale et durable du projet SAIL est une fois de plus mise en évidence".

Note: Cet article a été traduit à l'aide d'un système informatique sans intervention humaine. LUMITOS propose ces traductions automatiques pour présenter un plus large éventail d'actualités. Comme cet article a été traduit avec traduction automatique, il est possible qu'il contienne des erreurs de vocabulaire, de syntaxe ou de grammaire. L'article original dans Allemand peut être trouvé ici.

Autres actualités du département science

Actualités les plus lues

Plus actualités de nos autres portails

L'intelligence artificielle révolutionne-t-elle les sciences de la vie ?