L'apprentissage automatique réduit radicalement la charge de travail liée au comptage des cellules pour le diagnostic des maladies
Cyborg and Bionic Systems
Leur nouveau schéma de formation est décrit dans un article publié le 9 avril dans la revue Cyborg and Bionic Systems .
Le nombre et le type de cellules dans le sang jouent souvent un rôle crucial dans le diagnostic des maladies, mais les techniques d'analyse cellulaire couramment utilisées pour effectuer ce comptage des cellules sanguines - qui impliquent la détection et la mesure des caractéristiques physiques et chimiques des cellules en suspension dans un fluide - sont coûteuses et nécessitent des préparations complexes. Pire encore, la précision des machines d'analyse cellulaire n'est que d'environ 90 % en raison de diverses influences telles que la température, le pH, la tension et le champ magnétique qui peuvent perturber l'équipement.
Afin d'améliorer la précision, de réduire la complexité et de diminuer les coûts, une grande partie de la recherche sur les alternatives s'est concentrée dernièrement sur l'utilisation de programmes informatiques pour effectuer une "segmentation" sur des photographies du sang prises par une caméra haute-definition connectée à un microscope. La segmentation implique des algorithmes qui effectuent un étiquetage pixel par pixel de ce qui apparaît dans une photo, dans ce cas, quelles parties de l'image sont des cellules et lesquelles ne le sont pas - en substance, il s'agit de compter le nombre de cellules dans une image.
Pour les images dans lesquelles un seul type de cellule apparaît, ces méthodes atteignent un niveau de précision décent, mais elles sont peu performantes lorsqu'elles sont confrontées à des images comportant plusieurs types de cellules. C'est pourquoi, ces dernières années, pour tenter de résoudre ce problème, les chercheurs se sont tournés vers les réseaux de neurones convolutifs (CNN) - un type d'apprentissage automatique qui reflète la structure de connexion du cortex visuel humain.
Pour que le CNN puisse accomplir cette tâche, il doit d'abord être "entraîné" à comprendre ce qu'est ou n'est pas une cellule sur plusieurs milliers d'images de cellules que les humains ont étiquetées manuellement. Ensuite, lorsqu'il reçoit une nouvelle image non étiquetée, il reconnaît et peut compter les cellules qu'elle contient.
"Mais cet étiquetage manuel est laborieux et coûteux, même lorsqu'il est effectué avec l'aide d'experts", a déclaré Guangdong Zhan, co-auteur de l'article et professeur au département de génie mécanique et d'automatisation de l'université Beihang, "ce qui va à l'encontre de l'objectif d'une solution qui est censée être plus simple et moins chère que les analyseurs de cellules."
Les chercheurs de l'université de Beihang ont donc mis au point un nouveau schéma d'entraînement du CNN, en l'occurrence U-Net, un modèle de segmentation par réseau entièrement convolutif largement utilisé dans la segmentation des images médicales depuis sa création en 2015.
Dans le nouveau schéma d'entraînement, le CNN est d'abord entraîné sur un ensemble de plusieurs milliers d'images comportant un seul type de cellules (prélevées dans le sang de souris).
Ces images monocellulaires sont "prétraitées" automatiquement par des algorithmes classiques qui réduisent le bruit dans les images, améliorent leur qualité et détectent les contours des objets dans l'image. Ils effectuent ensuite une segmentation adaptative de l'image. Ce dernier algorithme calcule les différents niveaux de gris d'une image en noir et blanc et, si une partie de l'image se situe au-delà d'un certain seuil de gris, l'algorithme la segmente comme un objet distinct. Ce qui rend le processus adaptatif, c'est que plutôt que de segmenter les parties de l'image en fonction d'un seuil de gris fixe, il le fait en fonction des caractéristiques locales de l'image.
Après avoir présenté l'ensemble d'apprentissage d'un seul type de cellule au modèle U-Net, ce dernier est affiné à l'aide d'un petit ensemble d'images de plusieurs types de cellules annotées manuellement. En comparaison, une certaine quantité d'annotation manuelle demeure, et le nombre d'images devant être étiquetées par des humains passe de plusieurs milliers à seulement 600.
Pour tester leur système d'apprentissage, les chercheurs ont d'abord utilisé un analyseur cellulaire traditionnel sur les mêmes échantillons de sang de souris afin d'effectuer un comptage cellulaire indépendant auquel ils pouvaient comparer leur nouvelle approche. Ils ont constaté que la précision de leur méthode d'apprentissage pour la segmentation d'images de types cellulaires multiples était de 94,85 %, soit le même niveau que celui obtenu en s'entraînant avec des images de types cellulaires multiples annotées manuellement.
Cette technique peut également être appliquée à des modèles plus avancés afin de prendre en compte des problèmes de segmentation plus complexes.
Comme la nouvelle technique de formation implique toujours un certain niveau d'annotation manuelle, les chercheurs espèrent poursuivre le développement d'un algorithme entièrement automatique pour l'annotation et la formation des modèles.
Note: Cet article a été traduit à l'aide d'un système informatique sans intervention humaine. LUMITOS propose ces traductions automatiques pour présenter un plus large éventail d'actualités. Comme cet article a été traduit avec traduction automatique, il est possible qu'il contienne des erreurs de vocabulaire, de syntaxe ou de grammaire. L'article original dans Anglais peut être trouvé ici.