Modelo de base de datos eficiente para la detección de biomarcadores
Inteligencia artificial para la patología clínica: un nuevo enfoque multitarea
Según la Organización Mundial de la Salud (OMS), se ha producido un aumento significativo de los casos de cáncer en todo el mundo. Unos indicadores claros, conocidos como biomarcadores, son clave para un diagnóstico fiable y un tratamiento satisfactorio. Los sistemas de IA pueden ayudar a identificar este tipo de parámetros medibles en imágenes patológicas. Investigadores del Instituto Fraunhofer de Medicina Digital MEVIS se asociaron con la Universidad RWTH de Aquisgrán, la Universidad de Ratisbona y la Facultad de Medicina de Hannover para desarrollar un modelo básico al respecto. El modelo, que consume pocos recursos, analiza muestras de tejidos de forma rápida y fiable, basándose en sólo una fracción de los datos de entrenamiento habituales.
Alejarse de los grandes volúmenes de datos y el aprendizaje autosupervisado
Los modelos de base estándar, como los grandes modelos lingüísticos utilizados para ChatGPT, se entrenan utilizando grandes y diversos conjuntos de datos, supervisándose a sí mismos a medida que aprenden. Pero para el análisis de imágenes médicas, los datos suelen ser escasos y, de hecho, las pequeñas cantidades de datos disponibles en los estudios clínicos suponen un gran reto para el uso de la IA. Además, los centros clínicos difieren en su forma de procesar las preparaciones patológicas y en sus poblaciones de pacientes, incluso antes de tener en cuenta la forma y las características específicas de las enfermedades.
Todos estos factores dificultan la detección fiable de patrones existentes y, por tanto, de características relevantes para el diagnóstico. Para entrenar eficazmente la IA, esto significa que normalmente se necesitan grandes volúmenes de imágenes de entrenamiento de distintos orígenes. Pero cada imagen transversal de un tejido suele tener un tamaño de varios gigabytes y contiene miles de células diferentes, pero sólo refleja una pequeña fracción de la variabilidad presente.
La especialización sigue a una sólida formación básica
Fraunhofer MEVIS ha ideado una solución basada en el preentrenamiento supervisado. "Estamos desarrollando una estrategia de formación para la IA fundacional basada en la formación que reciben los patólogos. No tienen que volver a aprender qué es un núcleo en cada caso. Eso es conocimiento de manual. Una vez que se han cubierto estos conceptos, están presentes como base y pueden aplicarse a diversas enfermedades", explica el Dr. Johannes Lotz, experto de Fraunhofer MEVIS.
De forma muy similar, su modelo de IA se somete a un entrenamiento fundacional, aprendiendo características y leyes generales conocidas como conceptos tisulares a partir de una amplia colección de imágenes de secciones tisulares creadas con diversas tareas. La combinación de estas tareas da lugar a los grandes volúmenes de datos necesarios para entrenar un modelo robusto de IA de gran tamaño. A continuación, los conceptos de tejido aprendidos se aplican a una tarea específica en un segundo paso. De este modo, los algoritmos pueden identificar biomarcadores que distingan distintos tipos de tumores, por ejemplo, y todo ello con muchos menos datos.
"En nuestra solución, cada conjunto de datos ha sido anotado por un humano especialmente entrenado con la información que necesita ser aprendida", explica Jan Raphael Schäfer, experto en IA de Fraunhofer MEVIS que trabaja en el equipo de Lotz. "Le damos a nuestro modelo la imagen y le proporcionamos la respuesta al mismo tiempo. Y lo hacemos para numerosas tareas diferentes simultáneamente, utilizando un enfoque multitarea".
El equipo también utiliza un método de registro de imágenes desarrollado en el instituto: HistokatFusion. Este método permite generar automáticamente datos de entrenamiento anotados a partir de estudios de tejidos como la tinción inmunohistoquímica, utilizando así anticuerpos marcados para visualizar proteínas u otras estructuras. Para ello, este método combina información procedente de múltiples imágenes histopatológicas. Los expertos incorporan estas anotaciones generadas automáticamente al entrenamiento de su modelo, lo que acelera la obtención de datos.
Resultados sobresalientes con sólo el seis por ciento de los recursos
En comparación con los modelos que no implican un entrenamiento supervisado, el enfoque de los investigadores del Fraunhofer logra resultados similares con sólo el seis por ciento de los datos de entrenamiento. "Dado que la cantidad de datos de entrenamiento en el aprendizaje profundo se correlaciona con el esfuerzo de entrenamiento y la potencia de procesamiento, descubrimos que necesitábamos alrededor del seis por ciento de los recursos típicamente requeridos. Además, solo necesitamos unas 160 horas de entrenamiento, lo que supone un factor de coste crucial. Esto significa que podemos entrenar un modelo equivalente con mucho menos esfuerzo", explica Lotz.
La participación de los expertos de Fraunhofer en el concurso internacional SemiCOL (Semi-supervised learning for colorectal cancer detection) de clasificación y segmentación del cáncer demostró lo bien que pueden generalizarse estos modelos preentrenados. El equipo ganó la parte de clasificación del reto sin tener que realizar costosos ajustes en su modelo y quedó segundo de nueve equipos participantes.
Las pruebas de segmentación interactiva de imágenes, en las que se detectan y miden automáticamente estructuras tisulares en una imagen, también demuestran que este método tiene un gran potencial. El modelo sólo necesita unas pocas secciones de imagen de muestra para ampliar conceptos que ya ha aprendido. Pero eso no es todo. "Los modelos basados en nuestra solución permiten desarrollar nuevas herramientas interactivas de entrenamiento de IA médica que permiten a los especialistas interactuar directamente con las soluciones de IA y entrenar modelos relevantes rápidamente, incluso sin ningún conocimiento técnico previo", afirma Schäfer.
Libremente accesible y transferible
Los investigadores publican el modelo preentrenado y el código para el aprendizaje posterior en varias plataformas. Esto permite a los especialistas utilizarlo con fines no comerciales y desarrollar sus propias soluciones. El equipo también está trabajando con socios clínicos para que la solución sea aprobada para aplicaciones médicas y para validarla sistemáticamente. Los expertos de Fraunhofer MEVIS están seguros de que, una vez en la práctica clínica diaria, los sistemas que incluyan su modelo básico reducirán la carga de trabajo en patología y mejorarán el éxito del tratamiento.
Nota: Este artículo ha sido traducido utilizando un sistema informático sin intervención humana. LUMITOS ofrece estas traducciones automáticas para presentar una gama más amplia de noticias de actualidad. Como este artículo ha sido traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática. El artículo original en Inglés se puede encontrar aquí.