Un algoritmo de IA resuelve los retos de la biología estructural
Los investigadores desarrollan métodos de aprendizaje automático que predicen con exactitud las formas tridimensionales de las dianas farmacológicas y otras moléculas biológicas importantes, incluso cuando sólo se dispone de datos limitados
Camille L.L. Townshend
Utilizando nuevas e inteligentes técnicas de aprendizaje automático, los estudiantes de doctorado de la Universidad de Stanford Stephan Eismann y Raphael Townshend, bajo la dirección de Ron Dror, profesor asociado de ciencias de la computación, han desarrollado un enfoque que supera este problema al predecir computacionalmente estructuras precisas.
Lo más destacable es que su método tiene éxito incluso cuando se aprende a partir de unas pocas estructuras conocidas, lo que lo hace aplicable a los tipos de moléculas cuyas estructuras son más difíciles de determinar experimentalmente.
Su trabajo se demuestra en dos artículos que detallan aplicaciones para moléculas de ARN y complejos multiproteicos, publicados en Science el 27 de agosto de 2021 y en Proteins en diciembre de 2020, respectivamente. El artículo en Science es una colaboración con el laboratorio de Stanford de Rhiju Das, profesor asociado de bioquímica.
"La biología estructural, que es el estudio de las formas de las moléculas, tiene este mantra de que la estructura determina la función", dijo Townshend.
El algoritmo diseñado por los investigadores predice con exactitud las estructuras moleculares y, al hacerlo, puede permitir a los científicos explicar cómo funcionan las distintas moléculas, con aplicaciones que van desde la investigación biológica fundamental hasta las prácticas de diseño de fármacos con conocimiento de causa.
"Las proteínas son máquinas moleculares que realizan todo tipo de funciones. Para ejecutar sus funciones, las proteínas suelen unirse a otras proteínas", explica Eismann. "Si se sabe que un par de proteínas está implicado en una enfermedad y se conoce cómo interactúan en 3D, se puede intentar dirigir esta interacción de forma muy específica con un fármaco".
Eismann y Townshend son coautores del artículo de Science con el becario postdoctoral de Stanford Andrew Watkins, del laboratorio Das, y también coautores del artículo de Proteins con el antiguo estudiante de doctorado de Stanford Nathaniel Thomas.
Diseñar el algoritmo
En lugar de especificar lo que hace que una predicción estructural sea más o menos precisa, los investigadores dejaron que el algoritmo descubriera estas características moleculares por sí mismo. Lo hicieron así porque descubrieron que la técnica convencional de proporcionar tales conocimientos puede inclinar el algoritmo a favor de ciertas características, impidiéndole así encontrar otras características informativas.
"El problema de estos rasgos elaborados a mano en un algoritmo es que éste se inclina por lo que la persona que escoge estos rasgos considera importante, y podría pasar por alto alguna información que necesitaría para hacerlo mejor", dijo Eismann.
"La red aprendió a encontrar conceptos fundamentales que son clave para la formación de estructuras moleculares, pero sin que se le dijera explícitamente que lo hiciera", dijo Townshend. "Lo emocionante es que el algoritmo ha recuperado claramente cosas que sabíamos que eran importantes, pero también ha recuperado características que antes desconocíamos".
Tras demostrar su éxito con las proteínas, los investigadores aplicaron su algoritmo a otra clase de moléculas biológicas importantes, los ARN. Probaron su algoritmo en una serie de "rompecabezas de ARN" de una antigua competición en su campo, y en todos los casos, la herramienta superó a todos los demás participantes en el rompecabezas y lo hizo sin estar diseñada específicamente para estructuras de ARN.
Aplicaciones más amplias
Los investigadores están entusiasmados por ver dónde más se puede aplicar su enfoque, ya que han tenido éxito con complejos de proteínas y moléculas de ARN.
"La mayoría de los espectaculares avances recientes en el aprendizaje automático han requerido una enorme cantidad de datos para el entrenamiento. El hecho de que este método tenga éxito con muy pocos datos de entrenamiento sugiere que los métodos relacionados podrían abordar problemas no resueltos en muchos campos en los que los datos son escasos", dijo Dror, que es autor principal del artículo sobre proteínas y, con Das, coautor del artículo de Science.
En el caso concreto de la biología estructural, el equipo afirma que sólo están arañando la superficie en cuanto a los avances científicos que se pueden lograr.
"Una vez que se tiene esta tecnología fundamental, se aumenta el nivel de comprensión un paso más y se puede empezar a plantear la siguiente serie de preguntas", dijo Townshend. "Por ejemplo, puedes empezar a diseñar nuevas moléculas y medicamentos con este tipo de información, que es un área que entusiasma a la gente".
Nota: Este artículo ha sido traducido utilizando un sistema informático sin intervención humana. LUMITOS ofrece estas traducciones automáticas para presentar una gama más amplia de noticias de actualidad. Como este artículo ha sido traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática. El artículo original en Inglés se puede encontrar aquí.