Herramientas de inteligencia artificial predicen la función reguladora del ADN y su estructura 3D

Los algoritmos de modelado de secuencias podrían conducir a nuevas formas de combatir las enfermedades causadas por mutaciones genéticas

10.08.2022 - Estados Unidos

Unos programas de inteligencia artificial (IA) recientemente desarrollados predijeron con precisión la función de los elementos reguladores del ADN y su estructura tridimensional (3D) basándose únicamente en su secuencia bruta, según dos estudios recientes publicados en Nature Genetics. Estas herramientas podrían arrojar nueva luz sobre cómo las mutaciones genéticas conducen a la enfermedad y podrían conducir a una nueva comprensión de cómo la secuencia genética influye en la organización espacial y la función del ADN cromosómico en el núcleo, dijo el autor del estudio Jian Zhou, Ph.D., profesor asistente en el Departamento de Bioinformática Lyda Hill en UTSW.

UT Southwestern Medical Center

Estructura 3D prevista para un segmento de ADN genómico humano

"En conjunto, estos dos programas proporcionan una imagen más completa de cómo los cambios en la secuencia del ADN, incluso en las regiones no codificantes, pueden tener efectos dramáticos en su organización espacial y su función", dijo el Dr. Zhou, miembro del Centro Integral del Cáncer Harold C. Simmons, becario de la Fundación Lupe Murchison en Investigación Médica y del Instituto de Prevención e Investigación del Cáncer de Texas (CPRIT).

Sólo un 1% del ADN humano codifica instrucciones para la fabricación de proteínas. Las investigaciones de las últimas décadas han demostrado que gran parte del material genético no codificante restante contiene elementos reguladores -como promotores, potenciadores, silenciadores y aislantes- que controlan cómo se expresa el ADN codificante. El Dr. Zhou explicó que no se conoce bien cómo la secuencia controla las funciones de la mayoría de estos elementos reguladores.

Para comprender mejor estos componentes reguladores, él y sus colegas de la Universidad de Princeton y el Instituto Flatiron desarrollaron un modelo de aprendizaje profundo al que llamaron Sei, que clasifica con precisión estos fragmentos de ADN no codificante en 40 "clases de secuencias" o trabajos, por ejemplo, como potenciador de la actividad de los genes de las células madre o de las células cerebrales. Estas 40 clases de secuencias, desarrolladas a partir de casi 22.000 conjuntos de datos de estudios anteriores sobre la regulación del genoma, cubren más del 97% del genoma humano. Además, Sei puede puntuar cualquier secuencia por su actividad prevista en cada una de las 40 clases de secuencias y predecir el impacto de las mutaciones en dichas actividades.

Al aplicar Sei a los datos de genética humana, los investigadores pudieron caracterizar la arquitectura reguladora de 47 rasgos y enfermedades registrados en la base de datos del Biobanco del Reino Unido y explicar cómo las mutaciones en los elementos reguladores causan patologías específicas. Estas capacidades pueden ayudar a obtener una comprensión más sistemática de cómo los cambios en la secuencia genómica están vinculados a las enfermedades y otros rasgos. Los resultados se han publicado este mes.

En mayo, el Dr. Zhou informó del desarrollo de una herramienta diferente, denominada Orca, que predice la arquitectura 3D del ADN en los cromosomas basándose en su secuencia. Utilizando conjuntos de datos existentes de secuencias de ADN y datos estructurales derivados de estudios anteriores que revelaban los pliegues, giros y vueltas de la molécula, el Dr. Zhou entrenó el modelo para hacer conexiones y evaluó la capacidad del modelo para predecir la estructura a varias escalas de longitud.

Los resultados mostraron que Orca predijo estructuras de ADN tanto pequeñas como grandes basándose en sus secuencias con gran precisión, incluso para secuencias que portaban mutaciones asociadas a diversas condiciones de salud, como una forma de leucemia y malformaciones de las extremidades. Orca también permitió a los investigadores generar nuevas hipótesis sobre cómo la secuencia de ADN controla su estructura 3D local y a gran escala.

El Dr. Zhou dijo que él y sus colegas planean utilizar Sei y Orca, que están disponibles públicamente en servidores web y como código abierto, para seguir explorando el papel de las mutaciones genéticas en la causa de las manifestaciones moleculares y físicas de las enfermedades - investigación que podría eventualmente conducir a nuevas formas de tratar estas condiciones.

Nota: Este artículo ha sido traducido utilizando un sistema informático sin intervención humana. LUMITOS ofrece estas traducciones automáticas para presentar una gama más amplia de noticias de actualidad. Como este artículo ha sido traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática. El artículo original en Inglés se puede encontrar aquí.

Más noticias del departamento ciencias

Noticias más leídas

Más noticias de nuestros otros portales

Tan cerca que
incluso las moléculas
se vuelven rojas...