Un programa informático especial mejora la precisión de la anotación del genoma de animales y plantas

"BRAKER3 marca un avance significativo en bioinformática y proporciona a los académicos de todo el mundo acceso a una herramienta de alto rendimiento para la anotación del genoma"

21.06.2024
Computer-generated image

Imagen simbólica

El software BRAKER3, de reciente desarrollo, proporciona a científicos de todo el mundo acceso a un instrumento de alto rendimiento para la anotación genómica, es decir, para identificar y etiquetar varias características relevantes de una secuencia genómica. El software representa un avance considerable en la investigación bioinformática. Ha sido desarrollado por investigadores de la Universidad de Greifswald en colaboración con colegas del Georgia Institute of Technology de Atlanta (EE.UU.). El equipo internacional de bioinformática de Greifswald, dirigido por el Prof. Dr. Mario Stanke, ha presentado ahora el software en la revista Genome Research. BRAKER3 aprovecha el hecho de que los mismos genes pueden encontrarse de forma similar en varias especies aunque su origen evolutivo conjunto haya pasado hace tiempo, como ocurre por ejemplo en el caso de una mariposa y una mosca de la fruta. El desarrollo del programa ha sido financiado por los Institutos Nacionales de Salud de Estados Unidos.

La determinación precisa de la estructura de los genes codificadores de proteínas en las secuencias genómicas es clave para la comprensión biológica de la vida. El éxito de numerosos experimentos depende en gran medida de una anotación genómica sin errores. La catalogación de los genes codificadores de proteínas en los genomas de eucariotas es, por tanto, uno de los mayores retos a los que se enfrenta el Proyecto BioGenoma de la Tierra. Su objetivo es secuenciar los genomas de al menos 1,5 millones de especies eucariotas. Los eucariotas tienen células que poseen un núcleo celular. Los organismos eucariotas incluyen animales, humanos, plantas y hongos. Los proyectos genómicos individuales pueden utilizarse para fines como: el tratamiento selectivo de enfermedades transmitidas por animales, el estudio de las funciones de los genes en insectos o en el cultivo de plantas.

Un problema central al que se enfrentan muchas herramientas de anotación genómica es el llamado aprendizaje supervisado: los modelos matemáticos subyacentes requieren ejemplos de entrenamiento que consisten en genes de la especie objetivo para ajustar los parámetros a esta especie objetivo. Aquí es donde el equipo de BRAKER3 es capaz de aprovechar la experiencia adquirida en versiones anteriores del software, incluyendo también las pruebas combinadas de datos transcriptómicos y proteínicos en este paso de entrenamiento. A diferencia de las versiones anteriores de la herramienta, ahora pueden considerarse simultáneamente ambos tipos de pruebas.

En pruebas comparativas con 11 especies, BRAKER3 superó claramente a las versiones anteriores. La mejora es especialmente clara en especies con genomas grandes y complejos, como el ratón y el pollo. Además, la nueva versión del software es mucho más precisa que otros programas alternativos muy utilizados en el pasado.

"BRAKER3 representa un avance considerable en la precisión y capacidad de automatización de la anotación de genomas eucariotas, especialmente en el caso de genomas grandes y estructuralmente complejos", explica Lars Gabriel, del Instituto de Matemáticas de la Universidad de Greifswald y autor principal de la publicación. "La nueva versión del software es una herramienta que ya está siendo utilizada por un gran número de usuarios, en rápido crecimiento". Los esfuerzos del equipo por diseñar el software de modo que funcione en paquetes aislados que contengan todos los componentes necesarios para el programa y en diversos sistemas informáticos sin ajustes adicionales han sido acogidos de forma especialmente positiva por la comunidad investigadora internacional. En este principio, conocido como "contenedorización", ha influido decisivamente la excelente infraestructura informática de alto rendimiento del Centro Universitario de Informática de Greifswald", afirma la Dra. Katharina Hoff, del Instituto de Matemáticas de la Universidad de Greifswald. Lleva muchos años trabajando en el desarrollo de BRAKER.

"BRAKER3 marca un avance significativo en bioinformática y proporciona a los académicos de todo el mundo acceso a una herramienta de alto rendimiento para la anotación genómica. Durante las próximas fases de desarrollo, los desarrolladores mejorarán y entrenarán específicamente grandes modelos lingüísticos, ya que los genomas pueden entenderse como un "lenguaje" de la biología cuyos genes codificados siguen una gramática estricta", explica el Prof. Dr. Mario Stanke, Jefe del Grupo de Investigación en Bioinformática del Instituto de Matemáticas de la Universidad de Greifswald.

Nota: Este artículo ha sido traducido utilizando un sistema informático sin intervención humana. LUMITOS ofrece estas traducciones automáticas para presentar una gama más amplia de noticias de actualidad. Como este artículo ha sido traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática. El artículo original en Inglés se puede encontrar aquí.

Publicación original

Más noticias del departamento ciencias

Noticias más leídas

Más noticias de nuestros otros portales

Lucha contra el cáncer: últimos avances y progresos