Wie Maschinenlernen, Datenintegration und KI zu besseren Strategien im Kampf gegen Krankheitserreger beitragen
Forschende des HIRI entwickeln neuen maschinellen Lernansatz
Im Erbgut – der DNA – eines Organismus steckt der Bauplan für Proteine und damit für die Herstellung neuer Zellen. Molekularbiologische CRISPR-Technologien ermöglichen es, einzelne Gene gezielt zu verändern oder abzuschalten und die Proteinproduktion zu unterbinden. Die Idee dahinter ist, Krankheitserreger zu bekämpfen, genetische Erkrankungen zu heilen oder andere nützliche Effekte zu erzielen.
Eines dieser molekularbiologischen Werkzeuge ist CRISPRi (von “CRISPR-Interferenz”). Dabei handelt es sich um ein biochemisches Verfahren, das es ermöglicht, Gene und die Genexpression zu blockieren, ohne dass dafür die DNA-Sequenz verändert werden muss. Wie bei dem als „Genschere“ bekannten CRISPR-Cas-System steuert bei dieser Methode eine Ribonukleinsäure (RNA), die als Leit-RNA dient, eine Nuklease (Cas). Im Gegensatz zur Genschere bindet die Nuklease bei CRISPRi jedoch nur an spezifische Stellen der DNA, ohne diese zu schneiden. Die Bindung bewirkt, dass das entsprechende Gen nicht abgelesen wird und damit inaktiv bleibt.
Wie gut dieses Verfahren für ein bestimmtes Gen funktioniert, war bislang nur schwer vorherzusagen. Forschende vom Würzburger Helmholtz-Institut für RNA-basierte Infektionsforschung (HIRI) in Zusammenarbeit mit der Universität Würzburg und der Kooperative Helmholtz AI (Helmholtz Artificial Intelligence Cooperation Unit) haben jetzt mithilfe von Datenintegration und Künstlicher Intelligenz (KI) einen maschinellen Lernansatz entwickelt, um solche Vorhersagen in Zukunft zu verbessern.
Der Ansatz
CRISPRi-Screens sind ein höchst empfindliches Werkzeug, mit dem Forschende die Effekte einer reduzierten Genexpression untersuchen können. In ihrer Studie, die im Fachmagazin Genome Biology erschienen ist, haben die Wissenschaftler:innen Daten aus mehreren genomweiten CRISPRi-Screens zusammengeführt, um einen maschinellen Lernansatz zu trainieren. Ihr Ziel: bessere Vorhersagen darüber, wie wirksam die im CRISPRi-System zum Einsatz kommenden, künstlich entworfenen Leit-RNAs sind.
„Genomweite Screens liefern leider nur indirekte Informationen über die Effizienz einer Leit-RNA. Deswegen haben wir eine neue maschinelle Lernmethode angewandt, die die Wirksamkeit der eingesetzten Leit-RNA getrennt vom Effekt des abgeschalteten Gens beleuchtet“, erläutert Lars Barquist. Der Computer-Biologe hat die Studie initiiert und leitet eine Bioinformatik-Forschungsgruppe am Würzburger Helmholtz-Institut, einem Standort des Braunschweiger Helmholtz-Zentrums für Infektionsforschung in Kooperation mit der Julius-Maximilians-Universität Würzburg.
Mithilfe weiterer KI-Werkzeuge stellte das Team verständliche Designregeln für künftige CRISPRi-Experimente auf. Ein umfassendes, auf essenzielle bakterielle Gene gerichtetes Screening, das die Studienautoren unabhängig von ihren ursprünglichen Trainingsdaten durchführten, validierte schließlich den Ansatz und ergab präzisere Prognosen.
„Die Ergebnisse haben gezeigt, dass unser Modell bisherige Methoden übertrifft und zuverlässigere Vorhersagen über die Leistung von CRISPRi bei der Ausrichtung auf bestimmte Gene liefert“, freut sich Yanying Yu, Doktorandin in der Arbeitsgruppe von Lars Barquist und Erstautorin der Studie.
Besonders überraschte die Forschenden, dass nicht die Leit-RNA selbst der wichtigste Faktor dafür ist zu bestimmen, wie gut diese in CRISPRi-Screens verringert wird. „Gewisse genspezifische Merkmale, die mit der Genexpression zusammenhängen, haben hierbei offenbar einen größeren Einfluss, als bisher angenommen“, erklärt Yu.
Zudem verdeutlicht die Studie, dass die Kombination von Informationen aus verschiedenen Datensätzen die Präzision von Vorhersagemodellen erheblich verbessert und eine zuverlässigere Einschätzung der Effizienz von Leit-RNAs ermöglicht. „Die Erweiterung unserer Trainingsdaten durch Zusammenführung mehrerer Experimente ist essenziell, um bessere Vorhersagemodelle zu schaffen. Vor unserer Studie war der Mangel an Daten ein limitierender Faktor für die Vorhersagegenauigkeit“, resümiert Juniorprofessor Barquist. Der jetzt veröffentlichte Ansatz wird künftig sowohl der Biotechnologie als auch der Grundlagenforschung dienen und dabei helfen, effektivere CRISPRi-Experimente zu planen. „Unsere Studie liefert eine Blaupause für die Entwicklung präziserer Instrumente, die die bakterielle Genexpression manipulieren und letztlich dazu beitragen, Krankheitserreger besser zu verstehen und zu bekämpfen“, so Barquist.
Originalveröffentlichung
Yanying Yu, Sandra Gawlitt, Lisa Barros de Andrade e Sousa, Erinc Merdivan, Marie Piraud, Chase L. Beisel, Lars Barquist; "Improved prediction of bacterial CRISPRi guide efficiency from depletion screens through mixed-effect machine learning and data integration"; Genome Biology, Volume 25, 2024-1-11