Diagnose per Computer: Gefährliche Krankheitserreger mithilfe maschinellen Lernens erkennen
Neues maschinelles Lern-Tool kann helfen gefährliche Krankheitserreger schneller zu entdecken
© HZI/Manfred Rohde
Seit Genom-Sequenzierungen erschwinglich geworden sind, setzen Wissenschaftler sie auf der ganzen Welt ein, um anhand der genetischen Eigenschaften von Bakterien besser zu verstehen, wie diese Erreger Infektionen verursachen, wie sich Krankheiten verbreiten, wie Bakterien resistent gegen Medikamente werden und welche Bakterienstämme Krankheitsausbrüche auslösen können. Die Methoden, die derzeit zur Verfügung stehen, um die genetischen Veränderungen neuer Erregerstämme bei einem Krankheitsausbruch zu identifizieren, sind allerdings sehr zeitaufwendig und oft mit dem manuellen Abgleichen des neuen Stammes mit vorhandenen Referenz-Sammlungen verbunden.
Die Bakteriengattung Salmonella, im deutschen Sprachgebrauch Salmonellen genannt, umfasst viele verschiedene Arten. Einige von ihnen verursachen Lebensmittelvergiftungen, bekannt als Magen-Darm-Salmonellen, während andere weit über den Darm hinausreichende Krankheiten hervorrufen – wie der Typhuserreger Salmonella enterica Serovar Typhi.
Um zu verstehen, wie bestimmte genetische Veränderungen dazu führen, dass ein neu auftretender Salmonellen-Stamm eine Lebensmittelvergiftung oder eine weitreichendere Infektion auslöst, haben die Forscher ein sogenanntes Machine-Learning-Tool entwickelt. Diese Software analysiert, welche Mutationen eine wichtige Rolle in der Krankheitsentwicklung spielen.
Das Entwicklerteam etablierte dafür ein Modell, das darauf trainiert wurde, wichtige krankheitsassoziierte Unterschiede zwischen verschiedenen Salmonellenstämmen gezielt zu erkennen. Als Trainingsdatensatz diente den Forschern die genetische Information von 13 bekannten und genetisch sehr unterschiedlichen Salmonella enterica-Stämmen mit unterschiedlichen Krankheitspotenzialen. Das Modell identifizierte dabei fast 200 Gene, die einen Einfluss darauf haben, ob ein Bakterium eher eine Lebensmittelvergiftung oder einen invasiven Infektionsprozess auslöst.
Dr. Nicole Wheeler, Ko-Hauptautorin der Studie am Wellcome Sanger Institute, sagte: „Wir haben ein neues Machine-Learning-Modell entwickelt, mit dem wir erkennen können, ob neu auftretende Bakterienstämme ein potenzielles Risiko für die öffentliche Gesundheit darstellen. Mit diesem Tool können wir große Datenmengen bewältigen und in Sekundenschnelle Ergebnisse erhalten. Dies wird zukünftig eine Form der Überwachung von krankheitserregenden Bakterien ermöglichen, die bisher noch nicht denkbar war – und das nicht nur auf einzelnen Krankenstationen, sondern weltweit.
Seinen ersten Praxiseinsatz hat das maschinelle Lern-Tool bereits erfolgreich bestanden: Beim Vergleich neuer Salmonella-Stämme, die derzeit südlich der Sahara auftreten, hat die Software aus der Gesamtheit häufig auftretender Infektionstypen (Salmonella Enteritidis und Salmonella Typhimurium) gezielt zwei Varianten des Erregers hervorgehoben, die besonders gefährlich sind und eine höhere Anzahl von Blutbahn-Infektionen auslösen. Diese Infektionen bedrohen vor allem Menschen mit einem geschwächten Immunsystem, wie es zum Beispiel HIV-Infizierte haben. Das maschinelle Lern-Tool zeigte deutlich die genetischen Veränderungen auf, die es diesen beiden Salmonella-Stämmen ermöglichen, sich an ihre Wirte anzupassen und damit invasiver zu werden.
Dr. Lars Barquist, Ko-Hauptautor am Helmholtz-Institut für RNA-basierte Infektionsforschung in Würzburg, sagte: „Das maschinelle Lern-Tool ist ein bedeutender methodischer Fortschritt, da es nicht nur nach Genen und Mutationen sucht, sondern auch nach den funktionellen Auswirkungen, die diese Mutationen haben. Es kann damit vorhersagen, welche Mutationen es den Krankheitserregern ermöglichen, sich über den Darm hinaus zu verbreiten und damit lebensbedrohliche Krankheiten auszulösen. Das wird zukünftig dabei helfen, effektivere Behandlungsmethoden zu entwickeln.“
Das maschinelle Lern-Tool ist nicht auf Salmonellen beschränkt, sondern vielfältig einsetzbar. Genauso könnte es zur Untersuchung anderer Faktoren, zum Beispiel entstehende Antibiotikaresistenzen bei verschiedensten Krankheitserregern, angewendet werden. Mit diesem Tool lassen sich gefährliche Bakterienstämme in Echtzeit identifizieren und Krankheitsausbrüche verhindern.
Dr. Nicholas Feasey von der Liverpool School of Tropical Medicine sagte dazu: „Wir nutzen diesen Ansatz bereits, um nach den wichtigsten Unterschieden zwischen asiatischen und afrikanischen Salmonella enterica (Serovar Typhi)-Stämmen zu suchen. Anstatt die Genome verschiedener Bakterienstämme in wochen- und monatelanger Kleinarbeit manuell zu vergleichen, sind wir nun in der Lage, die genetischen Veränderungen neuer Krankheitserreger sofort zu bestimmen. Das bietet uns die Möglichkeit, Krankheitsausbrüche sozusagen live zu verfolgen und damit schnell gesundheitspolitische Maßnahmen zur Kontrolle und Prävention ergreifen zu können.“
Originalveröffentlichung
Nicole E. Wheeler, Paul P. Gardner, Lars Barquist; "Machine learning identifies signatures of host adaptation in the bacterial pathogen Salmonella enterica"; PLOS Genetics 2018