Maschinelles Lernen zur Identifizierung von Salmonellenquellen
Identifizierung tierischer Quellen zur Beendigung lebensmittelbedingter Krankheitsausbrüche
geralt; pixabay.com; CC0
In der Forschung verwendeten Xiangyu Deng und seine Kollegen mehr als tausend Genome, um die tierischen Quellen, insbesondere die Nutztiere, von Salmonella Typhimurium vorherzusagen.
Deng, ein Assistenzprofessor für Lebensmittelmikrobiologie im Zentrum, und Shaokang Zhang, ein Postdoktorand des Zentrums, leiteten das Projekt, zu dem auch Experten aus den Zentren für Krankheitsbekämpfung und -prävention, der US Food and Drug Administration, dem Minnesota Department of Health und dem Translational Genomics Research Institute gehörten.
Laut dem Foodborne Disease Outbreak Surveillance System wurden in den USA von 2009 bis 2015 fast 3.000 Ausbrüche von durch Lebensmittel übertragenen Krankheiten gemeldet. Von diesen, 900 -- oder 30 Prozent -- wurden durch verschiedene Serotypen von Salmonellen, einschließlich Typhimurium, verursacht, sagte Deng.
"Wir hatten mindestens drei Ausbrüche von Typhimuirum oder seiner engen Variante im Jahr 2018. Diese Ausbrüche waren mit Huhn, Hühnersalat und getrockneter Kokosnuss verbunden", sagte er. "Es gibt mehr als 2.600 Serotypen von Salmonellen, und Typhimurium ist nur einer davon, aber seit den 1960er Jahren sind etwa ein Viertel der Salmonellenisolate, die mit Ausbrüchen in Verbindung stehen, die der US-amerikanischen nationalen Überwachung gemeldet wurden, Typhimurium."
Die Forscher trainierten die "Maschine", einen Algorithmus namens Random Forest, mit mehr als 1.300 S. Typhimurium-Genomen mit bekannten Quellen. Nach dem Training lernte die "Maschine", wie man bestimmte tierische Quellen des S. Typhimurium-Genoms vorhersagen kann.
Für diese Studie verwendeten die Wissenschaftler Salmonella Typhimurium-Genome aus drei großen Überwachungs- und Überwachungsprogrammen: dem PulseNet-Netzwerk der CDC, der GenomeTrakr-Datenbank der FDA mit Quellen in den Vereinigten Staaten, Europa, Südamerika, Asien und Afrika sowie Fleischisolate aus dem FDA-Arm des National Antimicrobial Resistance Monitoring System.
"Bei so vielen Genomen ist maschinelles Lernen eine natürliche Wahl, um mit all diesen Daten umzugehen.
Wir haben diese große Sammlung von Typhimurium-Genomen als Trainingsset für den Aufbau des Klassifikators verwendet", sagte Deng, der 2017 für seine Arbeit auf diesem Gebiet mit der UGA Creative Research Medal ausgezeichnet wurde. "Der Klassifikator sagt die Quelle des Typhimuriumisolats voraus, indem er Tausende von genetischen Merkmalen seines Genoms abfragt."
Insgesamt prognostizierte das System die tierische Quelle des S. Typhimuriums mit 83 Prozent Genauigkeit. Der Klassifikator lieferte die besten Ergebnisse bei der Vorhersage von Geflügel- und Schweinequellen, gefolgt von Rinder- und Wildvogelquellen. Die Maschine erkennt auch, ob ihre Vorhersage präzise oder ungenau ist. Wenn die Vorhersage präzise war, war die Maschine etwa 92 Prozent der Zeit genau, sagte Deng.
"Wir haben rückwirkend acht der wichtigsten Zoonoseausbrüche in den USA von 1998 bis 2013 analysiert", sagte er. "Der Klassifizierer hat sieben von ihnen der richtigen Tierquelle zugeordnet."
Deng sagt, dass das Tool Einschränkungen hat; es kann keine Meeresfrüchte als Quelle vorhersagen und es hat Schwierigkeiten, Salmonella-Stämme vorherzusagen, die "zwischen verschiedenen Tieren herumhüpfen".
"Ich würde diesen Ansatz als Proof of Concept bezeichnen. Es wird besser werden, wenn mehr Genome aus verschiedenen Quellen verfügbar werden", sagte er.
In Tweets über die Studie bezeichnete Frank Yiannas, stellvertretender Direktor der FDA, das maschinelle Lernen ganzer Genomsequenzen als "eine neue Ära intelligenterer Lebensmittelsicherheit und Epidemiologie".
Für den Durchschnittsmenschen bedeutet der Erfolg dieses Projekts, dass Salmonella Typhimurium-Stämme schneller bis zur Quelle zurückverfolgt werden können. Die Identifizierung der Ursachen eines durch Lebensmittel verursachten Krankheitsausbruchs ist der Schlüssel, um ihn zu stoppen und weitere Krankheiten zu verhindern.
"Mit unserer Methode können Ermittler Fälle desselben Ausbruchs besser miteinander verknüpfen und Isolate aus Lebensmitteln oder Lebensmittelverarbeitungsumgebungen besser aufeinander abstimmen, um sie von kranken Menschen zu isolieren", sagte er. "Das wird den Ermittlern mehr Selbstvertrauen geben, eine bestimmte Quelle anzudeuten, die hinter dem Ausbruch steckt."
Originalveröffentlichung
Shaokang Zhang, Shaoting Li, Weidong Gu, Henk den Bakker, Dave Boxrud, Angie Taylor, Chandler Roe, Elizabeth Driebe, David M. Engelthaler, Marc Allard, Eric Brown, Patrick McDermott, Shaohua Zhao, Beau B. Bruce, Eija Trees, Patricia I. Fields, and Xiangyu Deng; "Zoonotic Source Attribution of Salmonella enterica Serotype Typhimurium Using Genomic Surveillance Data, United States"; Emerging Infectious Diseases; 2019