Intelligente Algorithmen für die Genomforschung
Plattform „Kipoi“ verbessert Zugang zu Machine-Learning-Modellen
Obwohl die Bedeutung von Methoden des Maschinellen Lernens in der Genomforschung in den letzten Jahren stetig gewachsen ist, mussten Forscherinnen und Forscher häufig auf veraltete Software zurückgreifen. Für die klinische Forschung waren die aktuellsten Modelle meist nicht zugänglich, da diese auf nichtöffentlichen Servern gespeichert wurden. Das soll sich mit einer neuen kostenlosen Open-Access-Plattform ändern: Kipoi ermöglicht den einfachen Austausch von Machine-Learning-Modellen im Bereich der Genomforschung. Geschaffen wurde die Plattform von Julien Gagneur, Assistenzprofessor für Computational Biology an der TUM in Zusammenarbeit mit Forscherinnen und Forschern der University of Cambridge, der Stanford University, des European Bioinformatics Institute (EMBL-EBI) und des European Molecular Biology Laboratory (EMBL).
Trainierte Modelle leicht zugänglich
„Was Kipoi besonders macht, ist dass man hier frei zugänglich bereits trainierte Machine-Learning-Modelle finden kann“, sagt Julien Gagneur. „Die Algorithmen, die wir hier bereitstellen, haben schon die wichtigsten Daten als Input bekommen und daran gelernt. Sie sind also sofort einsatzbereit, da der zeitraubende Prozess, sie auf Daten anzuwenden, bereits abgeschlossen ist“, sagt Anshul Kundaje, Assistenzprofessor in Stanford. Mehr als 2.000 trainierte Modelle sind auf Kipoi momentan frei zugänglich. Wie die neue Plattform den Wissensaustausch in der Genomik-Community beschleunigen und damit die Genomforschung als Ganzes voranbringen wird, zeigen die Forscherinnen und Forscher in einer aktuell in Nature Biotechnology veröffentlichten Studie.
Schnelle Algorithmen und einfache Bedienung
Kipoi vereinfacht den Zugang zu bereits trainierten Modellen und ermöglicht es Forscherinnen und Forschern dadurch, das sogenannte Transferlernen durchzuführen: Ein Modell, das bereits mit einem bestimmten Datensatz trainiert wurde, kann eine ähnliche Aufgabe schneller lernen.
Zudem vereinfacht Kipoi den Prozess der Dateneingabe in die dort gespeicherten Modelle: Durch standardisierte Dateiformate und Software-Frameworks beschränkt sich die Installation und Ausführung eines Modells auf drei einfache Befehle. Die Plattform ist so auch für diejenigen leicht zu bedienen, die bisher keine Erfahrung mit Maschinellem Lernen hatten.
Zum Verständnis einzelner Genome
Da Kipoi speziell auf Modelle ausgerichtet ist, die Genotyp und Phänotyp miteinander verknüpfen, wird es mithilfe der neuen Plattform einfacher werden, genetische Ursachen für Krankheiten ausfindig zu machen: „Die Deep-Learning-Modelle, die wir mit Kipoi zur Verfügung stellen, basieren auf massiven genomischen Datensätzen“, sagt Julien Gagneur. „Dies bietet sehr spannende Möglichkeiten, einzelne Genome zu verstehen. Zum Beispiel genetische Varianten, die Krankheiten verursachen, zu identifizieren oder Mutationen in Tumoren zu interpretieren.“
Wie groß der Beitrag der Plattform für die Genomforschung sein wird, hängt allerdings auch von der Genomik-Community ab. „Wir hoffen, dass in Zukunft mehr Forscherinnen und Forscher ihre Modelle in unsere Plattform einbringen werden“, sagt Oliver Stegle, Teamleiter am EMBL. „Nur so können wir die Genomik-Analyse zugänglich gestalten und der Community eine breitere Palette an prädiktiven maschinellen Lernwerkzeugen zur Verfügung stellen.“