Datenanalyse zum Coronavirus
Open-Source-Plattform ermöglicht freie und transparente Ansicht von Genominformationen zu COVID-19
geralt, pixabay.com, CC0
Die Plattform Galaxy eignet sich zur Analyse von Big Data in den Lebenswissenschaften. Über öffentliche Server erhalten Wissenschaftler unter anderem freien Zugang zu Analysewerkzeugen und reproduzierbaren Auswertungsverfahren. Maier und Grüning haben zusammen mit Kollegen für ihre Studie alle bisher öffentlich verfügbaren COVID-19-Genomdaten mit Galaxy neu analysiert. Bisherigen Veröffentlichungen habe es oft an Transparenz bezüglich der Datenanalyse gefehlt, erklärt Grüning. So enthalte beispielsweise nur eine von vier bis Anfang Februar publizierten Studien zum COVID-19-Genom eindeutige Angaben zu den verwendeten Rohdaten, sagt Grüning: „Und die Analysen waren zudem nicht gut dokumentiert und nicht reproduzierbar.“ Dadurch war es nicht möglich, die jeweiligen Aussagen nachzuvollziehen oder zu überprüfen.
Innerhalb weniger Tage gelang es dem Team, auf die vorliegenden Sequenzen jeweils identische Arbeitsabläufe anzuwenden und mittels Galaxy öffentlich zugänglich zu machen. Forschern steht damit nun weltweit über ein Netzwerk von Galaxy-Servern in Europa, den USA und Australien nicht nur die Auswertung der Daten, sondern gleichzeitig auch die wissenschaftliche Infrastruktur für eigene Analysen von COVID-19-Daten zur Verfügung. Damit lassen sich in Zukunft neuveröffentlichte Daten innerhalb von Stunden neu analysieren und mit den bisherigen Daten vergleichen.
Die Forscher sind sich einig, dass es derzeit bei der Forschung zu COVID-19 an Datenaustausch mangele, so Maier. Das solle sich mit den Veröffentlichungen auf Galaxy ändern: „Eine globale Zusammenarbeit, die für die Bewältigung von Notfällen im Bereich der öffentlichen Gesundheit wie dem Ausbruch von COVID-19 notwendig ist, erfordert schließlich einen ungehinderten Zugang zu Daten, Analysewerkzeugen und zur Berechnungsinfrastruktur.“
Galaxy wurde an der US-amerikanischen Penn State University initiiert und an der Universität Freiburg im Sonderforschungsbereich „Medizinische Epigenetik“ sowie als Teil des Deutschen Netzwerks für Bioinformatik-Infrastruktur (de.NBI) weiterentwickelt. Der Europa-Server befindet sich im Rechenzentrum der Universität Freiburg und ist als Community-Projekt angelegt. Die Daten sind online frei zugänglich. Wissenschaftler, die den Server nutzen möchten, brauchen keine Kenntnisse im Programmieren: Alle Einstellungen lassen sich über eine grafisch aufbereitete Oberfläche vornehmen. Federführend in der Weiterentwicklung von Galaxy ist das Team der Albert-Ludwigs-Universität um Grüning aus der Arbeitsgruppe von Prof. Dr. Rolf Backofen am Institut für Informatik.
Originalveröffentlichung
Meistgelesene News
Weitere News aus dem Ressort Wissenschaft
Holen Sie sich die Life-Science-Branche in Ihren Posteingang
Ab sofort nichts mehr verpassen: Unser Newsletter für Biotechnologie, Pharma und Life Sciences bringt Sie jeden Dienstag und Donnerstag auf den neuesten Stand. Aktuelle Branchen-News, Produkt-Highlights und Innovationen - kompakt und verständlich in Ihrem Posteingang. Von uns recherchiert, damit Sie es nicht tun müssen.