In „Science“: Big Data erklärt Evolution der Vögel

12.12.2014

Stammbaum der Vögel mittels Gen-Analysen und Supercomputern nachvollzogen / Neue Erkenntnisse über Grundlagen von Gesang, Federn, Biodiversität und Entwicklung der Vögel

Rund 95 Prozent der über 10 000 bekannten Vogelarten entwickelten sich erst nach dem Aussterben der Dinosaurier vor rund 66 Millionen Jahren. Computeranalysen der genetischen Daten zeigen auch, dass sich die heutige Vielfalt explosionsartig aus wenigen Spezies bereits nach 15 Millionen Jahren entwickelt hatte. HITS-Forscher entwarfen die Algorithmen für die umfassende Analyse der Vogel-Evolution. Für die jetzt im Fachjournal „Science“ vorgestellten Ergebnisse wurde eine Rechenleistung von 300 Prozessorjahren benötigt. (DOI 10.1126/science.1253451)

„Die Berechnung dieser Stammbäume für die Evolutionsforschung ist ohne entsprechende Algorithmen und Supercomputer nicht möglich“, erklärt Alexandros Stamatakis, Leiter der Forschungsgruppe „Scientific Computing“ am Heidelberger Institut für Theoretische Studien (HITS) und Professor für High Performance Computing in den Lebenswissenschaften am Karlsruher Institut für Technologie (KIT). „Moderne Sequenzanalysen liefern heutzutage umfangreiche Gendaten über zahlreiche Spezies. Aber mit der Aufgabe, auch evolutionäres Wissen aus diesen riesigen und komplexen Datenmengen zu erzeugen, waren Computerprogramme bislang selbst auf Supercomputern überfordert.“

Obwohl Supercomputer mittlerweile Tausende Prozessoren besitzen, war die Software für Stammbaumanalysen auf etwa 500 Prozessoren beschränkt. „Wir mussten daher das Kommunikationsschema zwischen den Programmteilen auf verschiedenen Prozessoren überdenken und neu entwickeln,“ so Stamatakis. Der neue Ansatz beschleunigte die Software um den Faktor 3 und ermöglicht es gleichzeitig, die Rechnungen auf 4000 Prozessoren effizient zu verteilen. Informatiker sprechen hier von der Parallelisierung von Algorithmen. „Statt 24 Monate warten wir nun also nur 1 Monat auf die Ergebnisse.“

Die Berechnung von Stammbäumen gehört zu einer extrem rechen-intensiven Klasse von mathematischen Problemen (NP-Hard genannt). „Schon bei 50 Spezies gibt es mehr als 10 hoch 76 mögliche Stammbäume, aus denen der Richtige gefunden werden muss“, erklärt André J. Aberer, HITS-Mitarbeiter und Doktorand am KIT, der die Computeranalysen durchgeführt hat. „Zum Vergleich: Im Universum gibt es etwa 10 hoch 78 Atome.“ Die Algorithmen filtern zunächst grob die unwahrscheinlichen Evolutionsszenarien heraus. Unter den verbliebenen wird dann anhand der Daten von jeweils 14 000 Genen von 48 repräsentativen Vogelspezies der evolutionäre Stammbaum berechnet, der die Daten plausibel erklärt. Die neue parallele Software wurde am Höchstleistungsrechner „SuperMUC“ des Leibniz-Rechenzentrums der Bayerischen Akademie der Wissenschaften und an zwei US-Rechenzentren ausgeführt. Die aufgewandte Rechenleistung entspricht einer Rechenzeit von 300 Jahren auf einem einzelnen Prozessor.

Für die Familie der Bienenfresser (im Bild Merops bullocki) zeigte die Studie eine enge Verwandtschaft mit Singvögeln, Papageien und Raubvögeln.  (Bild: Peter Houde)
Für die Familie der Bienenfresser (im Bild Merops bullocki) zeigte die Studie eine enge Verwandtschaft mit Singvögeln, Papageien und Raubvögeln. (Bild: Peter Houde)

„Die von uns entwickelten Methoden zur Stammbaumberechnung sind auf alle Arten von Lebewesen anwendbar“, so Stamatakis. Sie ermöglichten bereits eine umfassende Studie zum Stammbaum der Insekten mit 144 Arten, die vor kurzem im Fachmagazin „Science“ veröffentlicht wurde. Aber auch der Ursprung und die Verbreitung von Viren und Bakterien lassen sich damit nachvollziehen, um etwa Krankheitserreger besser bekämpfen zu können. Die Analyse der genetischen Verwandtschaft von australischen Giftschlangen half entscheidend, die noch fehlende Gegengifte für einige Schlangenarten zu identifizieren.

Zu den neuen Erkenntnissen über Vögel, die nun zeitgleich in insgesamt 23 wissenschaftlichen Veröffentlichungen in „Science“ und weiteren Fachjournalen publiziert werden, gehören, neben dem Stammbaum und der Evolution der Vögel:

  • Genetische Grundlagen der Biodiversität.
  • Die genetischen Grundlagen der Hirnregionen, die die Entstehung des Vogelgesangs steuern
  • Der Verlust von Zähnen bei Vögeln vor rund 100 Millionen Jahren.
  • Die Verwandtschaft von Dinosauriern und Vögeln.
  • Wie farbige Federn entstanden sind.

Die aktuelle Studie über die Entwicklung der Vögel wurde vom „Avian Phylogenomics Consortium“ durchgeführt, welches 200 Wissenschaftler an 80 Instituten in 20 Ländern umfasst. Koordinatoren waren Guojie Zhang vom BGI in China, Erich D. Jarvis von der Duke University in den USA und M. Thomas P. Gilbert vom Natural History Museum in Dänemark. Tandy Warnow von der University of Illinois und Alexandros Stamatakis waren die Koordinatoren der Computeranalysen. Alexandros Stamatakis und André J. Aberer sind die einzigen deutschen Ko-Autoren. Die Studie stellt die größte Genomanalyse einer Wirbeltierklasse dar und umfasst unter anderem Enten, Falken, Spechte und weitere Repräsentanten aller Zweige der modernen Vögel. Alle Daten und Methoden werden nun Forschern weltweit für weitere Studien kostenlos zugänglich gemacht.

Pressekontakt:
Dr. Peter Saueressig
Head of Communications
Heidelberg Institute for Theoretical Studies (HITS)
Phone: +49-6221-533245
Peter.saueressig@h-its.org
www.h-its.org
Twitter: @HITStudies

Wissenschaftlicher Kontakt:

Prof. Dr. Alexandros Stamatakis
Group Leader
Scientific Computing
HITS gGmbH
Schloss-Wolfsbrunnenweg 35
69118 Heidelberg
Telefon: +49 6221 – 533 – 240
Fax: +49 6221 – 533 – 298
Email: alexandros.stamatakis@h-its.org

Über das HITS

Das HITS (Heidelberger Institut für Theoretische Studien) wurde 2010 von dem Physiker und SAP-Mitbegründer Klaus Tschira (1940-2015) und der Klaus Tschira Stiftung als privates, gemeinnütziges Forschungsinstitut gegründet. Es betreibt Grundlagenforschung in den Naturwissenschaften, der Mathematik und der Informatik. Zu den Hauptforschungsrichtungen zählen komplexe Simulationen auf verschiedenen Skalen, Datenwissenschaft und -analyse sowie die Entwicklung rechnergestützter Tools für die Forschung. Die Anwendungsfelder reichen von der Molekularbiologie bis zur Astrophysik. Ein wesentliches Merkmal des Instituts ist die Interdisziplinarität, die in zahlreichen gruppen- und disziplinübergreifenden Projekten umgesetzt wird. Die Grundfinanzierung des HITS wird von der Klaus Tschira Stiftung bereitgestellt.

Zur englischen Seite wechseln oder auf dieser Seite bleiben.