Ein schwieriges Unterfangen: die phylogenetische Analyse von SARS-CoV-2-Daten

13.08.2020

Computerwissenschaftler/-innen am HITS und KIT untersuchen die Probleme phylogenetischer Methoden bei der Analyse der Evolution des Coronavirus: viele Sequenzen, wenige Mutationen.

Tagtäglich werden zahlreiche wissenschaftliche Arbeiten zu verschiedenen Aspekten der Datenanalyse bei SARS-CoV-2 veröffentlicht, einschließlich eines laufend aktualisierten Stammbaumes. In einer als Preprint erhältlichen Studie analysierten Wissenschaftler/-innen der Forschungsgruppe Computational Molecular Evolution group (CME) am Heidelberger Institut für Theoretische Studien (HITS) und dem Institut für Theoretische Informatik am Karlsruher Institut für Technologie (KIT) nun alle Anfang Mai verfügbaren Virus-Sequenzen. Dabei stellten sie fest, dass es schwierig war, auf der Grundlage dieser Daten einen verlässlichen Stammbaum zu berechnen. Dies liegt vor allem an der großen Zahl von Sequenzen, die mit einer geringen Anzahl von Mutationen einhergeht. „Die Daten enthalten ein extrem schwaches Signal”, so CME-Gruppenleiter Alexandros Stamatakis.

Die Forscher/-innen fanden heraus, dass es nicht möglich war, die Wurzel des Stammbaumes verlässlich zu bestimmen – weder durch Hinzufügen von Fledermaus- und Schuppentier-Sequenzen zum Stammbaum noch durch die Anwendung neuester computergestützter Methoden auf den Stammbaum des Virus beim Menschen. Auch eine automatische Klassifikation der Sequenzen war nicht möglich, da die Sequenzen zu eng verwandt waren.

Die Wissenschaftler/-innen kommen zu dem Schluss, dass Stammbaumanalysen von SARS-CoV-2-Daten mit großer Vorsicht zu bewerten sind. „Man sollte keinesfalls Rückschlüsse aus nur einem einzelnen Baum ziehen”, so Alexandros Stamatakis.

Die Studie wurde am 15. Dezember 2020 in „Molecular Biology and Evolution“ veröffentlicht.

Phylogenetic analysis of SARS-CoV-2 data is difficult. Benoit Morel, Pierre Barbera, Lucas Czech, Ben Bettisworth, Lukas Hübner, Sarah Lutteropp, Dora Serdari, Evangelia-Georgia Kostaki, Ioannis Mamais, Alexey M Kozlov, Pavlos Pavlidis, Dimitrios Paraskevis, Alexandros Stamatakis: https://academic.oup.com/mbe/advance-article/doi/10.1093/molbev/msaa314/6030946

Über das HITS

Das HITS (Heidelberger Institut für Theoretische Studien) wurde 2010 von dem Physiker und SAP-Mitbegründer Klaus Tschira (1940-2015) und der Klaus Tschira Stiftung als privates, gemeinnütziges Forschungsinstitut gegründet. Es betreibt Grundlagenforschung in den Naturwissenschaften, der Mathematik und der Informatik. Zu den Hauptforschungsrichtungen zählen komplexe Simulationen auf verschiedenen Skalen, Datenwissenschaft und -analyse sowie die Entwicklung rechnergestützter Tools für die Forschung. Die Anwendungsfelder reichen von der Molekularbiologie bis zur Astrophysik. Ein wesentliches Merkmal des Instituts ist die Interdisziplinarität, die in zahlreichen gruppen- und disziplinübergreifenden Projekten umgesetzt wird. Die Grundfinanzierung des HITS wird von der Klaus Tschira Stiftung bereitgestellt.

Zur englischen Seite wechseln oder auf dieser Seite bleiben.