SARS-CoV-2 und die Laborursprungshypothese

Zur Zeit kochen einmal wieder die Behauptungen hoch, dass jemand gezeigt habe, dass das Pandemie-verursachende Virus SARS-CoV-2 aus einem chinesischen Labor stamme. Da solche Behauptungen immer wieder aufkommen, möchte ich mit Euch nicht nur im Detail auf ein bestimmtes Preprint eingehen, sondern die Sache etwas allgemeiner betrachten. Und ja, das wird keine ganz einfache Reise, denn wir werden uns mit einer ganzen Reihe von Konzepten befassen- und auch, da ich den Text recht zügig zusammengeschrieben habe.

Zuerst schauen wir uns noch einmal grundsätzlich an, woher SARS-COV-2 stammen könnte. Große Einigkeit besteht darin, dass der Vorfahr von SARS-COV-2 ein Fledermausvirus war, es ist damit also eine Krankheit tierischen Ursprungs oder im Fachjargon Zoonose. Und Zoonosen sind nichts ungewöhnliches (https://zoonosen.net/zoonosenforschung/was-sind-zoonosen). Uneinigkeit besteht darin, auf welchem Weg aus diesem Virus ein Pandemieerreger entstand. Schauen wir uns dazu erst einmal die „natürlichen“ Wege zu einem Pandemievirus an:

Im den allereinfachsten Szenarien evolvierte das ursprüngliche Fledermausvirus durch Mutation und Selektion in der Fledermaus zum Pandemievirus und sprang dann auf einen menschlichen Wirt über oder ein Vorläufer sprang auf einen Menschen über und evolvierte dort zum Pandemievirus. Wahrscheinlicher fanden evolutionäre Schritte aber in Fledermaus und Mensch statt und zwischen Fledermaus und Mensch könnte ein tierischer Zwischenwirt gestanden haben, in dem wiederum Virusevolution stattfand. Möglich sind natürlich auch noch längere Ketten, darunter auch komplexe, z.B. Fledermaus->Mensch->tierischer Zwischenwirt->Mensch und genauso ist die Beteiligung mehrerer Vorgängerviren möglich, die durch Rekombination Teile ihres Genoms ausgetauscht haben. Wir können dann zu sehr komplizierten Stammbäumen kommen, bei denen die Vorläuferviren schwierig aufzufinden sein können, auch da sowohl diese als auch die Wirtstierpopulationen inzwischen ausgestorben sein können. Ein Beispiel für einen komplexen Ursprung eines pandemischen Virus, dessen genaue Evolution wir nie nachvollziehen könnten, wäre das folgende, das frei konstruiert, aber grundsätzlich plausibel ist:

Ein immungeschwächter Mensch (1) infiziert sich bei einer Fledermaus mit Virus A, das in diesem Zeit hat, sich evolutiv an einen menschlichen Wirt anzupassen. Er gibt dieses Virus im Rahmen einer Reise auf einem Markt an ein Frettchen weiter, das bereits ein Virus B trägt, das unter unhygienischen Umständen auf einem Tiertransport von einer Fledermaus kam. Im Frettchen rekombinieren Virus A und B zu Virus C, welches einen Händler (2) ansteckt und von diesem an mehrere Personen weitergegeben wird. In einer dieser Personen erreicht das Virus endlich sein pandemisches Potential. Sind inzwischen die Personen 1 und 2 ausgeheilt und das Frettchen tot, dann wäre nur noch mit Glück Virus A im ursprünglichen Fledermausbestand auffindbar, dessen Ort aber nicht mit dem Ausbruch der Pandemie übereinstimmt.

Schon bei einem natürlichen Ursprung gibt es also sehr viele Szenarien, von denen viel nie bis ins Detail aufgeklärt werden können. Nimmt man jetzt menschliche Eingriffe dazu, dann sind hier erst mal Kultivierungen und Evolution im Labor denkbar, die im Resultat nicht von natürlichen Wegen unterscheidbar sind. Dazu kommen Übertragungen zwischen Arten, die in der Natur unmöglich oder zumindest extrem unwahrscheinlich wären (z.B. asiatischer Mungo zu afrikanischem Schimpansen), wobei diese auch auf Wildtiermärkten oder in Zoos auftreten könnten. Letzendlich wären im Labor auch direkte Genom-Manipulationen möglich, die natürlich nicht oder nur extrem unwahrscheinlichauftreten würden, zum Beispiel der Austausch ganzer Gene. Allerdings gilt es auch hier zu beachten, dass die Rekombination zwischen verwandten Viren und sehr selten auch über Artgrenzen hinaus auch natürlich vorkommt. Auffällige mögliche Hinweise für eine menschengemachte Veränderung wäre das Auftreten bekannter synthetischer Sequenzen oder wenn ein Austausch genau an biotechnologisch genutzten Sequenzstellen auftreten würde, also wenn z.B. die Sequenz direkt an einer Restriktionsenzymschnittstelle (siehe https://de.wikipedia.org/wiki/Restriktionsenzym) von fast 100%iger Übereinstimmung mit einem Virus zu einer ähnlichen Übereinstimmung mit einem anderen Virus überginge. Andere Eingriffe, wie Genomeditierung (z.B. CRISPR/Cas), aber auch der Einsatz bestimmter Restriktionsenzyme, die nicht direkt an ihren Erkennungssequenzen schneiden (z.B. das beim Golden Gate Cloning eingesetzte Enzym BsaI) würden keine oder zumindest kaum auffällige Merkmale erzeugen.

Viele Laborursprungshypothesen könnten also auf reiner Sequenzebene weder bewiesen noch widerlegt werden. Hier wären nur andere Hinweise hilfreich, insbesondere Epidemiologie und Kriminalistik. Ein versehentlich freigesetztes Laborvirus könnte ein anderes epidemiologisches Muster aufweisen als ein natürlicher Ausbruch, wenn z.B. zuerst Labormitarbeitende infiziert werden. Da aber auch diese Märkte besuchen, asymptomatische Infektionen haben können und ebenfalls denkbar ist, dass aus dem Labor noch gar nicht das pandemische SARS-COV-2 stammt, sondern ein Vorläufer, der dann in Menschen und evtl. tierischen Zwischenwirten weiter evolvierte, kann auch bei einem Laborursprung die Epidemiologie nicht eindeutig von einem natürlichen Ausbruch unterscheidbar sein. Bei einer bewussten Freisetzung wäre das noch komplizierter, denn dann könnte ja bewusst versucht worden sein, ein natürliches Ausbruchsgeschehen nachzuahmen.

So grob auffällige molekulare oder epidemiologische Muster, dass wir auf deren Basis mit Sicherheit von einem Laborursprung und/oder einer bewussten Freisetzung ausgehen können, weisen SARS-COV-2 und die Covid-19-Pandemie definitiv nicht auf und das behaupten auch die Proponenten eines Laborursprungs nicht – zumindest nicht die, mit deren Argumenten eine Auseinandersetzung überhaupt lohnt. Eine „Beweisführung“ muss also auf statistischen Überlegungen beruhen, sprich, man muss Hinweise sammeln, die erdrückend für einen Laborurpsrung bzw. gegen einen natürlichen Ursprung sprechen. Hier kommen wir aber zu einer ganzen Reihe weiterer Probleme:

Das größte Problem hierbei ist die falsche Dichotomie, insbesondere in Verbindung mit post hoc-Wahrscheinlichkeitsabschätzungen. Was heisst das? Erst einmal zur falschen Dichotomie: Das ist die irrige Annahme, dass es nur zwei Möglichkeiten gibt und man bei der Abschätzung der Wahrscheinlichkeit der einen die der anderen direkt schließen kann. Das scheint hier auf den ersten Blick kein Problem zu sein, denn es gibt ja nur zwei Möglichkeiten: Laborurprung oder natürlicher Ursprung. Das Problem entsteht aber bei der konkreten Überprüfung von Hypothesen, denn hier ist es ja nahezu unmöglich, alle möglichen Wege zu SARS-COV-2 gleichzeitig zu überprüfen. Testet man aber nur bestimmte Hypothesen, dann ist ein Rückschluss auf die Gesamtwahrscheinlichkeit der Laborhypothese nicht möglich. Zum Beispiel könnte man die Wahrscheinlichkeit für das oben beschriebene Szenario mit Virus A,B,C berechnen. Läge das bei 1-zu-einer-Milliarde, dann wäre aber eben nicht die Wahrscheinlichkeit für einen Laborurprung 999.999.999-zu-einer-Milliarde, sondern in dieser Wahrscheinlichkeit lägen alle anderen natürlichen und alle Laborursprünge, insbesondere auch alle, die man bisher komplett übersehen hat. Selbst wenn man also alle möglichen Wege, die einem einfallen abschätzt, kommt man nicht unbedingt bei einem verlässlichen Ergebnis heraus.

Noch schlimmer wird das Problem durch die oben erwähnte post hoc-Wahrscheinlichkeitsabschätzung, also eine Berechnung von Wahrscheinlichkeiten nach dem Eintreten eines Ergebnisses. Wie wahrscheinlich ist das Auftreten von SARS-COV-2? Im Jahr 2019 mag das bei 1-zu-einer-Milliarde gelegen haben, heute liegt es bei 100%, denn es ist eingetreten. SARS-COV-2 ist aber nur eines von einer Unzahl an möglichen Pandemie-verursachenden Viren. Für eine Abschätzung, ob es aus der Natur oder dem Labor stammt, ist also nicht die Wahrscheinlichkeit einer natürlichen Entstehung genau dieses Virus, sondern irgendeines Pandemie-verursachenden Virus in der Natur entscheidend und dies im Vergleich zur Erzeugung eines solchen im Labor.

Zum Vergleich: Wenn ich zufällig auf meiner Tastatur 10 Tasten drücke, kommt so etwas wie „fapmneuncn“ heraus. Bei 26 Buchstaben liegt die Wahrscheinlichkeit zufällig diese Kombination zu erhalten bei 1 zu 26 hoch 10, das ist etwa 1 zu 141.167 Milliarden! Beweist das, das ich geschummelt habe? Nein, natürlich nicht! Hätte ich die Kombination vorhergesagt oder würde sie mehrmals hintereinander auftauchen, könnte man Zufall praktisch ausschließen, beim einmaligen Auftreten aber nicht. Und da alle Kombinationen bei rein zufälliger Erzeugung gleich wahrscheinlich sind, wären auch auffällige Muster kein Beweis für Betrug: „fapmneuncn“ ist genauso wahrscheinlich wie „nnnnnnnnnn“ oder „bissigesmn“. Trotzdem sind solche Muster ein Hinweis auf einen nicht-zufälligen menschlichen Eingriff, denn Menschen erzeugen eben häufiger Muster mit Bedeutung und während ersteres Muster damit ein allgemeiner Hinweis auf einen menschlichen Urheber wäre, wäre zweiteres sogar ein spezifischerer Hinweis auf mich. In RNA und DNA wird die Sache dadurch komplizierter, dass es nur 4 verschiedene Buchstaben gibt - und dadurch werden für uns auffällige Muster wahrscheinlicher und häufiger - bei weniger "Auswahl" hat man mehr "Treffer"!

Muster mit für Menschen wichtiger Bedeutung könnten also tatsächlich auch in der Sequenz von SARS-COV-2 ein Hinweis auf menschliche Manipulation sein. Wir laufen hier aber in zwei weitere große Probleme: Zum einen sind wir Menschen sehr schlecht darin, zufällige Muster als solche zu erkennen. Das geht soweit, dass von Menschen erstellte Zahlenreihen, die als zufällig erscheinen sollen, oft dadurch auffallen, dass doppelt oder dreifach hintereinander auftretende Ziffern viel seltener auftreten, als zu erwarten wäre. Wir sind so gut darin, Muster zu erkennen, dass wir auch auf zufällig auftretende Muster reagieren und zum Beispiel in Computerspielen Zufallszahlengeneratoren teilweise so manipuliert sind, dass sie solche Muster gezielt vermeiden – das weniger zufällige Resultat überzeugt und also eher als ein echtes zufälliges! Wenn wir also irgendein Muster im Genom von SARS-COV-2 finden, heißt das erst mal nichts. In der Sequenz des Spikeproteins (https://www.ncbi.nlm.nih.gov/protein/YP_009724390.1) taucht zum Beispiel das Wort „Pferd“ auf:

Sequenz des Spikeproteins von SARS-CoV-2

Wäre SARS-COV-2 von Pferden auf Menschen übergegangen, wäre das ein erstaunlicher Zufall, aber dass in 1273 Zeichen irgendein 5-Buchstaben-Wort auftaucht, ist zu erwarten. Im menschlichen Phosphofructokinase-Protein (https://www.ncbi.nlm.nih.gov/protein/NP_000280.1) stehen zum Beispiel die Wörter „Gift“ und „Malle“ und als Beweis in einem Fall, bei dem ein Tourist ermordet wurde, wäre das trotzdem wertlos - auch wenn die Sequenz aus dem vermuteten Täter stammt!

Sequenz der menschlichen Phosphofructokinase

Wir sehen also, die Hürde, hier einen „Beweis“ zu führen, ist sehr hoch und je uneindeutiger die Hinweise sind, desto weniger stichhaltig sprechen sie für eine Laborurprungshypothese. Dazu kommt noch, dass in der freien Natur Viren in enormen Zahlen vorhanden sind und mutieren. Wenn jeden Tag Milliarden Viren in hunderten Tierarten entstehen, dann ist 1-zu-einer-Milliarde auf Dauer auch gar nicht mehr so eine geringe Wahrscheinlichkeit. Und bei der Zahl der sich „selbst manipulierenden“ natürlichen Viren schlägt die Natur die Labore allemal. Wäre die Wahrscheinlichkeit der Entstehung eines ganz bestimmten Pandemie-verursachenden Virus bei einer Milliarde natürlicher Übertragungen jeweils 1-zu-eine-Milliarde und bei 100 Laborversuchen jeweils 1:1000, dann wäre immernoch die Wahrscheinlichkeit einer natürlichen Entstehung höher, obwohl das Labor 1000-mal effizienter wäre!

Es gibt aber sogar noch ein weiteres, richtig großes Problem: Sequenzen entstehen gar nicht zufällig, zumindest nicht rein zufällig – sie sind das Produkt von Evolution und in diese spielen zufällige Mechanismen hinein (Mutation) und gerichtete (Selektion), sowie solche, die beides sind (Rekombination findet vor allem dort statt, wo sich Genome stark ähneln und überträgt eine definierte Sequenz, aber ob und wann sie auftritt ist zufällig!). Muster, die eine Funktion haben, die dem Virus nützt, werden also durch die Evolution gefördert und sind daher nicht unbedingt ein Hinweis auf eine Manipulation!

Die Evolution bringt aber noch ein weiteres riesiges Problem in unsere Betrachtungen: Da weniger fitte Varianten durch die Selektion wieder verschwinden und Konkurrenz und damit Selektionsdruck dank sehr vieler gleichzeitig aktiver Viren in einem infizierten Organismus sehr hoch sind, „sehen“ wir einen Großteil der Varianten nie, was dazu führen kann, dass wir die wirkliche Frequenz, mit der Mutationen auftreten unterschätzen können. Und da helfen uns nichtmal Laborversuche in Zellkultur weiter, bei denen wir in jeder Generation sequenzieren könnten, denn weder muss hier die Mutationsfrequenz die gleiche wie in einem Organismus sein, noch kennen wir damit die Gesamtvirenmenge, die während eines Krankheitsverlaufs entsteht.

Nehmen wir all das oben gesagte zusammen, dann stellen wir fest, dass es zwar nicht unmöglich ist, Hinweise auf einen Laborurprung zu sammeln, dass aber viele mögliche Wege insbesondere rein aus der Sequenz nicht nachweisbar sind und dass fast alle Wahrscheinlichkeitsbetrachtungen nur grobe Abschätzungen sein können. Und hier fließen dann eben die Annahmen der Abschätzenden stark hinein. Und mit jeder zusätzlichen, nicht begründeten Annahme wird das ganze wackeliger.

Schauen wir uns ein Beispiel an: Die Behauptung, man könne an der Sequenz von SARS-COV-2 erkennen, dass hier zwei Viren zusammengebaut wurden, denn während der größte Teil des Spike-Proteins dem eines Fledermausvirus gleicht, ist die Furin-Cleavage-Site mit der anderer Viren identisch und vor und nach der Furin-Cleavage-Site liegen Restiktionsenzymschnittstellen, die auch im Labor gerne verwendet werden. Das klingt erst mal seltsam, aber hier gibt es mehrere Probleme: Zum einen sind Vergleiche zwischen Organismen auf Proteinebene für Verwandtschaftsanalysen (und eine solche ist die Frage nach der Herkunft ja) immer weniger aussagekräftig als solche auf Nukleinsäureebene – warum? Weil Proteine direkt eine Funktion haben und so von der Selektion und weniger vom Zufall geformt werden! Eine Furin-Cleavage-Site hat aber einen großen Selektionsvorteil, wird also von der Evolution gefördert (Ein ausführlicher Twitterthread dazu, warum die Furin-Cleavage-Site kein Hinweis auf eine Manipulation ist: https://twitter.com/K_G_Andersen/status/1391507230848032772).

Schaut man auf die Nukleinsäureebene, dann können hier zusätzliche zufällige Mutationen auftreten, da nicht jeder Austausch hier eine Änderung im Protein bewirkt (https://de.wikipedia.org/wiki/Stille_Mutation) und wenn hier eben nicht mehr ein auffälliger Sprung von der Ähnlichkeit zu einem Virus zu einem anderen zu finden ist, bricht obiges Argument zusammen. Man kann natürlich versuchen, das mit Zusatzannahmen zu retten (z.B. dass das Virus danach weiter verändert wurde oder evolviert ist, jemand seine Spuren verwischen wollte etc.), aber diese Zusatzannahmen müsste man dann eben zusätzlich belegen!

So, das war jetzt eine Menge, mir brummt der Kopf, aber mit dem Geschriebenen, solltet Ihr jetzt die Kritikpunkte Anderer an den aktuellen Laborhypothesen-Preprints besser nachvollziehen können. Einen guten Sammelthread dazu gibt es auf Twitter hier: https://twitter.com/flodebarre/status/1583731928015831040. Insbesondere interessant sind hierbei die Threads von K.G.Anderson und A. Crits-Christoph, die zeigt, dass die behaupteten auffälligen Muster gar nicht mehr so auffällig sind, wenn man die Auswahl der betrachteten Viren erweitert (https://twitter.com/K_G_Andersen/status/1583252858740219906, https://twitter.com/acritschristoph/status/1583486403416969216), der Hinweis von Cornelius Römer, dass die behaupteten Muster eben nur eines von unzähligen möglichen sind (https://twitter.com/CorneliusRoemer/status/1583415684029067264) und der von Friedemann Weber (https://twitter.com/Friedemann1/status/1583519970902048768), der zeigt, dass das Muster nicht einmal eines ist, das bei einer kompetenten Virusbastelei zu erwarten wäre.

Ach ja, und im Preprint wird eben nur eine Hypothese, die aber nur mit einer Reihe von nicht-bewiesenen Zusatzannahmen funktioniert untersucht und mit der Abschätzung, wie unwahrscheinlich dies auf natürlichem Wege sei, die Laborentstehung als wahrscheinliche Alternative gestützt. Das ist in meinen Augen der größte Fehler, insbesondere da es inzwischen sehr viel Literatur darüber gibt, wie SARS-COV-2 natürlich entstanden sein könnte!

Ganz zum Schluss noch: Was motiviert die Laborhypothesen eigentlich? Da ist einmal die legitime Sorge um Biosicherheit und dass manche Forschende an SARS-COV-2 zeigen wollen, dass wir hier bei Laborausstattung aber auch ethischen Richtlinien mehr tun müssen. Da stimme ich vollkommen zu, aber dafür ist der Ursprung von SARS-COV-2 eigentlich irrelevant. Man könnte noch argumentieren, dass es sinnvoll sein kann, am Beispiel von SARS-COV-2 aufzuzeigen, wie eine Pandemie im Labor entstehen könnte, aber dazu muss man nicht behaupten, dass das passiert ist. Insgesamt lenkt die Laborhypothese meines Erachtens von einer sinnvollen Diskussion um Biosicherheit eher ab, da sie andere Risikoen, insbesondere die Entsteheung von Zoonosen durch Tierhaltung, ausblendet und auch, da eine Laborhypothese, die viele Annahmen beinhaltet, die oft auch auf Inkompetenz und mangelnde Regulierung in China aufbauen, auch ein falsches Gefühl von Sicherheit in anderen Bereichen erzeugt („Bei uns kann das nicht passieren!“)

Daneben gibt es natürlich auch klassische Verschwörungstheoretiker, die entweder die Sehnsucht nach einer menschengemachten Erklärung treibt oder der Wunsch nach Wiedergutmachung durch identifizierte Schuldige – wobei letzteres wieder in den Bereich der Seriosität reicht, denn, WENN es zu einem solchen Unfall gekommen sein sollte, wären Konsequenzen auch als Abschreckung zukünftiger Fälle sinnvoll. Man könnte sogar argumentieren, dass China bestrafen selbst dann prophylaktisch sinnvoll sein könnte, wenn SARS-COV-2 natürlich entstanden ist und wäre dann bei einem radikalen Biosicherheitsansatz. Allerdings lenkt auch diese „Schuldsuche“ wieder von den echten Versäumnissen im Zusammenhang mit SARS-COV-2 ab (https://twitter.com/BMauschen/status/1513277041436774412), so dass wir im schlimmsten Fall die weniger relevanten Sicherheitslücken zu schließen versuchen.

Abschließend: Nicht alle Laborhypothesen sind völlig unseriös und die Motive der Menschen dahinter teilweise absolut redlich. Die Diskussionen darum sind leider oft völlig vergiftet, auch da radikale Verschwörungstheoretiker diese gerne wenig konstruktiv befeuern. Deshalb, weil sie von anderen, wichtigeren Fragen ablenken und weil eine 100%ige Sicherheit über das, was geschehen ist, höchstwahrscheinlich nie erreicht werden kann, sehe ich persönlich derzeit keinen Sinn, hierein noch viel mehr Energie zu stecken. Aber das kann sich ändern, wenn jemand etwas wirklich spannendes findet!

Mäuschen Out

Coronapandemie Corona Coronavirus

SARS-CoV-2 und die Laborursprungshypothese - Ist was dran?

Werde teil der Community!

Was zu sagen?