Kölner Labor kritisiert Nature Artikel from Donald A. Berry (Nature Article, Donald A. Berry - criticism)

Die Stellungnahme wird hier veröffentlicht, da Nature es bisher nicht für nötig gefunden hat, diesen wichtigen Kritikbeitrag zu publizieren. Der Grund wird schlicht mit dem Hinweis, man hätte schon einige Beiträge akzeptiert, und es wäre kein Platz im Journal mehr vorgesehen.
Die Inhalte unsere Briefe sind (siehe unten.) im Detail in deutscher Sprache dargestellt.

The Letter (1st Letter to the Editor) has been prepared to explain the inappropriate and erroneous assumptions D.A. Berry has provided in his commentary. Up to now this Letter has not been accepted by Nature! "Due to limited space" so far the simple argumentation of the prestigious Journal. Our response concerning the rejection of our Letter see attached 2nd Letter to the Editor.

In einem kürzlich von dem texanischen Biostatistiker Donald A. Berry verfassten Kommentar wurde die Gemeinschaft der Dopinganalytiker beschuldigt, grundsätzlich fehlerhafte Methoden zu verwenden. Dieser Kommentar wurde in "Nature" - einem der weltweit führenden wissenschaftlichen Organe - veröffentlicht [1]. In der gleichen Ausgabe der Zeitschrift wurde ein Editorial publiziert, in dem die Auffassung von Berry übernommen und unterstützt wurde [2].

Die Vorwürfe basieren auf mathematisch-statistischen Überlegungen bezüglich der Sensitivität ("Richtigpositiv-Rate") und Spezifität ("Richtignegativ-Rate") des Testverfahrens für synthetische Steroidhormone. Um seine Argumentation zu belegen, wurden von Berry Ergebnisse aus dem Fall Floyd Landis herangezogen. Landis wurde vom CAS ("Court Of Arbitration For Sport", oberste Sportgerichtsbarkeit) der Verwendung synthetischen Testosterons für schuldig befunden. Der CAS bestätigte damit eine zweijährige Sperre, die von der Vorinstanz verhängt worden war. Beide Sprüche basieren auf den Isotopenverhältnissen (13C/12C) der bei Landis untersuchten Steroide. Diese waren für natürliche Hormone völlig untypisch.

Berry behauptet jedoch, dass die Beobachtung untypischer Isotopenverhältnisse nicht ausreichend sei, um den Schuldspruch zu rechtfertigen. Aufgrund des "Fehlschluss des Staatsanwalts" ("Procecutor's Fallacy", Fachbegriff aus der forensischen Wissenschaft) verbiete sich die Schlussfolgerung, Landis habe mit Testosteron gedopt. Um diesen Fehlschluss zu vermeiden, müsste, bevor die 13C/12C -Messung überhaupt angewendet werde, von vorneherein eine hohe Schuldwahrscheinlichkeit vorliegen. Diese Vorbedingung sei im Falle Landis jedoch nicht gegeben.

Die Gefahr des "Fehlschlusses des Staatsanwalts" existiert in der Tat und muss grundsätzlich berücksichtigt werden. Wir sind jedoch der Auffassung, dass Berrys Schlussfolgerungen auf falschen Annahmen beruhen und dass er über die eigentliche Logik der verwendeten Verfahren und die Details der Prozedur nur unzureichend informiert ist.

In seinem Kommentar ignoriert Berry die Tatsache, dass stets eine Screening-Methode und eine Bestätigungs-Methode angewandt werden. Die Isotopenverhältnis-Messung mittels IRMS ("Isotope Ratio Mass Spectrometry") dient stets zur Bestätigung. Voraussetzung für ihre Anwendung ist immer die Beobachtung außergewöhnlicher Werte im sogenannten Steroidprofil. Typischer Weise ist dies der Quotient aus der Testosteron- und Epitestosteron-Konzentration ("TE-Quotient"). Insofern ist Berrys Forderung nach einer hohen a priori-Wahrscheinlichkeit für ein Dopingvergehen Bestandteil der Methode.

Es ist zutreffend, dass die TE-Messungen in der ersten Instanz aufgrund formaler Fehler verworfen, und nicht als Grundlage für den Schuldspruch verwendet wurden. Jedoch stellen diese Messungen grundsätzlich nur einen Anfangsverdacht dar. Ein einzelnes "positives" TE-Resultat wird als "untypisch", nicht aber als "positiv" gewertet. Wichtig ist in diesem Zusammenhang nur, dass die Proben (unabhängig von möglichen Ungenauigkeiten bei der TE-Messung) nicht willkürlich oder zufällig ausgewählt wurden. Dies würde in der Tat dem oben genannten Fehlschluss Vorschub leisten.

Landis wurde während der Tour de France 2006 acht mal zunächst auf den TE-Quotient getestet. Berry beruft sich bei seiner Kritik auf die bekannten Probleme mit mehrfachen Tests. Im Grunde steigt bei Mehrfachtests tatsächlich die Wahrscheinlichkeit für ein falsch positives Resultat. Dieses Argument ignoriert jedoch, dass der TE-Quotient individuell sehr stabil ist, d.h. dass die mehrfachen Messungen statistisch nicht von einander unabhängig sind. In völligem Gegensatz zu Berrys Auffassung, macht die Tatsache, dass Landis mehrfach unauffällig war, der TE-Quotient jedoch nach der fraglichen 17. Etappe deutlich jenseits des Grenzwertes lag, die Anwendung von synthetischem Testosteron bereits sehr wahrscheinlich.

Die meisten Steroid-Biochemiker würden einen starken Anstieg des TE-Quotienten im Sinne einer Testosteron-Zufuhr interpretieren. Allerdings ist es unzweifelhaft richtig, dass bessere Verfahren entwickelt werden müssen, um derartige Längsschnittdaten zuverlässig interpretieren zu können. Zwischenzeitlich ist eine auf Bayes'scher Statistik beruhende Methode veröffentlicht worden [3,4]. Diese Arbeiten zeigen im Übrigen einmal mehr die individuelle Stabilität des TE-Quotienten.

Weiter behauptet Berry, die Spezifität der benutzten Verfahren seien unbekannt. Entsprechende Studien seien niemals durchgeführt oder veröffentlicht worden. Ferner müsste eine Spezifität von mindestens 99% gegeben sein, ein Wert den Berry offenbar als unerreichbar hoch einschätzt. Um die Mangelhaftigkeit der Methodik zu demonstrieren unterstellt Berry eine Spezifität von lediglich 95%, und führt dann von diesem Wert ausgehend weitere Berechnungen an. Studien, zur Spezifität der 13C/12C -Methode liegen jedoch vor [5,6]. Die Spezifität beträgt mehr als 99.9%, ist also mindestens um einen Faktor 10 besser als von Berry gefordert. Folglich dürfte maximal eine von 1000 tatsächlich negativen Proben fälschlich ein positives Resultat zeigen. Tatsächlich ist dies bei Kontrollpersonen allerdings niemals beobachtet worden.

Nachdem die Gegenwart von synthetischem Testosteron in Landis' Probe der 17. Etappe mittels IRMS bestätigt wurde, wurden die verbleibenden sieben Proben mit diesem Verfahren nachgemessen. Berry erwähnt nicht, dass vier von diesen Proben gleichfalls ein klar positives Resultat liefern [7]. Im Gegensatz zu allen denkbaren Ergebnissen, die bei fehlender Manipulation zu erwarten wären, übersteigt die Streuung der 13C/12C-Verhältnisse in Landis' Proben diejenige in einer Kontrollpopulation [5,6].

Im Übrigen vernachlässigt Berry, dass eine Bestätigungsanalyse grundsätzlich dreimal durchgeführt wird. Bei Dopingkontrollen werden stets zwei Aliquote derselben Probe untersucht. Falls die A-Probe ein "positives" Resultat liefert, wird die gesamte Prozedur umgehend wiederholt. Nur wenn sich das Ergebnis bestätigt, wird die B-Probe geöffnet und untersucht. Jedes einzelne negative Resultat führt zum Abbruch der Prozedur. Auf diese Art und Weise wird das durch mehrfache Analysen erhöhte Risiko eines falschen Befundes bewusst in Kauf genommen, allerdings zum potentiellen Nutzen des Athleten.


Literatur

[1] Berry, DA. Nature 2008;454(7205):692-3.
[2] Anonymus. Nature 2008;454(7205):667.
[3] Sottas PE, Baume N, Saudan C, Schweizer C, Kamber M, Saugy M. Biostatistics. 2007;8(2): 285-96.
[4] Sottas PE, Saudan C, Schweizer C, Baume N, Mangin P, Saugy M. Forensic Sci Int. 2008;174(2-3):166-72.
[5] Flebnker U, Günter U, Schänzer W. Steroids. 2008;73(4):408-16.
[6] Piper T, Mareck U, Geyer H, Flenker U, Thevis M, Platen P, Schänzer W. Rapid Commun Mass Spec. 2008; 22(14):2161-75.
[7] www.usantidoping.org/files/active/arbitration_rulings/Landis%20FinalHYPERLINK "http://www.usantidoping.org/files/active/arbitration_rulings/Landis Final" %20/20-09-07)%2(3).pdf. (August 2008)