Forschungsbericht 2021 - Max-Planck-Institut für Wissenschaftsgeschichte

Validierung in der biomedizinischen Forschung

Autoren
Keuck, Lara
Abteilungen
Max-Planck-Forschungsgruppe „Praktiken der Validierung in der biomedizinischen Forschung“
Zusammenfassung
Ob Reproduzierbarkeitskrise globaler biomedizinischer Forschung, Zuverlässigkeit von Corona-Tests in verschiedenen Settings, oder Suche nach aussagekräftigen Endpunkten für klinische Studien: Bei vielen gegenwärtigen Herausforderungen der medizinischen Forschung geht es um scheinbar universelle Fragen der Validierung. Zugleich haben technische und methodische Entwicklungen sowie veränderte Rahmenbedingungen beeinflusst, wie genau die Gültigkeit und Aussagekraft von Test- und Forschungsergebnissen bemessen und interpretiert werden sollten. Diese Kontinuitäten und diesen Wandel untersuchen wir.

Mit dem Einzug von Covid-19-Tests in das alltägliche Leben wurde deren Sensitivität und Spezifität – also die Fähigkeit dieser Tests, infizierte und nicht infizierte Personen richtig zu erkennen – zu einem vieldiskutierten Thema in Politik und Öffentlichkeit. Die aktuelle Auseinandersetzung mit der Frage, unter welchen Bedingungen die Ergebnisse eines diagnostischen Tests aussagekräftig sind, untersucht unsere Forschung vor dem Hintergrund der Geschichte der wissenschaftlichen Beurteilung von Testverfahren.

Anfang des 20. Jahrhunderts führten Serologen die Konzepte von Sensitivität und Spezifität zur Interpretation des Wassermann-Tests ein, einem Bluttest, der zur Diagnose von Syphilis verwendet wurde. Sie erfassten die Gültigkeit des Tests als Variable in Abhängigkeit von verschiedenen Stadien der Infektionskrankheit und stellten umstrittene Annahmen über die Beschaffenheit der Reaktion auf. Bis zur Mitte des 20. Jahrhunderts hatte man nicht nur die falschen Annahmen über serologische Reaktionen verworfen, sondern auch die Kontextabhängigkeit der Testbewertung. Spezifität und Sensitivität wandelten sich dadurch zu abstrakten Begriffen, die zunehmend als statistische Größen und feste Eigenschaften eines Tests verwendet wurden [1].

Genau diese Kontextunabhängigkeit wird in gegenwärtigen wissenschaftlichen Diskussionen auf den Prüfstein gestellt, wie eines unserer Projekte zur Entstehung und Entwicklung der Spezifität und Sensitivität von diagnostischen Tests im Laufe des 20. Jahrhunderts nachzeichnet. Dieses Projekt ist ein Beispiel dafür, wie die neue Max-Planck-Forschungsgruppe „Praktiken der Validierung in der biomedizinischen Forschung“ gegenwärtige Debatten und Herausforderungen für die Anwendung und Beurteilung von biomedizinischem Wissen in der Geschichte verortet. Dabei verknüpfen wir historische Untersuchungen mit philosophischen Analysen vergangener und aktueller Annahmen über evaluative Kategorien und Methoden.

Im vergangenen Jahrhundert haben sich nicht nur die Praktiken der Validierung, sondern auch die biomedizinischen Zugänge zu Gesundheit und Krankheit grundlegend gewandelt. Wir interessieren uns daher besonders für die Geschichte und Philosophie wissenschaftlicher Methoden, die der Überprüfung der Validität von Forschung über veränderliche Ziele dienen, wie zum Beispiel in der Erforschung psychischer Störungen. Eines unserer Projekte befasst sich mit der Geschichte der einflussreichen „International Pilot Study of Schizophrenia“ [2], um die Suche nach einem universellen Verständnis von Validität sowie die sich wandelnden Maßstäbe der Validierung in der Nachkriegszeit zu ergründen. Zudem haben wir die interdisziplinäre Arbeitsgruppe „Translating Validity in Psychiatric Research“ geschaffen (gemeinsam mit der Gruppe „Philosophy of Clinics in Neuroscience and Psychiatry“ an der Université Bordeaux Montaigne), die nicht nur Philosophinnen und Philosophen und Historikerinnen und Historiker, sondern auch führende Fachkundige für das Thema Validität in der Psychiatrie, der Psychologie und den Neurowissenschaften vereint. Die Zusammensetzung der Arbeitsgruppe trägt der Tatsache Rechnung, dass das Ideal der Validität in der Biomedizin ein transdisziplinäres Projekt war und ist, das die Grenzen einzelner Disziplinen überschreitet.

Im 20. Jahrhundert hielt der technische Begriff „Validität“ Einzug in viele Wissenschaften, um das Ausmaß (aber nicht zwangsläufig die Zuverlässigkeit) zu bezeichnen, in dem ein Testverfahren den (abstrakten) Gegenstand, den es zu treffen beansprucht, tatsächlich trifft. Die Psychometrie beispielsweise würde einen Intelligenztest als „valide“ bezeichnen, wenn er Auskunft über die hypothetische Eigenschaft „Intelligenz“ gibt. In diesem Zusammenhang führten Lee Cronbach und Paul Meehl in den 1950er-Jahren den Begriff der „Konstruktvalidität“ ein, um – ganz im Sinne von Karl Poppers Wissenschaftsphilosophie – Zweifel darüber signalisieren zu können, ob ein Test tatsächlich über das aussagekräftig ist, worüber er etwas aussagen soll [3]. Paul Meehl war zugleich als klinischer Psychologe tätig und Mitbegründer des Minnesota Center for Philosophy of Science in den frühen 1950er-Jahren. In mehreren Projekten sehen wir solche Bewegungen von Personen, Konzepten und Methoden als Anregung, über die Überschneidung der Perspektiven von „Akteurinnen und Akteuren“ einerseits (zum Beispiel biomedizinisch Forschende) und der „Analyse“ andererseits (zum Beispiel der Wissenschaftsphilosophie) nachzudenken, wenn wir die historische Entstehung von Validitätskonzepten untersuchen.

Durch die Betrachtung, wie Validität in den modernen medizinischen Wissenschaften theoretisiert und praktiziert wurde, versuchen wir zu verstehen, welche Herausforderungen sich bei der Bewertung der Aussagekraft biomedizinischer Studien für die jeweilige Forschungsfrage stellten. In der Arbeitsgruppe „Validation and Regulation in the Sciences of Health“ (mit Angela Creager, Princeton University) untersuchen wir, welche Auswirkungen der exponentielle Zuwachs an Forschungsgemeinschaften und die Entstehung internationaler Forschungsorganisationen und Regulierungsbehörden auf die Einführung standardisierter Validierungsverfahren hatten. Unsere Fallstudien beziehen sich auf die Umsetzung und Mobilisierung von Standards für toxikologische Tests, die Einführung von Verfahren zur Bestimmung klinischer Wirksamkeit und von evidenzbasierter Medizin sowie die Angleichung von Protokollen in standortübergreifenden Projekten.

Validität ist ein Kernanliegen der spätmodernen biomedizinischen Forschung, wie aktuelle Debatten über das Vertrauen in die Wissenschaft und die Pandemiepolitik bezeugen. Indem wir die Geschichte und Philosophie der Beurteilung von Tests und Studienergebnisse analysieren, zeigen wir, wie Validierungspraktiken zur Überwindung von Unsicherheiten sowie zur Koordinierung transnationaler Forschungsprojekte eingesetzt und damit zwar viele Probleme gelöst, zugleich jedoch neue geschaffen wurden.

Literaturhinweise

Löwy, I.
Testing for a sexually transmissible disease, 1907–1970: The history of the Wassermann reaction
In: AIDS and contemporary history, 74–92 (Ed. Berridge, V., Strong, P.). Cambridge University Press, Cambridge (1993)
Binney, N.
On the Origin of Sensitivity and Specificity
Annals of Internal Medicine 174 (3), 401–407 (2021)
WHO
Report of the International Pilot Study of Schizophrenia. Vol. 1.
World Health Organization, Geneva (1973)
Cronbach, L. J.; Meehl, P. E.
Construct Validity in Psychological Tests
Psychological Bulletin 52, 281–302 (1955)

Weitere interessante Beiträge

Zur Redakteursansicht