Hilft Homöopathie Frauen, die an PMS leiden?

Publiziert am 2. November 2013 von Norbert Aust

Kaum eine Homöopathie-Seite, auf der man nicht auch Hinweise zur homöopathischen Behandlung des Prämenstruellen Syndroms findet, kaum ein Frauen-Forum, in dem dies nicht angesprochen wird und in dem nicht zu einer homöopathischen Behandlung geraten wird. Natürlich mangelt es auch nicht an Erfolgsgeschichten, wie man endlich nach langem vergeblichen Mühen mit allen möglichen Therapierichtungen, insbesondere der ‚unfähigen Schulmedizin‘, nun endlich sein Leiden überwunden hat.

Im Verzeichnis der randomisierten klinischen Studien auf der Webseite der englischen Faculty of Homeopathy wird nur eine einzige Arbeit genannt, nämlich die einer israelischen Forschergruppe um M. Yakir aus dem Jahr 2001 [1]. Die Forscher wollen zu einem für die Homöopathie positiven Ergebnis gekommen sein. Zu den Autoren gehört immerhin G. Vithoulkas, ein sehr prominenter Homöopath, der für seine Verdienste um die Homöopathie 1996 mit dem Right Livelihood Award ausgezeichnet wurde, dem ‚Alternativen Nobelpreis‘.

Bei der angesprochenen Studie handelt es sich allerdings nur um eine Pilotstudie an einer recht kleinen Gruppe von insgesamt nur 19 Frauen, die daher nur geringe Aussagekraft hat. Die darauf folgende klinische Studie mit insgesamt 96 Frauen wurde auf einer Tagung vorgestellt und schriftlich im Tagungsband veröffentlicht, also nicht einem Peer-review unterzogen [2]. Offensichtlich ist dies auch der Grund, warum diese Studie nicht in dem genannten Verzeichnis erscheint.

Als kleine Realsatire am Rande: Der Tagungsband ist in der Universitätsbibliothek in Freiburg nicht in der Hauptsammlung vorhanden, sondern im ‚Institut für Grenzgebiete der Psychologie und Psychohygiene‘, frei übersetzt ist das das Institut für Geister- und Gespensterkunde, so eine Art Hogwarts.

Was ist PMS?

Als ‚Prämenstruelles Syndrom‘ (PMS) werden die Beschwerden bezeichnet, die viele Frauen einige Tage vor der Regelblutung regelmäßig erleben. Auch wenn eine große Zahl von Frauen unter PMS leidet – 30 % der Frauen im gebärfähigen Alter werden genannt – sind die Ursachen dafür letztendlich unklar. PMS äußert sich durch eine recht vielfältige Symptomatik, die unterschiedlich heftig und unterschiedlich lange andauern kann. Die Beschwerden können von körperlichen Problemen (Schmerzen, Wassereinlagerung) bis zu eher psychologischen Erscheinungen (Reizbarkeit, Niedergeschlagenheit) reichen und kann in extremen Fällen zu mehrtägiger Arbeitsunfähigkeit führen. PMS kann schließlich auch für Beziehungen sehr belastend sein.

Da die Ursachen nicht bekannt sind, gibt es naturgemäß auch keine ursächliche Therapie. Es ist also eigentlich nicht verwunderlich, dass die betroffenen Frauen auch alternative Therapien probieren, vorzugsweise natürlich auch die Homöopathie. Näheres zum PMS siehe diesen Artikel in der Wikipedia.

Vorgehensweise der Untersuchung

Die folgende Darstellung beschränkt sich im Wesentlichen auf die größere Studie, die in manchen Details etwas anders gehandhabt wurde als die Pilotstudie, wegen ihres größeren Umfangs jedoch die Gesamtsituation wahrscheinlich besser abbildet.

Die Teilnehmerinnen wurden für diese Studie durch Anzeigen in den Medien gewonnen sowie durch Überweisung aus der Ambulanz. Insgesamt schlossen 96 Frauen im Alter zwischen 20 und 50 Jahren die Studie ab, 43 wurden mit homöopathischen Medikamenten behandelt, 53 erhielten nicht unterscheidbare Placebos. Weder Patientinnen noch das beteiligte Forscherteam wussten, wer zu welcher Gruppe gehörte, da die Randomisierung extern erfolgte und die Medikamente nur durch einen Nummerncode gekennzeichnet waren.

Es wurden 14 verschiedene Medikamente verwendet, die viele der mit PMS verbundenen Symptome abdecken. Für jedes Medikament wurde, wie in der Vorstudie, eine Sammlung von Symptomen zusammengestellt, die im Rahmen des PMS üblicherweise auftreten. Die Frauen wurden jeweils mit dem Medikament behandelt, dessen gesammelte Symptome am ehesten auf sie zutrafen. In der Vorstudie wurden die Patientinnen, die nicht recht zu einem der Medikamente passten, nicht in die Studie aufgenommen. Wahrscheinlich war das auch hier so. Auf jeden Fall sind die Forscher davon überzeugt, dass die Frauen das für sie nach homöopathischen Gesichtspunkten richtige Medikament individuell verordnet bekamen.

Die ersten zwei Monate der Studie, genauer die ersten zwei Monatszyklen nach Studienbeginn, wurden zur Messung der Ausgangsdaten verwendet, danach erfolgte eine einmalige (!) Gabe des Medikaments beziehungsweise Placebos. Im Anschluss wurden während weiterer drei Monatszyklen die Daten gesammelt und schließlich ausgewertet.

Messverfahren

Wir werden uns in den folgenden Betrachtungen auf das Hauptergebnis der Autoren beschränken, wie sich das PMS bei den Frauen durch die homöopathische Behandlung verändert hat. Es werden noch einige sekundäre Bewertungen berichtet (Medikamenteneinnahme, Krankheitstage etc.), für die jedoch nicht genügend Angaben gemacht werden, so dass eine Analyse hier nicht sinnvoll durchführbar ist. Zum Teil stimmen die Daten im Text auch nicht mit den in einer Grafik dargestellten Werten überein.

Um das Hauptergebnis der Studie zu ermitteln, war es erforderlich, dass man die Beschwerden der Teilnehmerinnen zahlenmäßig erfasst. Bei dem recht komplexen und vielschichtigen Erscheinungsbild des PMS ist das kein einfaches Unterfangen. In der Studie wurde ein Fragebogen verwendet, dessen Grundzüge bereits im Jahr 1968 von Moos entwickelt wurden, der aber im Laufe der Zeit einige Anpassungen und Weiterentwicklungen erlebte (Moos Menstrual Distress Questionnaire – MMDQ oder nur MDQ). Für uns ist das ein kleines Problem, denn man findet zwar eine Beschreibung des originären Fragebogens von 1968 [3], für den in der Studie genau verwendeten Fragebogen konnte ich allerdings keine Informationen finden. Dies ist aber durchaus ausreichend, um das Prinzip zu erkennen, wie die Datenerfassung funktioniert.

In der Version von 1968 werden im Fragebogen insgesamt 47 Symptome aufgeführt, deren Vorhandensein bzw. Intensität die Teilnehmerinnen täglich zu bewerten hatten. Symptome waren beispielsweise Kopfschmerzen, kalte Schweißausbrüche, Niedergeschlagenheit. Die Patientinnen hatten diese auf einer Skala von null bis fünf Punkten zu bewerten. Null entsprach dabei ’nicht vorhanden‘, fünf Punkte waren zu vergeben, wenn das entsprechende Symptom akut vorhanden war oder so heftig, dass die betroffene Patientin dadurch deutlich beeinträchtigt war. Die einzelnen Symptome waren zu Kategorien zusammengefasst, die aufsummierten Punktzahlen in den einzelnen Kategorien ergaben den Messwert.

Der in der betrachteten Studie verwendete Fragebogen funktioniert ähnlich, umfasst allerdings nur 38 Symptome, die in sechs Kategorien zusammengefasst sind:

Schmerzen (Kopfschmerzen, Krämpfe, Erschöpfung etc.)
Funktion (Kontaktscheu, schlechtere Leistungen in Schule oder Beruf etc.)
Appetit (Appetitlosigkeit, Heißhunger)
Automatische Reaktionen (Schwindelgefühl, Übelkeit etc.)
Wassereinlagerung (Gewichtszunahme, Schmerzen in den Brüsten etc.)
Mentale Symptome (Weinen, Niedergeschlagenheit etc.)

Inhaltlich scheinen erhebliche Unterschiede zu dem originalen Fragebogen zu bestehen, die als Beispiele genannten Symptome dienen hier nur der Illustration, was unter den Kategorien zu verstehen ist. Natürlich sind diese Symptome nicht unabhängig voneinander, schwere Krämpfe sind z.B. sicher auch mit Schmerzen verbunden und haben auf die Dauer auch Auswirkungen auf die Psyche.

Dieser Fragebogen wurde in der Vergangenheit durchaus auch kritisiert, scheint aber dennoch das geeignetste Mittel für diesen Zweck zu sein. Eine Validierung, also eine Überprüfung der Zuverlässigkeit und Genauigkeit des Fragebogens, konnte ich nicht finden. Um die Problematik einmal zu umreißen, sei hier ein Leitartikel einer Fachzeitschrift zitiert. Dieser setzt sich zwar generell mit Hilfsmitteln zur Diagnose PMS auseinander, nicht mit der Erfassung der Intensität, die Vorbehalte gelten aber für unsere Zwecke analog:

In einem solchen Fragebogen wird eine Frau aufgefordert, 47 Symptome auf einer Sechs-Punkte-Skala zu bewerten. Der Erfolg einer solchen Selbsteinschätzung hängt von dem Eifer der Frau ab, die ihn mindestens drei Monate lang jeden Abend ausfüllen muss, auch an Feiertagen und im Urlaub. Die Ergebnisse sind nur für hochmotivierte oder sehr entschlossene Frauen aussagekräftig, denn es besteht immer das Risiko, dass sie es eines Abends vergisst und dies dann in den nächsten Tagen mit fehlerhaften Angaben nachholt. (…) Es fehlen Fragen dazu, ob die Symptome nach der Regel wieder verschwinden und zu deren Wiederauftreten in aufeinanderfolgenden Zyklen. Solche Kriterien können nicht die notwendigen Nachweise liefern, die für die Diagnose PMS so wichtig sind [4].
(Übersetzung des Verfassers)

Man möchte ergänzen, dass der Fragebogen selbst wahrscheinlich ein Übriges dazu beiträgt, die Patientin in eine negative Stimmung zu bringen, wird sie doch dauernd daran erinnert, was sie alles erlitten hat – und beim nächsten Zyklus sehr wahrscheinlich auch wieder erleiden wird.

Dies mag genügen, um zu zeigen, dass auch diesem Fragebogen eine gewisse Unschärfe innewohnt, dass auch hier mit gewissen Streuungen zu rechnen ist, die nicht notwendigerweise auch eine Änderung des Befindens bedeuten.

Wie wertet Yakir nun diesen Fragebogen aus?

Sehr genau wird das in der Arbeit nicht beschrieben. Wir erfahren, dass jeweils aus den Bewertungen der letzten 12 Tage vor der Regel ein Durchschnitt gebildet wird. Die Ausgangsbasis liefert der Durchschnitt der letzten zwei Monate vor der Behandlung. Das Ergebnis ist der Durchschnitt aus den drei Monaten, die auf die Einnahme der Medikamente folgten, wie gesagt, jeweils immer die letzten 12 Tage vor der Regelblutung.

Ergebnis:

In der Homöopathiegruppe reduzierte sich der ermittelte Kennwert von im Durchschnitt 0,44 auf 0,28 Punkte, also eine Verbesserung um 0,16 Punkte. In der Placebogruppe ergab sich hingegen eine Verbesserung von 0,42 auf 0,34 Punkte, also um nur 0,08 Punkte. Das Ganze sei auch statistisch signifikant, also: Wirksamkeit nachgewiesen.

Kennen Sie den Witz über das Grillen von Tiefkühlhähnchen? Außen völlig verbrannt, innen noch gefroren, aber, wenn man dies im Durchschnitt betrachtet, doch ganz gut gelungen?

Genau so ist das hier auch zu sehen. Die exzessive Bildung von Durchschnittswerten bügelt alles weg und macht aus der ganzen Datenerhebung einen praktisch nicht mehr zu unterscheidenden Einheitsbrei. Die folgenden Überlegungen sollen das verdeutlichen:

Jeden Tag fallen 38 Zahlenwerte an, die pro Monat an 12 Tagen erhoben werden. Das sind 456 Zahlenwerte. In den zwei Monaten vor der Behandlung werden also 912 Einzelwerte zu einer Kennzahl offenbar als Durchschnittswert verdichtet. Ein anderer Weg ist nicht vorstellbar, um bei einem solchen Fragebogen auf Zahlenwerte unterhalb des Minimalwertes einer Einzelbewertung zu kommen. Für den Zeitraum nach der Behandlung sind es sogar 1368 Einzelwerte, die da eingedampft werden.

Schon aus den Zahlenwerten, die die Autoren angeben, ist zu schließen, dass sie kaum einen Bezug zum realen Erleben der Patientinnen haben. Letztendlich liegt dieser Durchschnittswert bei weit unter 1,0 – auf einer Skala von 0,0 (‚Symptom nicht gegeben‘) bis 5,0 (’sehr starke Beschwerden‘). Also haben die Patientinnen im Mittel nur sehr leichte bis gar keine Beschwerden. Sind das alles also Hypochonderinnen, die sich ihr Leiden nur einbilden und denen tatsächlich nur das fehlt, was die männliche ‚Sachkenntnis‘ in solchen Fällen für angebracht hält? Sicher nicht.

Was kann ein Ergebnis von 0,44 Punkten aussagen? Da dieser Wert unterhalb des kleinsten Werts liegt, der bei einem Vorhandensein eines Symptoms vergeben werden kann, bedeutet dies, dass auch sehr viele Bewertungen mit null Punkten eingeflossen sind. Eigentlich folgt hieraus nur, dass die Frauen nicht an allen 12 Tagen alle 38 Symptome erlebt haben. Das sagt nichts, aber auch gar nichts darüber aus, ob sie während einer kürzeren Zeitdauer an einer kleineren Anzahl von Symptomen heftig gelitten haben.

Nehmen wir für die folgende Überlegung vereinfachend an, dass jeweils die Monate vor und nach der Behandlung gleich verlaufen sind, und ignorieren mögliche zeitliche Streuungen. Dann hat die Durchschnittspatientin in den 12 Tagen eines Monats

12 x 38 x 0,44 = 201

Punkte vergeben.

Dies könnte bedeuten, dass sie an drei Tagen 13 Symptome mit voller Punktzahl (5) bewertet hat, sagen wir aus dem Bereich Schmerzen, Wassereinlagerung und mentale Symptome. Diese Frau hätte drei Tage lang sehr stark gelitten

Im anderen Extrem könnte sie an allen zwölf Tagen bei 17 Symptomen nur jeweils einen Punkt vergeben haben. Diese Frau hätte zwar lange mit der Sache zu tun, aber über eine leichte Befindlichkeitsstörung geht ihr Problem nicht wesentlich hinaus. Man kann zwar einwenden, dass sie dann wahrscheinlich auch keinen Arzt aufgesucht hätte, dieses Argument ist aber nicht stichhaltig. Die Teilnehmerinnen wurden zumindest zu einem großen Teil per Anzeige angeworben. Daher ist es durchaus möglich, dass einige Frauen die Gelegenheit nutzen wollten, das zwar durchaus erträgliche aber doch lästige Problem endlich einmal loszuwerden. Die Intensität der Beschwerden war also nicht unbedingt der Auslöser für die Teilnahme an der Studie gewesen. Daher kann ein zwar längerer aber leichterer Verlauf bei einzelnen Patientinnen durchaus vorgelegen haben

Was sagt uns also die Bewertungszahl über den tatsächlichen Leidensdruck der Patientin?

Eben: Nichts.

Wenn schon die berichtete Punktzahl den Zustand einer Patientin nicht wiedergibt, dann sind auch die Veränderungen der Punktzahl ohne Aussagekraft. Eine kleinere Punktzahl nach der Behandlung kann auch bedeuten, dass die Patientin weniger Symptome erlebt hat, vielleicht auch nur während eines kürzeren Zeitraums, diese aber wesentlich heftiger aufgetreten sind. Dann ist es eine Frage der persönlichen Bewertung, ob tatsächlich die Verdichtung einer längerfristigen und vielleicht erträglichen Situation in eine kürzere aber viel heftigere Leidensphase eine Verbesserung darstellt.

Analoge Überlegungen für eine erhöhte Punktzahl führen dazu, dass auch eine Verbesserung der Situation eingetreten sein könnte – mehr Symptome und / oder ein längerer Zeitraum – aber im Gegensatz zu vorher in einem besser erträglichen Ausmaß.

Wie viel Sinn macht dann ein Vergleich von Frau zu Frau beziehungsweise zwischen den Gruppen aufgrund dieser irrealen Bewertungszahl?

Keinen.

Nochmal zur Verdeutlichung: Was sagt eine Veränderung von 0,44 auf 0,28 Punkte aus? Die Durchschnittspatientin hätte im ersten Fall bei ihren 13 Symptomen eine erhebliche Verbesserung erzielt. Vielleicht wären ihre Schmerzen erheblich geringer geworden (von 5 auf 3), und nur beim Unwohlsein wären die Verbesserungen nur gering gewesen (5 auf 4). Diese Frau hätte deutlich profitiert – wenn sie auch weit davon entfernt wäre, ihre Leiden überwunden zu haben.

Im anderen Fall wären in diesem hypothetischen Beispiel sechs von den 17 Symptomen verschwunden. Der Fortschritt erscheint eher marginal, insbesondere, wenn sich die Verbesserung in den Nebenkriegsschauplätzen abgespielt hätte, beim Appetit beispielsweise.

Quintessenz

Die Maus an Ergebnis, die der Berg nach seinem Kreißen gebar, ist den Aufwand nicht wert, der zur Datenerhebung getrieben werden musste. Warum hat man nicht die Möglichkeiten genutzt, die der Fragebogen ja bietet? Warum hat man nicht bei jeder Patientin beispielsweise nur die zehn am höchsten bewerteten Symptome herangezogen und verfolgt, wie diese sich in der Behandlung verändern? Oder alle Bewertungen mit 4 und 5 Punkten betrachtet oder was auch immer? Warum hat man offensichtlich die vielen Nullen, die in den Fragebögen vorhanden gewesen sein müssen, nicht herausgefiltert und damit zugelassen, dass das Ergebnis weitestgehend nivelliert wird? Es ist noch nicht einmal möglich, in den Kennwerten eine Grenze zu definieren, um ’schweres Leiden‘ und ‚leichte Befindlichkeitsstörung‘ sicher zu trennen.

Es ist nicht zu glauben, dass den Forschern entgangen ist, wie dicht die Ergebnisse beisammen liegen. Sie geben lobenswerterweise die Einzeldaten an, wenn auch in Form einer Grafik, aus der man die Werte mit nur begrenzter Genauigkeit herausmessen muss.

Man erkennt, dass über 90 % der Ausgangsdaten im Bereich zwischen 0 und 1,0 liegen, fast 70 % sogar unterhalb von 0,5, also nach der ursprünglichen Bewertungsskala irgendwo zwischen ’sehr leichten‘ und ‚gar keinen‘ Symptomen. Was soll das Ganze also? Wären bei einem die Realität besser wiedergebenden Auswerteverfahren die reklamierten positiven Ergebnisse nicht feststellbar gewesen? Das ist die einzige naheliegende Schlussfolgerung.

Wir können jedoch festhalten, dass trotz der unbedeutenden Zahlenwerte doch eine ganze Menge Leidenspotenzial hinter den Zahlen steckt, das nur durch die fast böswillig zu nennende Auswertestrategie in die Bedeutungslosigkeit verdurchschnittet wurde.

Soweit hierzu. Natürlich kann der Leser einwenden, dies seien nur theoretische Betrachtungen eines missgünstigen Zahlenakrobaten. Dann betrachten wir eben die Ergebnisse so, wie die Forscher sie berichten, vergessen das bisher Geschriebene. Wenn man doch annimmt, ein niedrigerer Zahlenwert würde eine bessere Situation der jeweiligen Patientin widerspiegeln, dann ergibt sich das folgende Bild:

Schon ein einfacher Blick auf die obige Grafik zeigt, dass es deutliche Unterschiede gibt:

Bei den 53 Patientinnen der Placebogruppe hat sich das Befinden in sieben Fällen verschlechtert, das sind rund 13 %. Bei den 43 Patientinnen, die homöopathisch behandelt wurden, waren es 11, also 25 %. Somit ist der Anteil der Frauen, deren Befinden sich durch die Behandlung verschlechtert hat, in der Homöopathiegruppe doppelt so hoch wie in der Placebogruppe. Sicher, es sind in der Placebogruppe stärkere Verschlechterungen aufgetreten, dafür gibt es dort aber auch Verbesserungen, die von vergleichsweise großen Zahlenwerten auf eine fast vollständige Genesung hindeuten, was bei der Homöopathiegruppe nicht gegeben ist.

Welche Gruppe hat jetzt besser abgeschnitten? Dazu müssen wir uns etwas mit der beschreibenden Statistik beschäftigen:

Durchschnitte haben die unangenehme Eigenschaft, von einzelnen Extremwerten stark beeinflusst zu werden. Der Durchschnittswert einer Verteilung von zehn Werten bei 5 und einem bei 50 ist 9,11. Fast alle Einzelwerte sind in diesem Beispiel kleiner als der Durchschnitt, nur einer ist größer, das aber recht erheblich. Der Durchschnitt liegt eben nicht in der Mitte der Daten, er sagt für diese extreme Verteilung folglich nichts aus. Wenn der Einzelwert nicht 50 sondern 100 betragen hätte, läge der Durchschnitt bei 13,6. Er hätte sich also deutlich verschoben – obwohl an der Verteilung eigentlich nicht allzu viel passiert ist, nur ein einziger Wert hat sich geändert.

Da diese Effekte eine Betrachtung und Bewertung erschweren, verwendet man viel besser den Median, das ist der Wert, der tatsächlich in der Mitte der Daten liegt. In diesem Beispiel der elf Werte wäre das der Wert des sechsten Elements, wenn man sie nach der Größe sortiert. Er läge also bei 5. Dieser Wert ist unabhängig davon, wie groß der elfte Wert ist, ob 50, 500 oder 5000 spielt keine Rolle. Die eine Hälfte der Werte ist kleiner oder gleich dem Median, die andere Hälfte ist größer oder gleich.

Das Herausmessen der Daten aus dem obigen Bild ergab Durchschnittswerte vor und nach der Behandlung von 0,45 und 0,29 für die Homöopathiegruppe und 0,43 und 0,34 für die Placebogruppe. Dies stimmt also recht gut mit den Zahlenangaben der Autoren überein, die gewonnen Daten haben also für unsere weiteren Betrachtungen eine hinreichende Genauigkeit. Wenn man nun die Medianwerte aus den Daten ermittelt, dann ergibt sich ein völlig anderes Bild als aus den Durchschnittswerten, wie der folgenden Tabelle zu entnehmen ist, wobei zur besseren Vergleichbarkeit durchgängig die aus der Grafik ermittelten Daten verwendet wurden:

	Homöopathie	Placebo
Durchschnitte:
Vor Behandlung	0,45	0,43
Nach Behandlung	0,29	0,34
Verbesserung	0,16	0,09
Medianwerte:
Vor Behandlung	0,39	0,35
Nach Behandlung	0,27	0,19
Verbesserung	0,10	0,09

Anmerkung zu den Medianwerten:

Die Medianwerte hängen rechnerisch nicht voneinander ab, denn sie beziehen sich nicht auf die gleiche Patientin. Die Placebowerte sind beispielsweise so zu verstehen, dass vor der Behandlung die ‚mittlere Frau‘ 0,35 Punkte zu verzeichnen hatte, in meiner Auswertung ist das Patientin Nummer 27. Nach der Behandlung war eine andere Patientin die ‚mittlere Frau‘, die 0,19 Punkte aufwies, nämlich Patientin Nummer 31. Eine Dritte, Patientin 46, stellte die ‚mittlere Frau‘ im Hinblick auf die erreichten Verbesserungen dar, die mit 0,09 Punkten geringer ausfiel als die Differenz der beiden anderen ‚mittleren Frauen‘, bei denen Verbesserungen um 0,22 bzw. 0,20 Punkte zu verzeichnen waren. Das ist sicher gewöhnungsbedürftig, spiegelt aber die Tatsache wieder, dass Bewertungszahl am Anfang und Verbesserung nicht miteinander zusammenhingen. Es ist beispielsweise nicht gerechtfertigt, davon auszugehen, dass eine Patientin mit hoher Punktzahl auch eine große Verbesserung erzielt hat.

Wie man an der Tabelle deutlich erkennen kann, zeigen die Ergebnisse auf Basis der Medianwerte, die wohlgemerkt das Kollektiv besser repräsentieren als der Durchschnitt, Vorteile für die Placebobehandlung – und nicht für die Homöopathie:

Vor der Behandlung liegen die Patientinnen der Homöopathie- und der Placebogruppe relativ dicht beieinander, jeweils die Hälfte unter 0,39 beziehungsweise 0,35 Punkten. Nach der Behandlung ergeht es – wenn man der Kennzahl denn wirklich Glauben schenken will und unsere obigen Überlegungen ignoriert – den Patientinnen in der Placebogruppe besser als in der Homöopathiegruppe: liegen dort die Hälfte aller Patientinnen unter 0,27 Punkten, liegt dieser Wert in der Placebogruppe bei nur 0,19 Punkten. Dabei sind die Verbesserungen in beiden Gruppen etwa gleich, nämlich 0,09 bzw. 0,10 Punkte für die jeweilige untere Hälfte des Teilnehmerkollektivs. Dass die Durchschnittswerte und die Medianwerte verhältnismäßig weit auseinanderliegen, ist ein Hinweis darauf, dass die von den Autoren berichteten Ergebnisse stark von einzelnen Extremwerten (‚Ausreißer‘) geprägt sind.

Quintessenz:

Durch die eigentlich angemessenere Verwendung von Medianwerten anstelle der Durchschnitte verschwindet das von den Autoren reklamierte positive Ergebnis der Untersuchung, denn die Verbesserungen waren in beiden Gruppen in etwa gleich groß.

Bei sehr kritischer Betrachtung kehrt sich das Ergebnis sogar völlig um, denn den Frauen aus der Placebogruppe geht es nach der Behandlung im Mittel deutlich besser als den Patientinnen der Verumgruppe. Der Unterschied im Befinden beträgt nach der Behandlung immerhin 0,08 Punkte zu Gunsten der Placebogruppe, ist also doppelt so groß wie vor der Behandlung.

Aber, wie an den kleinen Zahlenwerten erkennbar, bewegen wir uns im unteren Zehntel der gesamten Skala, die immerhin von 0 bis 5 reicht. Wir können getrost vergessen, dass diese Betrachtung das reale Krankheitsgeschehen der Patientinnen tatsächlich widerspiegelt.

Eine Betrachtung der statistischen Auswertungen zur Signifikanz erübrigt sich aufgrund dieser Sachlage.

Zusammenfassung

Wieder einmal mehr ist festzustellen, dass die in der Studie ermittelten Daten die positiven Schlussfolgerungen der Autoren nicht rechtfertigen. Diese hatten festgestellt:

Das hauptsächliche Ergebnis dieser Studie besteht darin, dass eine einzige Anwendung der homöopathischen Behandlung signifikant und reproduzierbar mit einer Verbesserung der PMS-Symptomatik und des Wohlbefindens einherging.
(Übersetzung durch Verfasser)

Mitnichten.

Man kann es sich aussuchen: Entweder sagen die Daten aufgrund der extremen Anwendung von Durchschnittswerten nichts aus, weil sie das Leidensgeschehen nicht wiedergeben. Wem dies nicht einleuchtet und wer die Daten tatsächlich als repräsentativ ansehen will, der muss feststellen, dass sie bei einer zutreffenden statistischen Betrachtung, die nicht auf einzelnen Extremwerten beruht, sondern das gesamte Geschehen besser abbildet, die homöopathische Behandlung keinen Vorteil gegenüber Placebo gebracht hat, dass es den Patientinnen nach der Behandlung mit Placebo sogar besser geht als in der Homöopathiegruppe.

Literatur:

[1] Yakir M, Kreitler S, Brzezinski A, Vithoulkas G, Oberbaum M, Bentwich Z: ‚Effects of homeopathic treatment in women with premenstrual syndrome: a pilot study‘ in: British Homeopathic Journal (2001) ; 90:148–153. Link zum Volltext

[2] Yakir M, Kreitler S, Brzezinski A, Vithoulkas G, Bentwich Z: ‚Successful treatment of premenstrual syndrome by classical homeopathy‘ in: Proceedings of future directions and current issues of research in homeopathy‘ (Tagungsband), Freiburg 2002, S. 134-143

[3] Moos RH: ‚The Development of a Menstrual Distress Questionnaire‘, in Psychosomatic Medicine, (1968) 30 (6) S. 853 – 867, Link zum Volltext

[4] Dalton K: ‚What is this PMS?‘ (Editorial), in: Journal of the Royal College of GEnreral Practitioners (1982), S. 717-720, Link zum Volltext

Dieser Beitrag wurde unter Blog, Klinische Einzelstudien, Wirksamkeitsstudien veröffentlicht. Setze ein Lesezeichen auf den Permalink.

11 Antworten zu Hilft Homöopathie Frauen, die an PMS leiden?

Pingback: Das ist der (Satire-) Gipfel: Homöopathen ohne Grenzen @ gwup | die skeptiker
Norbert Aust sagt:

5. November 2013 um 23:08

Jetzt sehe ich, was Sie meinen.
Ich hatte diesen Punkt (den dritten von hinten in der Placebogruppe, Zahlenwert 1,19) so interpretiert, dass Vorher und Nachher gleich waren und der Vorher-Wert durch die Raute verdeckt wird und nicht sichtbar ist. Auch in den anderen Daten ist erkennbar, dass die Nachher-Rauten über die Vorher-Quadrate gezeichnet sind.
Entsprechend ist der Wert von 1,19 für diese Patientin beide Werte meiner Auswertung eingeflossen.
Andreas sagt:

5. November 2013 um 22:17

Ich habe gerade noch einmal nachgeschaut. Es ist definitiv ein Nachher-Wert falsch. Wenn man vom letzten und höchsten Nachher-Quadrat zurück wandert sieht man beim 3 und 4 Quadrat das Problem. Die beiden Doppel-Rauten direkt beieinander (3 und 4) gehören nicht zum Quadrat 3 und 4 sondern zu 4 und 5. Somit ist Quadrat 3 ohne Raute also ohne Vorher-Wert. Man sieht es auch genau an den gestrichelten Linien, die die Verbindung zu den zusammenhängenden Vorher und Nachher-Werte zeigen.
Norbert Aust sagt:

5. November 2013 um 18:47

Bei den Cross-Over Studien gibt es aber immer auch das Problem, dass das zuerst gegebene Medikament nachwirken kann. Es gibt ja durchaus Homöopathen, die davon ausgehen, dass eine einmalige Gabe eines homöopathischen Medikaments auch noch Jahre später wirken kann. Auch in dieser Studie wurde nur einmal das Medikament verabreicht und dann drei Monate lang das Ergebnis beobachtet. Da auch die Eingangsdaten über zwei Monate lang ermittelt wurden, könnte man diese Studie sogar auch als Cross-Over auswerten.

Aber Herr Brunke meinte ja, dass der Patient überhaupt nicht weiß, dass er behandelt wird, egal ob mit Placebo oder Verum. Dann muss ihm irgendjemand die Kügelchen im Schlaf ins Ohr träufeln (s. Shakepeare, Hamlet), ins Essen mischen oder sonstwie. Und welche Aussagekraft diese Ergebnisse für den Allteg haben sollten, bei denen die Patienten ja ohne Zweifel von einer Behandlung ausgehen, kann ich auch nicht so recht sehen.
Norbert Aust sagt:

5. November 2013 um 18:39

Wenn Sie in das Bild hineinclicken, dann wird die Originalgröße angezeigt, auf die ich den Scan vergrößert habe, um die einzelnen Punkte herauszumessen. Mit etwas Mühe und Phantasie habe ich tatsächlich für alle Punkte sowohl ein Vorher als auch ein Nachher identifizieren können. Wenn Sie wollen, schicke ich Ihnen die Daten gerne zu.
Ute Parsch sagt:

5. November 2013 um 16:41

Nun, man braucht eigentlich nicht darüber streiten, was das optimale Szenario wäre.

Fakt ist, dass es in Studien mit konventionellen Therapien, in denen die Patienten ebenfalls um ihre Behandlung wussten, sehr wohl gelingt, einen Unterschied zwischen „Verumgruppe“ und „Placebogruppe“ nachzuweisen, wenn den Patientinnen bewusst war, therapiert zu werden.

Beispiele:
“ A Double-blind Trial of Oral Progesterone, Alprazolam, and Placebo in Treatment of Severe Premenstrual Syndrome“, Ellen W. Freeman
http://jama.jamanetwork.com/article.aspx?articleid=389139
„A double-blinded protocol in which 300 mg of oral micronized progesterone, 0.25 mg of alprazolam, or placebo was administered four times a day (…) Alprazolam was significantly better than placebo or progesterone for total premenstrual symptoms and DSR factors of mental function, pain, and mood.“

Es gibt sogar eine Metastudie zum Thema, in die 15 placebokontrollierte Studien zur Wirksamkeit von SSRIs bei PMS einflossen. Auch hier waren die Ergebnisse eindeutig.

„Efficacy of selective serotonin-reuptake inhibitors in premenstrual syndrome: a systematic review“, Dr Paul W Dimmock
http://www.sciencedirect.com/science/article/pii/S0140673600027549

Da die Homöopathie behauptet, Effekte erzielen zu können, die denen der konventionellen Therapie vergleichbar (mindestens vergleichbar??) sind, sollten demnach auch hier unter denselben Umständen deutliche Unterschiede nachweisbar sein – wenn denn die Behauptung zuträfe…
Andreas sagt:

5. November 2013 um 09:32

Herr Brunke, Herr Aust,

es gibt mittlerweile randomisierte doppelt veblindete „cross over „ Studien. Diese sorgen dafür, dass die Erwartungshaltungen besser unterdrückt werden, da beide Gruppen das Medikament bekommen, aber eben beide nicht wissen, wann innerhalb der Studie sie dieses erhalten.
Beispiel:
Gruppe A bekommt in den ersten 4 Wochen Placebo dann 4 Wochen Verum.
Gruppe B bekommt in den ersten 4 Wochen Verum dann 4 Wochen Placebo.

Was allerding immer vergessen wird wie gut die Randomisierung gewesen ist. Diese lässt leider oft sehr zu Wünschen übrig.

Eine schönen Tag noch

Dr. Breß
Andreas sagt:

5. November 2013 um 09:17

Wenn ich nicht ganz falsch geschaut habe bei der Grafik, ist in der Placebogruppe bei dem stärksten PMS Mean ein Patient nur mit einem Nachher-Wert angegeben. Der Patient mit dem Wert bei ca. 1,20. Ich sehe in der Grafik 3 Vorher-Werte, die auch klar jeweils einem Nachher-Wert zugeordnet werden können beim vierten finde ich ihn aber nicht.
Wurden da etwa Daten hinzugefügt oder einfach nur unsauber gearbeitet?
Komisch!!

Dr. Breß
Norbert Aust sagt:

3. November 2013 um 23:49

Vielleicht ist ja wirklich das ganze Vorgehen vom Ansatz her falsch. Bei Ihrem Vorschlag, Herr Brunke, ergibt sich für mich die Schwierigkeit, dass man einer Patientin, die wegen bestimmter Beschwerden zum Arzt geht, wohl kaum wird verheimlichen können, dass sie eine Behandlung erfahren wird, ob nun in einer Studie oder nicht, ob mit Verum oder mit Placebo, ist da weniger von Belang. Sie wird es wissen, ja wahrscheinlich sogar erwarten, das da jetzt sowas passiert.

Wie leicht ersichtlich: Die Schwierigkeit ist der Patient, nicht die Behandlung. Klar und eindeutig. Warum lässt man dann den Patienten bei der Erprobung homöopathischer Medikamente nicht einfach weg? Der stört doch nur. Alle Ergebnisse, die gegen die Homöopathie sprechen, sind doch nur dadurch zustande gekommen, dass man versucht hat, diese klare und reine Lehre an unvollkommenen Menschen auszuprobieren. Genau genommen könnte man sich das ganze Placebogedöns sparen. Man brauchte den ganzen Statistikunsinn nicht mehr. Die Welt wäre doch so viel einfacher.

Vielleicht wäre es in der Tat ein praktikablerer Weg, zu aussagekräftigen und eindeutigen Ergebnissen zu kommen. Man sollte vielleicht mal darüber nachdenken. In manchen Branchen der Alternativmedizin ist das ja durchaus auch heute schon üblich…
Lothar Brunke sagt:

3. November 2013 um 22:32

Interessant wäre der Vergleich mit einem schulmedizinischen Schmerzmittel und Placebo. Ich vermute, dass dabei kein besseres Ergebnis zu verzeichnen gewesen wären. Schmerzen unterliegen im besonderen Maße dem psychischen Placeboeffekt und sind nach meiner Einschätzung am schlechtesten geeignet die Wirkung homöopathischer Behandlung in der Wirkung nachzuweisen.
Zitat:“ 0,44 auf 0,28 Punkte, also eine Verbesserung um 0,16 Punkte. In der Placebogruppe ergab sich hingegen eine Verbesserung von 0,42 auf 0,34 Punkte, also um nur 0,08 Punkte.“
Mein Kritikpunkt lautet: Wenn ich eine derartige Studie durchführe und die Probandinnn wissen, dass sie behandelt werden, ergibts sich daraus bereits ein Placeboeffekt, der zwar nicht heilt, den Probandinnen jedoch das Gefühl vermittelt, es gehe ihnen besser als vorher. Dan spielt es nur noch eine Nebenrolle, ob ein Medikament oder Placebo anschließend verabreicht wird. Insofern hat die Studie keine Aussagekraft.
Richtig ware gewesen, den Probandinnen nicht mitzuteilen, dass sie an einer Studie teilnehmen und möglicherweise ein Medikament erhalten.
Pingback: Medizin: Wenn C-Promis die “Experten” spielen @ gwup | die skeptiker