Lieber Dirk,
hier kurz das, was ich im Zusammenhang mit dem Konzept der Wahrscheinlichkeit für wichtig halte:
- Ein Ereignis ist entweder der Fall oder nicht. Deshalb ist mit ihm keine Wahrscheinlichkeit verknüpft, darauf weisen Sie zu Recht hin.
- Eine Wahrscheinlichkeit ist verknüpft mit dem Eintreten eines künftigen Ereignisses.
- Es gibt eine Menge möglicher Ereignisse und eine Menge "günstiger" Ereignisse, dh solcher, die eine bestimmte Eigenschaft haben. Die Wahrscheinlichkeit, daß ein Ereignis mit dieser Eigenschaft eintritt, ist gleich dem Quotienten aus der Zahl der günstigen und der Zahl der möglichen Ereignisse.
- Wenn man diese beiden Werte kennt - beim Würfeln zum Beispiel, beim Roulette, in einem Urnenmodell -, dann kann man also Wahrscheinlichkeiten berechnen.
- Oft werden aber Wahrscheinlichkeiten dann, wenn man diese Werte nicht kennt, geschätzt, und zwar aus empirischen relativen Häufigkeiten.
- Leider wird oft - ich glaube, das haben Sie, lieber Dirk, auch zu Recht angesprochen - aber nicht hinreichend zwischen empirischen Häufigkeiten und Wahrscheinlichkeiten unterschieden. Auch in wissenschaftlichen Publikationen findet man oft statt des Wertes f den Wert p. Mag sein, daß das schlicht daran liegt, daß das Wort "probability" kürzer ist als "relative frequency". Oder was immer.
- Bei der Prüfung wissenschaftlicher Hypothesen geht es oft darum, ob ein Unterschied, den man empirisch gefunden hat, zufällig ist oder auf der Wirksamkeit eines bestimmten Faktors basiert. Grundsätzlich kann jeder Unterschied zufällig sein. Auch wenn hundet Mal hintereinander dieselben Lottozahlen gezogen werden, kann das auf Zufall beruhen. Nur ist das unwahrscheinlich. Die mathematische Statistik sagt uns, wie unwahrscheinlich es ist. Das heißt, wenn wir von Wahrscheinlichkeiten zu relativen Häufigkeiten übergehen, wieviele Lottospiele im Schnitt erforderlich wären, um eine solche Sequenz zufällig zu erzielen.
- Was nun das Konfidenzintervall angeht - das ist einfach eine willkürlich festgelegte Wahrscheinlichkeit, unterhalb von der man sich entschließt, einen Unterschied als nicht zufällig zu betrachten. Es ist wirklich ein vollkommen willkürlich gewählter Wert. Deshalb ist es auch im Grunde falsch, bei, sagen wir, einer Varianzanalyse neben den einen Faktor zu schreiben "p<.05" und neben den anderen "p<.001". Welches Konfidenzintervall man wählt, das sollte man festlegen, bevor man das betreffende Experiment macht oder die Erhebung vornimmt. Und zwar aufgrund von Erwägungen zur a priori Wahrscheinlichkeit und zu den Folgen eines Fehlers erster und zweiter Art.
- Um nun zu den Klimamodellen zurückzukehren - da scheint - und insofern teile ich auch hier Ihre Kritik - mit "confidence" das gemeint zu sein, was ich anhand des Bayes'schen Theorems zu präzisieren versucht habe: Die bedingte Wahrscheinlichkeit, daß, gegeben die Gesamtheit der Beobachtungen, eine menschengemachte globale Erwärmung vorliegt. Das ist etwas ganz anderes als das Konfidenzintervall.
Denn es ist Bayes'sche Statistik, keine klassische Prüfstatistik. Und wenn da von .90 oder dergleichen gesprochen wird, dann dürfte damit eine Intuition von Wissenschaftlern gemeint sein. Jedenfalls sehe sich nicht, wie man das berechnen könnte.
Aber vielleicht kann man es; von Klimatologie verstehe ich ja nichts. 
Herzlich, Zettel
|