Varianzanalyse

Der englische Begriff für einfaktorielle Varianzanalyse lautet: ANalysis Of VAriance (ANOVA).

Für das allgemeine Verständnis:

Die Varianzanalyse ist wie der t-Test ein statistisches Prüfverfahren, welches feststellen soll, ob gefundene Unterschiede zwischen verschieden behandelten Gruppen signifikant (überzufällig) sind oder nicht. Während der t-Test nur zwei Mittelwerte gleichzeitig miteinander vergleichen kann, ist die Varianzanalyse in der Lage, mit nur einem Test mehrere Mittelwerte simultan zu vergleichen, wodurch sie ökonomischer ist.

Würde man den t- Test für mehrere Mittelwertsvergleiche einsetzen, müsste man auch mehrere Tests durchführen, was zu einer Alpha-Fehlerkumulierung führt. Die Teststärke (Power) würde dadurch herabsetzt. Das bedeutet, dass der Test für die Identifizierung tatsächlicher Mittelwertsunterschiede nicht mehr besonders geeignet ist.

Aus diesen beiden Gründen (Ökonomie und Teststärke) wird die Varianzanalyse dem t-Test vorgezogen, wenn mehrere Mittelwerte verglichen werden sollen.

Im Detail:

Nun stellt sich die Frage, woher die Varianzanalyse ihren Namen hat, wo sie doch letztlich auch nur die Mittelwerte vergleicht. Wenn wir mehrere Gruppen haben, kann man einen Gesamtmittelwert und eine Gesamtstreuung berechnen. Das bedeutet, dass auch die Mittelwerte der einzelnen Gruppen um den Gesamtmittelwert streuen. Leider gibt es für dieses Maß keinen erwartungstreuen Schätzer. Also müssen wir die Gesamtvarianz zu Hilfe nehmen, welche die systematische Varianz (durch Manipulation) und Residualvarianz (Grö0e der unsystematischen Einflüsse) enthält.

Die Residualvarianz beschreibt die Varianz innerhalb der einzelnen Gruppen, weshalb sie auch "Varianz innerhalb" bezeichnet wird. Gesucht ist jedoch die Größe der systematischen Varianz (Effektvarianz). Zu diesem Zweck wird die Varianz zwischen den Gruppen (schützt Residualvarianz und Effektvarianz) dividiert durch die Varianz innerhalb der Gruppen (schützt nur die Residualvarianz). Der Quotient wird mit "F" bezeichnet.

Bedeutung der Ergebnisse

Wenn F = 1, dann hatte die Manipulation keinen Einfluss auf die Mittelwertsdifferenz zwischen den Gruppen. Die Varianz zwischen besteht nur aus Residualvarianz und die Varianz innerhalb ist Null.

Wenn F > 1, dann besteht ein systematischer Einfluss der Manipulation auf die Mittelwertsdifferenz. Die Varianz zwischen ist deshalb größer, als die Varianz innerhalb.

Auswertungsmethoden:

Der F-Wert wird mit Hilfe der F-Verteilung auf Signifikanz geprüft, das bedeutet, es wird untersucht, ob die Effektvarianz überzufällig ist. Die F- Verteilung gibt, abhängig von der Anzahl der Gruppen und der Stichprobengröße, an, mit welcher Wahrscheinlichkeit ein bestimmter F-Wert vorkommt, wenn in der Population die Nullhypothese angenommen wird.

Durch das vorherige Festlegen eines alpha-Wertes und die Bestimmung der Freiheitsgrade, kann ein F-Kritisch-Wert bestimmt werden, an dem der empirisch gewonnene geprüft wird. Dieser Wert kann aus der F-Tabelle abgelesen werden.

Wenn F empirisch > F kritisch, dann wird die Nullhypothese verworfen und die Alternativhypothese angenommen.

SPSS (ein statistisches Programm) errechnet die Wahrscheinlichkeit, mit der der F-Wert vorkommt, wenn in der Population die Nullhypothese gilt. Ist dieser Wahrscheinlichkeitswert (p-Wert) kleiner als das festgelegte alpha-Niveau (meist 5%), dann wird die Nullhypothese verworfen. Auch in Excel gibt es Funktionen für die ANOVA.

Literatur

  • Rasch B., Friese M., Hofmann W., Naumann E. (2004) "Quantitative Methoden Band 2". Springer Verlag, Berlin, Heidelberg, New York

 

siehe auch: Alpha-Fehler, arithmetisches Mittel, Alternativhypothese, Nullhypothese, t-Test, Varianz, Standardabweichung