Chi Quadratstatistik

Was ist eine Chi-Quadrat-Statistik

Eine Chi-Quadrat-Statistik ist ein Maß dafür, wie sich die Erwartungen mit den Ergebnissen vergleichen. Die bei der Berechnung einer Chi-Quadrat-Statistik verwendeten Daten müssen zufällig, roh, sich gegenseitig ausschließend, aus unabhängigen Variablen gezogen und aus einer ausreichend großen Stichprobe gezogen werden. Zum Beispiel erfüllen die Ergebnisse des 100-maligen Münzwurfs diese Kriterien.

ABBRECHEN 'Chi-Quadrat-Statistik'

Als einfaches Beispiel für die Berechnung und Verwendung der Chi-Quadrat-Statistik sollten Sie eine Münze 100 Mal werfen. Das erwartete Ergebnis, 100 Mal eine faire Münze zu werfen, ist, dass die Köpfe 50 Mal hochkommen und die Tails 50 Mal. Das tatsächliche Ergebnis könnte sein, dass die Köpfe 45 Mal und die Schwänze 55 Mal auftauchen. Die Chi-Quadrat-Statistik zeigt Abweichungen zwischen den erwarteten Ergebnissen und den tatsächlichen Ergebnissen.

Beispiel Chi-Quadrat-Berechnung

Stellen Sie sich vor, eine zufällige Umfrage wurde bei 2.000 verschiedenen Wählern, sowohl männlichen als auch weiblichen, durchgeführt. Die Leute, die antworteten, wurden nach ihrem Geschlecht klassifiziert und ob sie republikanisch, demokratisch oder unabhängig waren. Stellen Sie sich ein Raster vor, in dem die Spalten republikanisch, demokratisch und unabhängig und zwei Zeilen als männlich und weiblich gekennzeichnet sind. Angenommen, die Daten der 2.000 Befragten lauten wie folgt:

Männlich: 400 (Republikaner), 300 (Demokrat), 100 (unabhängig) - Insgesamt Männer entsprechen 800

weiblich: 500 (republikanisch), 600 (demokratisch), 100 (unabhängig) - weiblich gesamt 1, 200

Summe: 900 (republikanisch), 900 (demokratisch), 200 (unabhängig) ) - Gesamtsumme gleich 2, 000

Der erste Schritt zur Berechnung der Chi-Quadrat-Statistik besteht darin, die erwarteten Häufigkeiten zu finden. Diese werden für jede "Zelle" im Raster berechnet. Da es zwei Kategorien von Geschlecht und drei Kategorien politischer Sicht gibt, gibt es sechs erwartete Gesamtfrequenzen. Die Formel für die erwartete Häufigkeit ist:

E (r, c) = (n (r) xc (r)) / n

Wobei "r" die Zeile in Fragen ist, "c" die Spalte in Frage, und "n" ist die entsprechende Summe. In diesem Beispiel sind die erwarteten Häufigkeiten:

E (1, 1) = (900 x 800) / 2, 000 = 360

E (1, 2) = (900 x 800) / 2, 000 = 360 999 E (1, 3) = (200 x 800) / 2 000 = 80 999 E (2, 1) = (900 x 1, 200) / 2 000 = 540 999 (2, 2) = (900 x 1, 200) / 2, 000 = 540 E (2, 3) = (200 x 1, 200) / 2, 000 = 120

Als nächstes werden diese verwendet Werte zur Berechnung der Chi-Quadrat-Statistik nach folgender Formel:

Chi quadriert = Summe von (O (r, c) - E (r, c)) ^ 2 / E (r, c), wobei O (r, c) sind die beobachteten Daten für die gegebene Zeile und Spalte.

In diesem Beispiel lautet der Ausdruck für jeden beobachteten Wert:

O (1, 1) = (400 - 360) ^ 2/360 = 4.44 999 O (1, 2) = (300 - 360) ^ 2/360 = 10 999 O (1, 3) = (100 - 80) ^ 2/80 = 5 O (2, 1) = (500 - 540) ^ 2/540 = 2. 96 999 O (2, 2) = (600 - 540) ^ 2/540 = 6 67 999 O (2, 3) = ( 100 - 120) ^ 2/120 = 3. 33

Die Chi-Quadrat-Statistik entspricht dann der Summe dieser Werte oder 32. 41.