I. Feststellung der Verteilung des Merkmals in der Grundgesamtheit
II. Aufstellen der Nullhypothese
III. Festlegen der Testfunktion T
IV. Festlegen des Annahmebereichs ("Nichtablehnungsbereichs") (für ein zu bestimmendes Signifikanzniveau)
Fällt die Prüfgröße
in den Bereich [
u;
o],
wird H0 nicht abgelehnt. Es soll sein

(beachte: ein- oder zweiseitig)
α : Signifikanzniveau oder α-Fehler
V. Stichprobe erheben
VI. Entscheidung treffen
|
H0 ist wirklich wahr |
H1 ist wirklich wahr
|
H0 wird beibehalten |
richtige Entscheidung (1-α) |
Fehler 2. Art (β-Fehler)
|
H1 wird angenommen |
Fehler 1. Art (α-Fehler) |
richtige Entscheidung (1-β)
|
Test
|
|
|
zweiseitig
|
μ = μ0
|
μ ≠ μ0
|
rechtsseitig
|
μ ≤ μ0
|
μ > μ0
|
linksseitig
|
μ ≥ μ0
|
μ < μ0
|
-
Zweiseitiger Test für

-
linksseitiger Test für

-
Rechtsseitiger Test für

1. X ist normalverteilt, σ ist bekannt bei beliebigem n bzw. näherungsweise normalverteilt bei n > 30
- Testfunktion
(Gauß-Test):
|
Ablehnungsbereich
|
zweiseitig
|
|
rechtsseitig
|
|
linksseitig
|
|
2. X ist normalverteilt, σ ist unbekannt bei beliebigem n
- Testfunktion
(t-Test).
|
Ablehnungsbereich
|
zweiseitig
|
|
rechtsseitig
|
|
linksseitig
|
|
3. X ist näherungsweise normalverteilt, σ ist unbekannt bei n > 30
- Testfunktion
(Gauß-Test) .
|
Ablehnungsbereich
|
zweiseitig
|
|
rechtsseitig
|
|
linksseitig
|
|
|
Einseitig
|
Zweiseitig
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Die Stichprobenwerte, die größer als der hypothetische Median
sind, bekommen ein "+" zugeordnet;
Werte, die kleiner sind, ein "-". Die Anzahl der positiven Vorzeichen wird gezählt und dient als Teststatistik.
Die
Beobachtungspaare dürfen nicht voneinander abhängen, d.h. das Wertepaar
muss unabhängig
vom Wertepaar
sein.
Besitzen beide Grundgesamtheiten den gleichen Median, gilt
.
Folgende Hypothesen können mit dem Vorzeichentest geprüft werden:
|
Einseitig
|
Zweiseitig
|
|
|
|
|
|
|
|
|
Die Wertepaare der Stichproben, bei denen
gilt, bekommen ein "+" zugeordnet;
Wertepaare, für die
gilt, ein "-". Die Anzahl der positiven Vorzeichen wird gezählt
und dient als Teststatistik. Die Teststatistik entspricht der Anzahl der positiven Vergleiche (Differenzen der Werte bzw. Ränge):

mit

Für das Einstichprobenproblem sind die Werte der zweiten Stichprobe durch den hypothetischen Median zu ersetzen.
Bei Gültigkeit der Nullhypothese
ist die Summe der positiven Differenzen binomialverteilt mit
,
da der Median dem 50 %-Quantil entspricht. n' bezeichnet den nach Behandlung von Ties (Nulldifferenzen, Rangbindungen, s.u.)
verbleibenden Stichprobenumfang. Bei Gültigkeit der Nullyhypothese ist die Verteilung der Prüfgröße symmetrisch.
Approximation durch die Normalverteilung
Mit
nähert sich die Binomialverteilung einer Normalverteilung mit
,
als Faustregel
(
).
Mit
bzw.
ist die z-standardisierte Größe
näherungsweise standardnormalverteilt.
Bindungen (Nulldifferenzen)
Sind im Zweistichprobenproblem die Werte von Beobachtungen von der ersten zur zweiten Stichprobe unverändert
oder im Einstichprobenproblem einige Werte gleich dem Median, ergeben sich Nulldifferenzen bzw. Bindungen (Ties),
die man so behandeln kann:
- Beobachtungen mit Rangbindungen werden eliminiert, d.h. der Stichprobenumfang wird reduziert.
- Die Beobachtungen werden zu gleichen Teilen den Gruppen zugeordnet. Bei ungerader Anzahl von Bindungen wird ein Beobachtungspaar eliminiert.
- Die Beobachtungen werden jeweils mit einer Wahrscheinlichkeit von 0,5 einer der beiden Gruppen (+ oder -) zugeordnet.
Der Anteilswert θ wird geschätzt durch
.
Mit dem Binomialtest können folgende Hypothesenpaare für θ getestet werden:
Test
|
|
|
zweiseitig
|
|
|
rechtsseitig
|
|
|
linksseitig
|
|
|
- für n > 30 , nθ0 ≥ 10 n(1-θ0) ≥ 10
- kann man durch die Gauß-Verteilung approximieren:
- Testfunktion
(Gauß-Test) .
|
Ablehnungsbereich
|
zweiseitig
|
|
rechtsseitig
|
|
linksseitig
|
|
- für n < 30 oder nθ0 < 10 oder n(1-θ0) < 10
- ist der exakte Binomialtest anzuwenden:
- Testfunktion
Die Teststatistik
gibt an, wie oft das Merkmal in einer zufälligen Stichprobe vom Umfang
aufgetreten ist.
Unter der Nullhypothese
ist die Teststatistik
-verteilt, das heißt
.
- Ablehnungsbereich
Da die Teststatistik diskret verteilt ist, kann das vorgegebene Signifikanzniveau
in der Regel nicht eingehalten werden.
Daher wird gefordert, die kritischen Werte so zu wählen, dass für ein möglichst großes exaktes Signifikanzniveau
gilt
.
Für den zweiseitigen Test werden daher als kritische Werte das größte
und das kleinste
bestimmt, für die gilt
und
.
Das exakte Signifikanzniveau ergibt sich als
.
Für die beiden einseitigen Tests wird analog verfahren.
Test
|
Kritische Werte
|
Kritischer Bereich
|
Grenze(n)
|
zweiseitig
|
und
|
|
|
rechtsseitig
|
|
|
c = kleinster Wert, für den
|
linksseitig
|
|
|
c = größter Wert, für den
|
Test
|
|
|
zweiseitig
|
|
|
rechtsseitig
|
|
|
linksseitig
|
|
|
1. X ist normalverteilt, μ ist unbekannt, n beliebig
- Testfunktion

|
Ablehnungsbereich
|
zweiseitig
|
oder
|
rechtsseitig
|
|
linksseitig
|
|
2. X ist normalverteilt, μ ist bekannt, n beliebig
- Testfunktion

|
Ablehnungsbereich
|
zweiseitig
|
oder
|
rechtsseitig
|
|
linksseitig
|
|
Tests auf Zusammenhangs- und Assoziationsparameter
[Bearbeiten]
- Nullhypothese
: Die Merkmale
und
sind stochastisch unabhängig.
Die Beobachtungen der Merkmale
und
liegen paarweise in
bzw.
Klassen vor.
Es gibt insgesamt paarweise Beobachtungen von und , die sich auf Kategorien verteilen. Aufstellung z. B. in einer Häufigkeitstabelle:
|
|
|
Merkmal
|
Summe Σ
|
Merkmal
|
1
|
2
|
…
|
k
|
…
|
r
|
nj.
|
1
|
n11
|
n12
|
...
|
n1k
|
...
|
n1r
|
n1.
|
2
|
n21
|
n22
|
…
|
n2k
|
…
|
n2r
|
n2.
|
…
|
…
|
…
|
…
|
…
|
…
|
…
|
…
|
j
|
…
|
…
|
…
|
njk
|
…
|
…
|
nj.
|
…
|
…
|
…
|
…
|
…
|
…
|
…
|
…
|
m
|
nm1
|
nm2
|
…
|
nmk
|
…
|
nmr
|
nm.
|
Summe Σ
|
n.1
|
n.2
|
…
|
n.k
|
…
|
n.r
|
n
|
|
|
Absolute Randhäufigkeiten
bzw.
und 
Prüfgröße für den Unabhängigkeitstest:

Mit :
wird abgelehnt, wenn
ist.
Chi-Quadrat-Anpassungs- oder Verteilungstest
[Bearbeiten]
Die Wahrscheinlichkeiten eines Merkmals
seien in der Grundgesamtheit unbekannt.
Nullhypothese:
: Das Merkmal
besitzt die Wahrscheinlichkeitsverteilung
Für
unabhängige Beobachtungen
des Merkmals
wird die Zahl
der Beobachtungen in der
-ten Klasse ist die beobachtete Häufigkeit
.
Im Vergleich dazu wird die hypothetische Verteilung bestimmt aufgrund der Wahrscheinlichkeit
,
dass eine Ausprägung von
in die Kategorie
fällt. Die unter
zu erwartende Häufigkeit ist:

Die Prüfgröße (Größe der Abweichung)

ist bei ausreichend großen
annähernd chi-Quadrat-verteilt mit
Freiheitsgraden.
wird abgelehnt, wenn
gilt.
Test auf Übereinstimmung zweier Wahrscheinlichkeitsverteilungen.
Man betrachtet ein statistisches Merkmal X, dessen Verteilung in der Grundgesamtheit unbekannt ist.
(Die Zufallsvariable X besitzt die Wahrscheinlichkeitsverteilung F0.)
(Die Zufallsvariable X besitzt eine andere Wahrscheinlichkeitsverteilung als F0.)
Der Kolmogorow-Smirnow-Test vergleicht die empirische Verteilungsfunktion
mit
mittels der Teststatistik
(sup: Supremum)
Die Teststatistik ist unabhängig von der hypothetischen Verteilung F0.
Ist der Wert der Teststatistik größer als der entsprechende tabellierte kritische Wert, so wird die Nullhypothese verworfen.
Von einer reellen Zufallsvariablen
liegen
aufsteigend sortierte Beobachtungswerte
(
) vor.
Von diesen Beobachtungen wird die relative Summenhäufigkeit
mit der entsprechenden hypothetischen
Verteilung der Grundgesamtheit F0(xi) verglichen. Voraussetzung:
ist stetig.
Für jedes
werden die absoluten Differenzen
und :
berechnet, wobei
gesetzt wird. Wenn die größte Differenz
aus allen Differenzen
,
einen kritischen Wert
übersteigt, wird die Hypothese abgelehnt.
Bis n=40 greift man auf Tabellen zurück (s. Anhang). Für größere
werden sie über
angenähert.
Liegt nun zusätzlich zur Zufallsvariablen
eine entsprechende Zufallsvariable
vor (mit
geordneten Werten
),
so kann durch den Zweistichprobentest überprüft werden, ob
und
derselben Verteilungsfunktion folgen.
Von beiden Beobachtungen werden die die Differenzen der relativen Summenfunktionen
bzw.
ermittelt:
und :
.
Die Nullhypothese wird abgelehnt, falls
den kritischen Wert
überschreitet.
Für kleine Werte von
und
greift man auf Tabellen zurück.
Für große Werte von n und m wird die Nullhypothese abgelehnt, falls
,
wobei
für große
und
näherungsweise als
berechnet werden kann.