Keywords: Einstichproben-t-Test, statistischer Test, Statistik Beratung, Data Science
Im folgenden geht es um den Einstichproben-t-Test. Der Test prüft anhand des Mittelwerts aus einer Stichprobe, ob der Mittelwert einer Grundgesamtheit gleich einem vorgegebenem Mittelwert ist (bzw. kleiner oder größer). Die Nullhypothese lautet, dass die Mittelwerte gleich sind: \[H_0:\,\mu=\mu_0\] Die Alternativhypothese lautet, dass die Mittelwerte ungleich sind: \[H_1:\,\mu\neq\mu_0\]
Seien \(X_1, X_2, \dots, X_n\) unabhängige normalverteilte Zufallsvariablen mit Erwartungswert \(\mu \in \mathbb{R}\) und Standardabweichung \(\sigma > 0\). Dann ist die Teststatistik \(T\), ist wie folgt definiert:
\[T = \sqrt{n}\frac{\bar X - \mu_0}{S},\]
wobei
Die Teststatistik ist unter der Nullhypothese t-verteilt mit \(n-1\) Freiheitsgraden.
Wir erzeugen uns in R eine normalverteilte Stichprobe mit Fallzahl \(20\) und Mittelwert \(=30\) und wollen auf dem 5% Signifikanzniveau testen ob der Mittelwert \(=30.5\) ist:
X <- rnorm(20, mean=30, sd=5)
Nun berechnen wir die Teststatistik anhand der Hilfsvaraiablen wie oben angegeben:
n <- 20
Xmw <- 1/n*sum(X)
S <- sqrt(1/(n-1)*sum((X-Xmw)^2))
T <- sqrt(n)*(Xmw-30.5)/S
print(T)
## [1] 0.1913786
Der p-Wert zu dieser Teststatistik \(T\) ist dann gegeben durch:
2*pt(q=-abs(T),df=n-1)
## [1] 0.8502593
Wir berechnen die Teststatistik mit der eingebauten Funktion in R, um zu vergleichen
t.test(X, mu=30.5,alternative="two.sided")
##
## One Sample t-test
##
## data: X
## t = 0.19138, df = 19, p-value = 0.8503
## alternative hypothesis: true mean is not equal to 30.5
## 95 percent confidence interval:
## 28.43201 32.98423
## sample estimates:
## mean of x
## 30.70812
Wie man sieht stimmen sowohl die Teststatistik als auch der p-Wert überein. Die Interpretation des Tests lautet wie folgt: Wir können auf dem Signifikanzniveau \(\alpha\)=0.05 die Nullhypothese, dass die Mittelwerte gleich sind, nicht verwerfen, da der p-Wert des Tests \(>0.05\) ist.
Wir erzeugen uns in R eine normalverteilte Stichprobe mit Fallzahl \(20\) und Mittelwert \(=30\) und wollen auf dem 5% Signifikanzniveau testen ob der Mittelwert \(=35\) ist:
X <- rnorm(20, mean=30, sd=5)
Nun berechnen wir die Teststatistik anhand der Hilfsvaraiablen wie oben angegeben:
n <- 20
Xmw <- 1/n*sum(X)
S <- sqrt(1/(n-1)*sum((X-Xmw)^2))
T <- sqrt(n)*(Xmw-35)/S
print(T)
## [1] -5.664714
Der p-Wert zu dieser Teststatistik \(T\) ist dann gegeben durch:
2*pt(q=-abs(T),df=n-1)
## [1] 1.842207e-05
Wir berechnen die Teststatistik mit der eingebauten Funktion in R, um zu vergleichen
t.test(X, mu=35,alternative="two.sided")
##
## One Sample t-test
##
## data: X
## t = -5.6647, df = 19, p-value = 1.842e-05
## alternative hypothesis: true mean is not equal to 35
## 95 percent confidence interval:
## 27.80160 31.68583
## sample estimates:
## mean of x
## 29.74371
Wie man sieht stimmen sowohl die Teststatistik als auch der p-Wert überein. Die Interpretation des Tests lautet wie folgt: Wir können auf dem Signifikanzniveau \(\alpha\)=0.05 die Nullhypothese, dass die Mittelwerte gleich sind, verwerfen, da der p-Wert des Tests \(<0.05\) ist.