t-Test-Statistik für zwei Stichproben (unabhängige Stichproben)

Q: What are common mistakes with the t-Test-Statistik für zwei Stichproben (unabhängige Stichproben) formula?

Gleiche Varianzen anzunehmen, wenn sich Stichprobengrößen oder Verteilungen deutlich unterscheiden. Nicht zu bestätigen, dass die Stichproben wirklich unabhängig sind, etwa wenn der Test auf gepaarte Daten angewendet wird. Die Standardformel mit gepoolter Varianz anstelle der ungepoolten Version zu verwenden.

Core idea

Overview

Auch als Welch-t-Test bekannt, wird diese Formel verwendet, um die Mittelwerte zweier unabhängiger Stichproben unter der Annahme ungleicher Varianzen zu vergleichen. Sie misst den Abstand zwischen dem beobachteten Unterschied der Stichprobenmittelwerte und dem hypothetischen Populationsunterschied in Einheiten des Standardfehlers. Der resultierende t-Wert wird dann mit einer t-Verteilung verglichen, um den p-Wert zu bestimmen.

When to use: Verwende diesen Test, wenn du die Mittelwerte zweier unabhängiger Gruppen vergleichen möchtest, die Populationsstandardabweichungen unbekannt sind und du keine gleichen Varianzen annehmen kannst.

Why it matters: Er ist ein grundlegendes Werkzeug in der wissenschaftlichen Forschung und beim A/B-Testing und erlaubt Analysten, aus begrenzten Stichprobendaten auf Unterschiede in Populationen zu schließen, ohne Varianzhomogenität vorauszusetzen.

Symbols

Variables

t = t-statistic, $\overset{x}{ˉ}$ _1 = Mean of sample 1, $\overset{x}{ˉ}$ _2 = Mean of sample 2, $s_{1}^{2}$ = Variance of sample 1, $s_{2}^{2}$ = Variance of sample 2

t

t-statistic

Variable

\overset{x}{ˉ}_{1}

Mean of sample 1

Variable

\overset{x}{ˉ}_{2}

Mean of sample 2

Variable

s_{1}^{2}

Variance of sample 1

Variable

s_{2}^{2}

Variance of sample 2

Variable

n_{1}

Size of sample 1

Variable

n_{2}

Size of sample 2

Variable

diff

Hypothesized difference

Variable

Walkthrough

Derivation

Herleitung der Prüfgröße des t-Tests für zwei Stichproben (unabhängige Stichproben)

Diese Herleitung nutzt die Eigenschaften von Stichprobenverteilungen, um eine Teststatistik zu konstruieren, die einer t-Verteilung folgt, indem die Differenz zwischen zwei Stichprobenmittelwerten standardisiert wird.

Die beiden Stichproben sind voneinander unabhängig.
Die Grundgesamtheiten, aus denen die Stichproben gezogen werden, sind annähernd normalverteilt.
Die Populationsvarianzen sind unbekannt, was die Verwendung von Stichprobenvarianzen als Schätzwerte erforderlich macht.

1

Definition der Stichprobenverteilung der Differenz der Mittelwerte

Da die Stichprobenmittelwerte unabhängiger normalverteilter Populationen selbst normalverteilt sind, folgt ihre Differenz einer Normalverteilung, die bei der Differenz der Populationsmittelwerte mit einer kombinierten Varianz zentriert ist.

(\overset{x}{ˉ}_{1} - \overset{x}{ˉ}_{2}) \sim N (μ_{1} - μ_{2}, \frac{σ _{1}^{2}}{n _{1}} + \frac{σ _{2}^{2}}{n _{2}})

Note: Die Varianz der Differenz zweier unabhängiger Variablen ist die Summe ihrer Einzelvarianzen.

2

Standardisierung (Z-Score)

Wir transformieren die Differenz der Stichprobenmittelwerte in eine Standardnormalvariable, indem wir den Erwartungswert subtrahieren und durch den Standardfehler dividieren.

Z = \frac{( x ˉ _{1} - x ˉ _{2} ) - ( μ _{1} - μ _{2} )}{\frac{σ _{1}^{2}}{n _{1}} + \frac{σ _{2}^{2}}{n _{2}}} \sim N (0, 1)

Note: Dieser Schritt erfordert die Kenntnis der Populationsvarianzen, die gewöhnlich unbekannt sind.

3

Substitution der Stichprobenvarianzen

Da die Populationsvarianzen unbekannt sind, ersetzen wir sie durch die Stichprobenvarianzen $s_{1}^{2}$ und $s_{2}^{2}$ . Diese Substitution wandelt die Z-Verteilung in eine t-Verteilung um.

t = \frac{( x ˉ _{1} - x ˉ _{2} ) - ( μ _{1} - μ _{2} )}{\frac{s _{1}^{2}}{n _{1}} + \frac{s _{2}^{2}}{n _{2}}}

Note: Dies wird als Welch-t-Test bezeichnet, wenn ungleiche Varianzen angenommen werden; die Freiheitsgrade werden über die Welch-Satterthwaite-Gleichung angenähert.

Result

t = \frac{( x ˉ _{1} - x ˉ _{2} ) - ( μ _{1} - μ _{2} )}{\frac{s _{1}^{2}}{n _{1}} + \frac{s _{2}^{2}}{n _{2}}}

Source: Welch, B. L. (1947). 'The generalization of 'Student's' problem when several different population variances are involved'.

Free formulas

Rearrangements

Solve for $\overset{x}{ˉ}_{1}$

Nach $\overset{x}{ˉ}$ _1 umstellen

\overset{x}{ˉ}_{1} = t \frac{s _{1}^{2}}{n _{1}} + \frac{s _{2}^{2}}{n _{2}} + \overset{x}{ˉ}_{2} + (μ_{1} - μ_{2})

Isolieren Sie den Mittelwert der ersten Stichprobe, indem Sie ihn mit dem Standardfehler multiplizieren und die anderen Terme hinzufügen.

Difficulty: 3/5

Solve for $\overset{x}{ˉ}_{2}$

Nach $\overset{x}{ˉ}$ _2 umstellen

\overset{x}{ˉ}_{2} = \overset{x}{ˉ}_{1} - (μ_{1} - μ_{2}) - t \frac{s _{1}^{2}}{n _{1}} + \frac{s _{2}^{2}}{n _{2}}

Stelle die Gleichung nach bar_ $x_{2}$ um.

Difficulty: 3/5

Solve for $μ_{1}$

Nach $μ_{1}$ umstellen

μ_{1} = (\overset{x}{ˉ}_{1} - \overset{x}{ˉ}_{2}) - t \frac{s _{1}^{2}}{n _{1}} + \frac{s _{2}^{2}}{n _{2}} + μ_{2}

Stelle die Gleichung nach $μ_{1}$ um.

Difficulty: 3/5

Solve for $μ_{2}$

Nach $μ_{2}$ umstellen

μ_{2} = μ_{1} - (\overset{x}{ˉ}_{1} - \overset{x}{ˉ}_{2}) + t \frac{s _{1}^{2}}{n _{1}} + \frac{s _{2}^{2}}{n _{2}}

Stelle die Gleichung nach $μ_{2}$ um.

Difficulty: 3/5

Solve for $s_{1}$

Nach $s_{1}$ umstellen

s_{1} = n_{1} ([\frac{( x ˉ _{1} - x ˉ _{2} ) - ( μ _{1} - μ _{2} )}{t}]^{2} - \frac{s _{2}^{2}}{n _{2}})

Isolieren Sie den ersten Stichprobenvarianzterm, indem Sie nach der algebraischen Isolierung beide Seiten quadrieren.

Difficulty: 5/5

Solve for $s_{2}$

Nach $s_{2}$ umstellen

s_{2} = n_{2} ([\frac{( x ˉ _{1} - x ˉ _{2} ) - ( μ _{1} - μ _{2} )}{t}]^{2} - \frac{s _{1}^{2}}{n _{1}})

Isolieren Sie den zweiten Stichprobenvarianzterm mit ähnlichen Schritten wie bei $s_{1}$ .

Difficulty: 5/5

Solve for $n_{1}$

Nach $n_{1}$ umstellen

n_{1} = \frac{s _{1}^{2}}{[ \frac{( x ˉ _{1} - x ˉ _{2} ) - ( μ _{1} - μ _{2} )}{t} ] ^{2} - \frac{s _{2}^{2}}{n _{2}}}

Stelle die Gleichung nach $n_{1}$ um.

Difficulty: 5/5

Solve for $n_{2}$

Nach $n_{2}$ umstellen

n_{2} = \frac{s _{2}^{2}}{[ \frac{( x ˉ _{1} - x ˉ _{2} ) - ( μ _{1} - μ _{2} )}{t} ] ^{2} - \frac{s _{1}^{2}}{n _{1}}}

Stelle die Gleichung nach $n_{2}$ um.

Difficulty: 5/5

The static page shows the finished rearrangements. The app keeps the full worked algebra walkthrough.

Why it behaves this way

Intuition

Stellen Sie sich zwei unterschiedliche glockenförmige Wahrscheinlichkeitsverteilungen vor, die auf einer Zahlenlinie schweben. Der Zähler misst den physikalischen Abstand zwischen ihren Spitzen (Mittelpunkten). Der Nenner fungiert als „Lineal“, das basierend auf der Streuung (Unsicherheit/Varianz) der beiden Verteilungen schrumpft oder expandiert; Die T-Statistik ist die Anzahl der „Lineallängen“, um die die beiden Peaks getrennt sind.

Term

t-Statistik

Ein Signal-Rausch-Verhältnis: Sie gibt an, um wie viele Standardfehler der beobachtete Unterschied von dem hypothetischen Unterschied entfernt ist.

Term

Unterschied in der Stichprobe bedeutet

Das „Signal“ oder der rohe beobachtete Unterschied zwischen den durchschnittlichen Ergebnissen der beiden Gruppen.

Term

Hypothetischer Unterschied in der Bevölkerung bedeutet

Die „Null-Basislinie“; normalerweise Null, was die Annahme darstellt, dass es keinen wirklichen Unterschied zwischen den Gruppen gibt.

Term

Summe der quadrierten Standardfehler

Das gesamte „Rauschen“ oder die Unsicherheit in unserer Schätzung, kombiniert, wie stark jede Gruppe variiert (s²), skaliert durch die Anzahl der Datenpunkte, die wir haben (n).

Signs and relationships

x̄₁ - x̄₂: Die Subtraktion definiert die Richtung der Differenz; Ein positives Ergebnis zeigt an, dass der Mittelwert der ersten Gruppe höher ist, während ein negatives Ergebnis anzeigt, dass der Mittelwert der zweiten Gruppe höher ist.
Nenner-Quadratwurzel: Wir summieren Varianzen (s²/n) und nicht Standardabweichungen, da Varianzen additiv sind; Durch Ziehen der Quadratwurzel wird die Gesamtvarianz wieder in die gleichen Einheiten wie der Mittelwert (Standardfehler) umgewandelt.

One free problem

Practice Problem

Zwei Gruppen werden getestet. Gruppe 1: Mittelwert=50, $s^{2}$ =10, n=20. Gruppe 2: Mittelwert=45, $s^{2}$ =12, n=25. Unter der Annahme, dass der hypothetische Unterschied (mu1-mu2) gleich 0 ist, wie groß ist die t-Statistik?

Hint: Berechne den Nenner, indem du s1^2/n1 und s2^2/n2 addierst und dann die Quadratwurzel ziehst.

The full worked solution stays in the interactive walkthrough.

Where it shows up

Real-World Context

Ein medizinischer Forscher vergleicht die durchschnittliche Erholungszeit von Patienten mit einem neuen Medikament mit einer Placebogruppe, um zu prüfen, ob das Medikament die Erholung signifikant beeinflusst.

Study smarter

Tips

Prüfe immer auf Normalverteilung, wenn die Stichproben klein sind, also n < 30.
Verwende die Welch-Satterthwaite-Gleichung, um die Freiheitsgrade dieses Tests zu berechnen.
Stelle sicher, dass die Stichproben unabhängig sind, also die Auswahl einer Person die Auswahl einer anderen nicht beeinflusst.

Avoid these traps

Common Mistakes

Gleiche Varianzen anzunehmen, wenn sich Stichprobengrößen oder Verteilungen deutlich unterscheiden.
Nicht zu bestätigen, dass die Stichproben wirklich unabhängig sind, etwa wenn der Test auf gepaarte Daten angewendet wird.
Die Standardformel mit gepoolter Varianz anstelle der ungepoolten Version zu verwenden.

Keep going

Related Formulas

Common questions

Frequently Asked Questions

Diese Herleitung nutzt die Eigenschaften von Stichprobenverteilungen, um eine Teststatistik zu konstruieren, die einer t-Verteilung folgt, indem die Differenz zwischen zwei Stichprobenmittelwerten standardisiert wird.

Verwende diesen Test, wenn du die Mittelwerte zweier unabhängiger Gruppen vergleichen möchtest, die Populationsstandardabweichungen unbekannt sind und du keine gleichen Varianzen annehmen kannst.

Er ist ein grundlegendes Werkzeug in der wissenschaftlichen Forschung und beim A/B-Testing und erlaubt Analysten, aus begrenzten Stichprobendaten auf Unterschiede in Populationen zu schließen, ohne Varianzhomogenität vorauszusetzen.

Gleiche Varianzen anzunehmen, wenn sich Stichprobengrößen oder Verteilungen deutlich unterscheiden. Nicht zu bestätigen, dass die Stichproben wirklich unabhängig sind, etwa wenn der Test auf gepaarte Daten angewendet wird. Die Standardformel mit gepoolter Varianz anstelle der ungepoolten Version zu verwenden.

Ein medizinischer Forscher vergleicht die durchschnittliche Erholungszeit von Patienten mit einem neuen Medikament mit einer Placebogruppe, um zu prüfen, ob das Medikament die Erholung signifikant beeinflusst.

Prüfe immer auf Normalverteilung, wenn die Stichproben klein sind, also n < 30. Verwende die Welch-Satterthwaite-Gleichung, um die Freiheitsgrade dieses Tests zu berechnen. Stelle sicher, dass die Stichproben unabhängig sind, also die Auswahl einer Person die Auswahl einer anderen nicht beeinflusst.

References

Sources

Rice, J. A. (2006). Mathematical Statistics and Data Analysis.
Welch, B. L. (1947). The generalization of 'Student's' problem when several different population variances are involved.
Welch, B. L. (1947). 'The generalization of 'Student's' problem when several different population variances are involved'.

Overview

Variables

Derivation

Definition der Stichprobenverteilung der Differenz der Mittelwerte

Standardisierung (Z-Score)

Substitution der Stichprobenvarianzen

Rearrangements

Intuition

Practice Problem

Real-World Context

Tips

Common Mistakes

Related Formulas

One-Sample t-Test

Pooled Two-Sample t-Test

Frequently Asked Questions

Sources