MathematicsInferenzstatistikUniversity

t-Test-Statistik für zwei Stichproben (unabhängige Stichproben)

Diese Statistik bestimmt, ob der Unterschied zwischen den Mittelwerten zweier unabhängiger Gruppen statistisch signifikant ist, wenn die Populationsvarianzen unbekannt sind.

Understand the formulaSee the free derivationOpen the full walkthrough

This public page keeps the free explanation visible and leaves premium worked solving, advanced walkthroughs, and saved study tools inside the app.

Core idea

Overview

Auch als Welch-t-Test bekannt, wird diese Formel verwendet, um die Mittelwerte zweier unabhängiger Stichproben unter der Annahme ungleicher Varianzen zu vergleichen. Sie misst den Abstand zwischen dem beobachteten Unterschied der Stichprobenmittelwerte und dem hypothetischen Populationsunterschied in Einheiten des Standardfehlers. Der resultierende t-Wert wird dann mit einer t-Verteilung verglichen, um den p-Wert zu bestimmen.

When to use: Verwende diesen Test, wenn du die Mittelwerte zweier unabhängiger Gruppen vergleichen möchtest, die Populationsstandardabweichungen unbekannt sind und du keine gleichen Varianzen annehmen kannst.

Why it matters: Er ist ein grundlegendes Werkzeug in der wissenschaftlichen Forschung und beim A/B-Testing und erlaubt Analysten, aus begrenzten Stichprobendaten auf Unterschiede in Populationen zu schließen, ohne Varianzhomogenität vorauszusetzen.

Symbols

Variables

t = t-statistic, _1 = Mean of sample 1, _2 = Mean of sample 2, = Variance of sample 1, = Variance of sample 2

t-statistic
Variable
Mean of sample 1
Variable
Mean of sample 2
Variable
Variance of sample 1
Variable
Variance of sample 2
Variable
Size of sample 1
Variable
Size of sample 2
Variable
diff
Hypothesized difference
Variable

Walkthrough

Derivation

Herleitung der Prüfgröße des t-Tests für zwei Stichproben (unabhängige Stichproben)

Diese Herleitung nutzt die Eigenschaften von Stichprobenverteilungen, um eine Teststatistik zu konstruieren, die einer t-Verteilung folgt, indem die Differenz zwischen zwei Stichprobenmittelwerten standardisiert wird.

  • Die beiden Stichproben sind voneinander unabhängig.
  • Die Grundgesamtheiten, aus denen die Stichproben gezogen werden, sind annähernd normalverteilt.
  • Die Populationsvarianzen sind unbekannt, was die Verwendung von Stichprobenvarianzen als Schätzwerte erforderlich macht.
1

Definition der Stichprobenverteilung der Differenz der Mittelwerte

Da die Stichprobenmittelwerte unabhängiger normalverteilter Populationen selbst normalverteilt sind, folgt ihre Differenz einer Normalverteilung, die bei der Differenz der Populationsmittelwerte mit einer kombinierten Varianz zentriert ist.

Note: Die Varianz der Differenz zweier unabhängiger Variablen ist die Summe ihrer Einzelvarianzen.

2

Standardisierung (Z-Score)

Wir transformieren die Differenz der Stichprobenmittelwerte in eine Standardnormalvariable, indem wir den Erwartungswert subtrahieren und durch den Standardfehler dividieren.

Note: Dieser Schritt erfordert die Kenntnis der Populationsvarianzen, die gewöhnlich unbekannt sind.

3

Substitution der Stichprobenvarianzen

Da die Populationsvarianzen unbekannt sind, ersetzen wir sie durch die Stichprobenvarianzen und . Diese Substitution wandelt die Z-Verteilung in eine t-Verteilung um.

Note: Dies wird als Welch-t-Test bezeichnet, wenn ungleiche Varianzen angenommen werden; die Freiheitsgrade werden über die Welch-Satterthwaite-Gleichung angenähert.

Result

Source: Welch, B. L. (1947). 'The generalization of 'Student's' problem when several different population variances are involved'.

Free formulas

Rearrangements

Solve for

Nach _1 umstellen

Isolieren Sie den Mittelwert der ersten Stichprobe, indem Sie ihn mit dem Standardfehler multiplizieren und die anderen Terme hinzufügen.

Difficulty: 3/5

Solve for

Nach _2 umstellen

Stelle die Gleichung nach bar_ um.

Difficulty: 3/5

Solve for

Nach umstellen

Stelle die Gleichung nach um.

Difficulty: 3/5

Solve for

Nach umstellen

Stelle die Gleichung nach um.

Difficulty: 3/5

Solve for

Nach umstellen

Isolieren Sie den ersten Stichprobenvarianzterm, indem Sie nach der algebraischen Isolierung beide Seiten quadrieren.

Difficulty: 5/5

Solve for

Nach umstellen

Isolieren Sie den zweiten Stichprobenvarianzterm mit ähnlichen Schritten wie bei .

Difficulty: 5/5

Solve for

Nach umstellen

Stelle die Gleichung nach um.

Difficulty: 5/5

Solve for

Nach umstellen

Stelle die Gleichung nach um.

Difficulty: 5/5

The static page shows the finished rearrangements. The app keeps the full worked algebra walkthrough.

Why it behaves this way

Intuition

Stellen Sie sich zwei unterschiedliche glockenförmige Wahrscheinlichkeitsverteilungen vor, die auf einer Zahlenlinie schweben. Der Zähler misst den physikalischen Abstand zwischen ihren Spitzen (Mittelpunkten). Der Nenner fungiert als „Lineal“, das basierend auf der Streuung (Unsicherheit/Varianz) der beiden Verteilungen schrumpft oder expandiert; Die T-Statistik ist die Anzahl der „Lineallängen“, um die die beiden Peaks getrennt sind.

Term
t-Statistik
Ein Signal-Rausch-Verhältnis: Sie gibt an, um wie viele Standardfehler der beobachtete Unterschied von dem hypothetischen Unterschied entfernt ist.
Term
Unterschied in der Stichprobe bedeutet
Das „Signal“ oder der rohe beobachtete Unterschied zwischen den durchschnittlichen Ergebnissen der beiden Gruppen.
Term
Hypothetischer Unterschied in der Bevölkerung bedeutet
Die „Null-Basislinie“; normalerweise Null, was die Annahme darstellt, dass es keinen wirklichen Unterschied zwischen den Gruppen gibt.
Term
Summe der quadrierten Standardfehler
Das gesamte „Rauschen“ oder die Unsicherheit in unserer Schätzung, kombiniert, wie stark jede Gruppe variiert (s²), skaliert durch die Anzahl der Datenpunkte, die wir haben (n).

Signs and relationships

  • x̄₁ - x̄₂: Die Subtraktion definiert die Richtung der Differenz; Ein positives Ergebnis zeigt an, dass der Mittelwert der ersten Gruppe höher ist, während ein negatives Ergebnis anzeigt, dass der Mittelwert der zweiten Gruppe höher ist.
  • Nenner-Quadratwurzel: Wir summieren Varianzen (s²/n) und nicht Standardabweichungen, da Varianzen additiv sind; Durch Ziehen der Quadratwurzel wird die Gesamtvarianz wieder in die gleichen Einheiten wie der Mittelwert (Standardfehler) umgewandelt.

One free problem

Practice Problem

Zwei Gruppen werden getestet. Gruppe 1: Mittelwert=50, =10, n=20. Gruppe 2: Mittelwert=45, =12, n=25. Unter der Annahme, dass der hypothetische Unterschied (mu1-mu2) gleich 0 ist, wie groß ist die t-Statistik?

Hint: Berechne den Nenner, indem du s1^2/n1 und s2^2/n2 addierst und dann die Quadratwurzel ziehst.

The full worked solution stays in the interactive walkthrough.

Where it shows up

Real-World Context

Ein medizinischer Forscher vergleicht die durchschnittliche Erholungszeit von Patienten mit einem neuen Medikament mit einer Placebogruppe, um zu prüfen, ob das Medikament die Erholung signifikant beeinflusst.

Study smarter

Tips

  • Prüfe immer auf Normalverteilung, wenn die Stichproben klein sind, also n < 30.
  • Verwende die Welch-Satterthwaite-Gleichung, um die Freiheitsgrade dieses Tests zu berechnen.
  • Stelle sicher, dass die Stichproben unabhängig sind, also die Auswahl einer Person die Auswahl einer anderen nicht beeinflusst.

Avoid these traps

Common Mistakes

  • Gleiche Varianzen anzunehmen, wenn sich Stichprobengrößen oder Verteilungen deutlich unterscheiden.
  • Nicht zu bestätigen, dass die Stichproben wirklich unabhängig sind, etwa wenn der Test auf gepaarte Daten angewendet wird.
  • Die Standardformel mit gepoolter Varianz anstelle der ungepoolten Version zu verwenden.

Common questions

Frequently Asked Questions

Diese Herleitung nutzt die Eigenschaften von Stichprobenverteilungen, um eine Teststatistik zu konstruieren, die einer t-Verteilung folgt, indem die Differenz zwischen zwei Stichprobenmittelwerten standardisiert wird.

Verwende diesen Test, wenn du die Mittelwerte zweier unabhängiger Gruppen vergleichen möchtest, die Populationsstandardabweichungen unbekannt sind und du keine gleichen Varianzen annehmen kannst.

Er ist ein grundlegendes Werkzeug in der wissenschaftlichen Forschung und beim A/B-Testing und erlaubt Analysten, aus begrenzten Stichprobendaten auf Unterschiede in Populationen zu schließen, ohne Varianzhomogenität vorauszusetzen.

Gleiche Varianzen anzunehmen, wenn sich Stichprobengrößen oder Verteilungen deutlich unterscheiden. Nicht zu bestätigen, dass die Stichproben wirklich unabhängig sind, etwa wenn der Test auf gepaarte Daten angewendet wird. Die Standardformel mit gepoolter Varianz anstelle der ungepoolten Version zu verwenden.

Ein medizinischer Forscher vergleicht die durchschnittliche Erholungszeit von Patienten mit einem neuen Medikament mit einer Placebogruppe, um zu prüfen, ob das Medikament die Erholung signifikant beeinflusst.

Prüfe immer auf Normalverteilung, wenn die Stichproben klein sind, also n < 30. Verwende die Welch-Satterthwaite-Gleichung, um die Freiheitsgrade dieses Tests zu berechnen. Stelle sicher, dass die Stichproben unabhängig sind, also die Auswahl einer Person die Auswahl einer anderen nicht beeinflusst.

References

Sources

  1. Rice, J. A. (2006). Mathematical Statistics and Data Analysis.
  2. Welch, B. L. (1947). The generalization of 'Student's' problem when several different population variances are involved.
  3. Welch, B. L. (1947). 'The generalization of 'Student's' problem when several different population variances are involved'.