t-Test-Statistik für zwei Stichproben (unabhängige Stichproben)
Diese Statistik bestimmt, ob der Unterschied zwischen den Mittelwerten zweier unabhängiger Gruppen statistisch signifikant ist, wenn die Populationsvarianzen unbekannt sind.
This public page keeps the free explanation visible and leaves premium worked solving, advanced walkthroughs, and saved study tools inside the app.
Core idea
Overview
Auch als Welch-t-Test bekannt, wird diese Formel verwendet, um die Mittelwerte zweier unabhängiger Stichproben unter der Annahme ungleicher Varianzen zu vergleichen. Sie misst den Abstand zwischen dem beobachteten Unterschied der Stichprobenmittelwerte und dem hypothetischen Populationsunterschied in Einheiten des Standardfehlers. Der resultierende t-Wert wird dann mit einer t-Verteilung verglichen, um den p-Wert zu bestimmen.
When to use: Verwende diesen Test, wenn du die Mittelwerte zweier unabhängiger Gruppen vergleichen möchtest, die Populationsstandardabweichungen unbekannt sind und du keine gleichen Varianzen annehmen kannst.
Why it matters: Er ist ein grundlegendes Werkzeug in der wissenschaftlichen Forschung und beim A/B-Testing und erlaubt Analysten, aus begrenzten Stichprobendaten auf Unterschiede in Populationen zu schließen, ohne Varianzhomogenität vorauszusetzen.
Symbols
Variables
t = t-statistic, _1 = Mean of sample 1, _2 = Mean of sample 2, = Variance of sample 1, = Variance of sample 2
Walkthrough
Derivation
Herleitung der Prüfgröße des t-Tests für zwei Stichproben (unabhängige Stichproben)
Diese Herleitung nutzt die Eigenschaften von Stichprobenverteilungen, um eine Teststatistik zu konstruieren, die einer t-Verteilung folgt, indem die Differenz zwischen zwei Stichprobenmittelwerten standardisiert wird.
- Die beiden Stichproben sind voneinander unabhängig.
- Die Grundgesamtheiten, aus denen die Stichproben gezogen werden, sind annähernd normalverteilt.
- Die Populationsvarianzen sind unbekannt, was die Verwendung von Stichprobenvarianzen als Schätzwerte erforderlich macht.
Definition der Stichprobenverteilung der Differenz der Mittelwerte
Da die Stichprobenmittelwerte unabhängiger normalverteilter Populationen selbst normalverteilt sind, folgt ihre Differenz einer Normalverteilung, die bei der Differenz der Populationsmittelwerte mit einer kombinierten Varianz zentriert ist.
Note: Die Varianz der Differenz zweier unabhängiger Variablen ist die Summe ihrer Einzelvarianzen.
Standardisierung (Z-Score)
Wir transformieren die Differenz der Stichprobenmittelwerte in eine Standardnormalvariable, indem wir den Erwartungswert subtrahieren und durch den Standardfehler dividieren.
Note: Dieser Schritt erfordert die Kenntnis der Populationsvarianzen, die gewöhnlich unbekannt sind.
Substitution der Stichprobenvarianzen
Da die Populationsvarianzen unbekannt sind, ersetzen wir sie durch die Stichprobenvarianzen und . Diese Substitution wandelt die Z-Verteilung in eine t-Verteilung um.
Note: Dies wird als Welch-t-Test bezeichnet, wenn ungleiche Varianzen angenommen werden; die Freiheitsgrade werden über die Welch-Satterthwaite-Gleichung angenähert.
Result
Source: Welch, B. L. (1947). 'The generalization of 'Student's' problem when several different population variances are involved'.
Free formulas
Rearrangements
Solve for
Nach _1 umstellen
Isolieren Sie den Mittelwert der ersten Stichprobe, indem Sie ihn mit dem Standardfehler multiplizieren und die anderen Terme hinzufügen.
Difficulty: 3/5
Solve for
Nach _2 umstellen
Stelle die Gleichung nach bar_ um.
Difficulty: 3/5
Solve for
Nach umstellen
Stelle die Gleichung nach um.
Difficulty: 3/5
Solve for
Nach umstellen
Stelle die Gleichung nach um.
Difficulty: 3/5
Solve for
Nach umstellen
Isolieren Sie den ersten Stichprobenvarianzterm, indem Sie nach der algebraischen Isolierung beide Seiten quadrieren.
Difficulty: 5/5
Solve for
Nach umstellen
Isolieren Sie den zweiten Stichprobenvarianzterm mit ähnlichen Schritten wie bei .
Difficulty: 5/5
Solve for
Nach umstellen
Stelle die Gleichung nach um.
Difficulty: 5/5
Solve for
Nach umstellen
Stelle die Gleichung nach um.
Difficulty: 5/5
The static page shows the finished rearrangements. The app keeps the full worked algebra walkthrough.
Why it behaves this way
Intuition
Stellen Sie sich zwei unterschiedliche glockenförmige Wahrscheinlichkeitsverteilungen vor, die auf einer Zahlenlinie schweben. Der Zähler misst den physikalischen Abstand zwischen ihren Spitzen (Mittelpunkten). Der Nenner fungiert als „Lineal“, das basierend auf der Streuung (Unsicherheit/Varianz) der beiden Verteilungen schrumpft oder expandiert; Die T-Statistik ist die Anzahl der „Lineallängen“, um die die beiden Peaks getrennt sind.
Signs and relationships
- x̄₁ - x̄₂: Die Subtraktion definiert die Richtung der Differenz; Ein positives Ergebnis zeigt an, dass der Mittelwert der ersten Gruppe höher ist, während ein negatives Ergebnis anzeigt, dass der Mittelwert der zweiten Gruppe höher ist.
- Nenner-Quadratwurzel: Wir summieren Varianzen (s²/n) und nicht Standardabweichungen, da Varianzen additiv sind; Durch Ziehen der Quadratwurzel wird die Gesamtvarianz wieder in die gleichen Einheiten wie der Mittelwert (Standardfehler) umgewandelt.
One free problem
Practice Problem
Zwei Gruppen werden getestet. Gruppe 1: Mittelwert=50, =10, n=20. Gruppe 2: Mittelwert=45, =12, n=25. Unter der Annahme, dass der hypothetische Unterschied (mu1-mu2) gleich 0 ist, wie groß ist die t-Statistik?
Hint: Berechne den Nenner, indem du s1^2/n1 und s2^2/n2 addierst und dann die Quadratwurzel ziehst.
The full worked solution stays in the interactive walkthrough.
Where it shows up
Real-World Context
Ein medizinischer Forscher vergleicht die durchschnittliche Erholungszeit von Patienten mit einem neuen Medikament mit einer Placebogruppe, um zu prüfen, ob das Medikament die Erholung signifikant beeinflusst.
Study smarter
Tips
- Prüfe immer auf Normalverteilung, wenn die Stichproben klein sind, also n < 30.
- Verwende die Welch-Satterthwaite-Gleichung, um die Freiheitsgrade dieses Tests zu berechnen.
- Stelle sicher, dass die Stichproben unabhängig sind, also die Auswahl einer Person die Auswahl einer anderen nicht beeinflusst.
Avoid these traps
Common Mistakes
- Gleiche Varianzen anzunehmen, wenn sich Stichprobengrößen oder Verteilungen deutlich unterscheiden.
- Nicht zu bestätigen, dass die Stichproben wirklich unabhängig sind, etwa wenn der Test auf gepaarte Daten angewendet wird.
- Die Standardformel mit gepoolter Varianz anstelle der ungepoolten Version zu verwenden.
Common questions
Frequently Asked Questions
Diese Herleitung nutzt die Eigenschaften von Stichprobenverteilungen, um eine Teststatistik zu konstruieren, die einer t-Verteilung folgt, indem die Differenz zwischen zwei Stichprobenmittelwerten standardisiert wird.
Verwende diesen Test, wenn du die Mittelwerte zweier unabhängiger Gruppen vergleichen möchtest, die Populationsstandardabweichungen unbekannt sind und du keine gleichen Varianzen annehmen kannst.
Er ist ein grundlegendes Werkzeug in der wissenschaftlichen Forschung und beim A/B-Testing und erlaubt Analysten, aus begrenzten Stichprobendaten auf Unterschiede in Populationen zu schließen, ohne Varianzhomogenität vorauszusetzen.
Gleiche Varianzen anzunehmen, wenn sich Stichprobengrößen oder Verteilungen deutlich unterscheiden. Nicht zu bestätigen, dass die Stichproben wirklich unabhängig sind, etwa wenn der Test auf gepaarte Daten angewendet wird. Die Standardformel mit gepoolter Varianz anstelle der ungepoolten Version zu verwenden.
Ein medizinischer Forscher vergleicht die durchschnittliche Erholungszeit von Patienten mit einem neuen Medikament mit einer Placebogruppe, um zu prüfen, ob das Medikament die Erholung signifikant beeinflusst.
Prüfe immer auf Normalverteilung, wenn die Stichproben klein sind, also n < 30. Verwende die Welch-Satterthwaite-Gleichung, um die Freiheitsgrade dieses Tests zu berechnen. Stelle sicher, dass die Stichproben unabhängig sind, also die Auswahl einer Person die Auswahl einer anderen nicht beeinflusst.
References
Sources
- Rice, J. A. (2006). Mathematical Statistics and Data Analysis.
- Welch, B. L. (1947). The generalization of 'Student's' problem when several different population variances are involved.
- Welch, B. L. (1947). 'The generalization of 'Student's' problem when several different population variances are involved'.