सरल रैखिक प्रतिगमन रेखा
यह समीकरण सर्वश्रेष्ठ फिट की रेखा को परिभाषित करता है जो दो चर के बीच रैखिक संबंध के लिए प्रेक्षित और अनुमानित मानों के बीच अवशेषों के वर्ग के योग को न्यूनतम करता है।
This public page keeps the free explanation visible and leaves premium worked solving, advanced walkthroughs, and saved study tools inside the app.
Core idea
Overview
प्रतिगमन रेखा की गणना सामान्य न्यूनतम वर्ग (OLS) विधि का उपयोग करके की जाती है, जो त्रुटियों के प्रसरण को कम करने की कोशिश करती है। ढलान (slope), b1, x में प्रति इकाई परिवर्तन पर y में अपेक्षित परिवर्तन का प्रतिनिधित्व करता है, जबकि अवरोधन (intercept), b0, x के शून्य होने पर y के अनुमानित मान को इंगित करता है। एक साथ, ये पैरामीटर डेटासेट के भीतर रैखिक प्रवृत्ति को दर्शाते हैं।
When to use: इसका उपयोग तब करें जब आपको दो निरंतर चर के बीच संबंध को मॉडल करने और रैखिक प्रवृत्तियों के आधार पर भविष्य के परिणामों का अनुमान लगाने की आवश्यकता हो।
Why it matters: यह पूर्वानुमानित विश्लेषण का मौलिक उपकरण है, जो शोधकर्ताओं और व्यवसायों को प्रवृत्तियों का पूर्वानुमान लगाने और चर के बीच संबंधों की ताकत को मापने में सक्षम बनाता है।
Symbols
Variables
y^ = Predicted Value, = Slope, = Y-Intercept, x = Independent Variable, n = Sample Size
Walkthrough
Derivation
सरल रैखिक प्रतिगमन रेखा
यह व्युत्पत्ति प्रेक्षित डेटा बिंदुओं और रैखिक प्रतिगमन मॉडल के बीच अवशिष्टों के वर्गित योग को कम करने के लिए न्यूनतम वर्ग विधि का उपयोग करती है।
- चर x और y के बीच संबंध रैखिक है।
- त्रुटियां शून्य माध्य के साथ स्वतंत्र और समान रूप से वितरित हैं।
वर्गित अवशिष्टों का योग (SSR) परिभाषित करें
हम उद्देश्य फ़ंक्शन एस को प्रत्येक प्रेक्षित डेटा बिंदु और प्रतिगमन रेखा पर अनुमानित मान के बीच लंबवत दूरियों के वर्गों के योग के रूप में परिभाषित करते हैं।
Note: वर्गित अवशिष्टों को कम करने से यह सुनिश्चित होता है कि सकारात्मक और नकारात्मक विचलन एक दूसरे को रद्द नहीं करते हैं।
b_0 के संबंध में आंशिक अवकलन
एस को कम करने के लिए, हम के संबंध में आंशिक व्युत्पन्न लेते हैं और इसे शून्य पर सेट करते हैं, जिससे अवरोधन के लिए सामान्य समीकरण प्राप्त होता है।
Note: इसे सरल बनाने पर समीकरण = - \bar{x} प्राप्त होता है।
b_1 के संबंध में आंशिक अवकलन
हम त्रुटि को कम करने वाले ढलान को खोजने के लिए के संबंध में आंशिक व्युत्पन्न लेते हैं और इसे शून्य पर सेट करते हैं।
Note: को अलग करने के लिए पिछले चरण से के व्यंजक को इस समीकरण में प्रतिस्थापित करें।
b_1 के लिए समीकरण हल करें
दूसरे सामान्य समीकरण में को प्रतिस्थापित करके और बीजगणितीय रूप से हल करके, हम ढलान गुणांक के लिए कम्प्यूटेशनल सूत्र व्युत्पन्न करते हैं।
Note: यह के बराबर है।
Result
Source: Montgomery, D. C., Peck, E. A., & Vining, G. G. (2012). Introduction to Linear Regression Analysis.
Why it behaves this way
Intuition
डेटा बिंदुओं के स्कैटर प्लॉट को उड़ने वाले कणों के बादल के रूप में कल्पना करें। प्रतिगमन रेखा बादल के केंद्र से गुजरती हुई एक कठोर, भारित छड़ी की तरह कार्य करती है। सूत्र एक 'गुरुत्वाकर्षण' तंत्र के रूप में कार्य करता है जो इस छड़ी को तब तक घुमाता और शिफ्ट करता है जब तक कि छड़ी और बादल में प्रत्येक बिंदु के बीच लंबवत दूरियों (वर्गित) का योग पूर्ण न्यूनतम पर न हो जाए।
Signs and relationships
- b_1: का चिह्न संबंध की दिशा को इंगित करता है: सकारात्मक का मतलब है कि दोनों चर एक ही दिशा में चलते हैं, जबकि नकारात्मक का मतलब एक व्युत्क्रम संबंध है।
- b_0: यह एक योज्य स्थिरांक है जो पूरी रेखा को लंबवत रूप से स्थानांतरित करता है, यह सुनिश्चित करता है कि रेखा डेटा के सेंट्रोइड (माध्य) से होकर गुजरती है।
One free problem
Practice Problem
दिए गए डेटा बिंदु (1, 2), (2, 3), और (3, 5) के लिए, प्रतिगमन रेखा की ढलान b1 की गणना करें।
Hint: अंश n*sum(xy) - sum(x)*sum(y) और हर n*sum() - (sum(x))^2 को अलग-अलग गणना करें।
The full worked solution stays in the interactive walkthrough.
Where it shows up
Real-World Context
एक अर्थशास्त्री विपणन व्यय और कुल बिक्री राजस्व के बीच संबंध को मॉडल करने के लिए इस समीकरण का उपयोग करता है ताकि यह अनुमान लगाया जा सके कि एक विशिष्ट बजट कितना राजस्व उत्पन्न करेगा।
Study smarter
Tips
- हमेशा पहले एक स्कैटर प्लॉट बनाएं ताकि यह सुनिश्चित हो सके कि संबंध वास्तव में रैखिक है।
- आउटलायर्स (outliers) की जाँच करें, क्योंकि वे प्रतिगमन रेखा की ढलान को असमान रूप से प्रभावित कर सकते हैं।
- रैखिक संबंध की ताकत और दिशा को मापने के लिए सहसंबंध गुणांक (r) की गणना करें।
Avoid these traps
Common Mistakes
- यह मान लेना कि एक मजबूत सहसंबंध कार्य-कारण (causation) को दर्शाता है।
- प्रेक्षित x डेटा की सीमा से बहुत आगे प्रतिगमन रेखा को बाहर निकालना (extrapolating)।
Common questions
Frequently Asked Questions
यह व्युत्पत्ति प्रेक्षित डेटा बिंदुओं और रैखिक प्रतिगमन मॉडल के बीच अवशिष्टों के वर्गित योग को कम करने के लिए न्यूनतम वर्ग विधि का उपयोग करती है।
इसका उपयोग तब करें जब आपको दो निरंतर चर के बीच संबंध को मॉडल करने और रैखिक प्रवृत्तियों के आधार पर भविष्य के परिणामों का अनुमान लगाने की आवश्यकता हो।
यह पूर्वानुमानित विश्लेषण का मौलिक उपकरण है, जो शोधकर्ताओं और व्यवसायों को प्रवृत्तियों का पूर्वानुमान लगाने और चर के बीच संबंधों की ताकत को मापने में सक्षम बनाता है।
यह मान लेना कि एक मजबूत सहसंबंध कार्य-कारण (causation) को दर्शाता है। प्रेक्षित x डेटा की सीमा से बहुत आगे प्रतिगमन रेखा को बाहर निकालना (extrapolating)।
एक अर्थशास्त्री विपणन व्यय और कुल बिक्री राजस्व के बीच संबंध को मॉडल करने के लिए इस समीकरण का उपयोग करता है ताकि यह अनुमान लगाया जा सके कि एक विशिष्ट बजट कितना राजस्व उत्पन्न करेगा।
हमेशा पहले एक स्कैटर प्लॉट बनाएं ताकि यह सुनिश्चित हो सके कि संबंध वास्तव में रैखिक है। आउटलायर्स (outliers) की जाँच करें, क्योंकि वे प्रतिगमन रेखा की ढलान को असमान रूप से प्रभावित कर सकते हैं। रैखिक संबंध की ताकत और दिशा को मापने के लिए सहसंबंध गुणांक (r) की गणना करें।
References
Sources
- Montgomery, D. C., Peck, E. A., & Vining, G. G. (2012). Introduction to Linear Regression Analysis.
- Freedman, D., Pisani, R., & Purves, R. (2007). Statistics.