Mathematicsसांख्यिकी और प्रतिगमन विश्लेषणUniversity

सरल रैखिक प्रतिगमन रेखा

यह समीकरण सर्वश्रेष्ठ फिट की रेखा को परिभाषित करता है जो दो चर के बीच रैखिक संबंध के लिए प्रेक्षित और अनुमानित मानों के बीच अवशेषों के वर्ग के योग को न्यूनतम करता है।

Understand the formulaSee the free derivationOpen the full walkthrough

This public page keeps the free explanation visible and leaves premium worked solving, advanced walkthroughs, and saved study tools inside the app.

Core idea

Overview

प्रतिगमन रेखा की गणना सामान्य न्यूनतम वर्ग (OLS) विधि का उपयोग करके की जाती है, जो त्रुटियों के प्रसरण को कम करने की कोशिश करती है। ढलान (slope), b1, x में प्रति इकाई परिवर्तन पर y में अपेक्षित परिवर्तन का प्रतिनिधित्व करता है, जबकि अवरोधन (intercept), b0, x के शून्य होने पर y के अनुमानित मान को इंगित करता है। एक साथ, ये पैरामीटर डेटासेट के भीतर रैखिक प्रवृत्ति को दर्शाते हैं।

When to use: इसका उपयोग तब करें जब आपको दो निरंतर चर के बीच संबंध को मॉडल करने और रैखिक प्रवृत्तियों के आधार पर भविष्य के परिणामों का अनुमान लगाने की आवश्यकता हो।

Why it matters: यह पूर्वानुमानित विश्लेषण का मौलिक उपकरण है, जो शोधकर्ताओं और व्यवसायों को प्रवृत्तियों का पूर्वानुमान लगाने और चर के बीच संबंधों की ताकत को मापने में सक्षम बनाता है।

Symbols

Variables

y^ = Predicted Value, = Slope, = Y-Intercept, x = Independent Variable, n = Sample Size

y^
Predicted Value
Variable
Slope
Variable
Y-Intercept
Variable
Independent Variable
Variable
Sample Size
Variable
\hat{y}
Variable

Walkthrough

Derivation

सरल रैखिक प्रतिगमन रेखा

यह व्युत्पत्ति प्रेक्षित डेटा बिंदुओं और रैखिक प्रतिगमन मॉडल के बीच अवशिष्टों के वर्गित योग को कम करने के लिए न्यूनतम वर्ग विधि का उपयोग करती है।

  • चर x और y के बीच संबंध रैखिक है।
  • त्रुटियां शून्य माध्य के साथ स्वतंत्र और समान रूप से वितरित हैं।
1

वर्गित अवशिष्टों का योग (SSR) परिभाषित करें

हम उद्देश्य फ़ंक्शन एस को प्रत्येक प्रेक्षित डेटा बिंदु और प्रतिगमन रेखा पर अनुमानित मान के बीच लंबवत दूरियों के वर्गों के योग के रूप में परिभाषित करते हैं।

Note: वर्गित अवशिष्टों को कम करने से यह सुनिश्चित होता है कि सकारात्मक और नकारात्मक विचलन एक दूसरे को रद्द नहीं करते हैं।

2

b_0 के संबंध में आंशिक अवकलन

एस को कम करने के लिए, हम के संबंध में आंशिक व्युत्पन्न लेते हैं और इसे शून्य पर सेट करते हैं, जिससे अवरोधन के लिए सामान्य समीकरण प्राप्त होता है।

Note: इसे सरल बनाने पर समीकरण = - \bar{x} प्राप्त होता है।

3

b_1 के संबंध में आंशिक अवकलन

हम त्रुटि को कम करने वाले ढलान को खोजने के लिए के संबंध में आंशिक व्युत्पन्न लेते हैं और इसे शून्य पर सेट करते हैं।

Note: को अलग करने के लिए पिछले चरण से के व्यंजक को इस समीकरण में प्रतिस्थापित करें।

4

b_1 के लिए समीकरण हल करें

दूसरे सामान्य समीकरण में को प्रतिस्थापित करके और बीजगणितीय रूप से हल करके, हम ढलान गुणांक के लिए कम्प्यूटेशनल सूत्र व्युत्पन्न करते हैं।

Note: यह के बराबर है।

Result

Source: Montgomery, D. C., Peck, E. A., & Vining, G. G. (2012). Introduction to Linear Regression Analysis.

Why it behaves this way

Intuition

डेटा बिंदुओं के स्कैटर प्लॉट को उड़ने वाले कणों के बादल के रूप में कल्पना करें। प्रतिगमन रेखा बादल के केंद्र से गुजरती हुई एक कठोर, भारित छड़ी की तरह कार्य करती है। सूत्र एक 'गुरुत्वाकर्षण' तंत्र के रूप में कार्य करता है जो इस छड़ी को तब तक घुमाता और शिफ्ट करता है जब तक कि छड़ी और बादल में प्रत्येक बिंदु के बीच लंबवत दूरियों (वर्गित) का योग पूर्ण न्यूनतम पर न हो जाए।

Term
अनुमानित आश्रित चर
दिए गए इनपुट के लिए सर्वोत्तम फिट की रेखा पर 'लक्ष्य' निर्देशांक, मॉडल के 'सर्वोत्तम अनुमान' के रूप में कार्य करता है कि डेटा बिंदु कहाँ गिरना चाहिए।
Term
ढलान (प्रतिगमन गुणांक)
'परिवर्तन की दर' या संवेदनशीलता; यह बताता है कि इनपुट में एक-यूनिट वृद्धि के लिए आउटपुट में कितनी वृद्धि या कमी की उम्मीद है।
Term
अवरोधन
'आधारभूत' मान; जब इनपुट शून्य हो तो आउटपुट का अपेक्षित मान, रेखा को लंबवत अक्ष पर एंकर करता है।
Term
नमूना आकार
सबूत का वजन; यह समीकरण को बताता है कि प्रवृत्ति के निर्धारण में कितने डेटा बिंदु योगदान दे रहे हैं।

Signs and relationships

  • b_1: का चिह्न संबंध की दिशा को इंगित करता है: सकारात्मक का मतलब है कि दोनों चर एक ही दिशा में चलते हैं, जबकि नकारात्मक का मतलब एक व्युत्क्रम संबंध है।
  • b_0: यह एक योज्य स्थिरांक है जो पूरी रेखा को लंबवत रूप से स्थानांतरित करता है, यह सुनिश्चित करता है कि रेखा डेटा के सेंट्रोइड (माध्य) से होकर गुजरती है।

One free problem

Practice Problem

दिए गए डेटा बिंदु (1, 2), (2, 3), और (3, 5) के लिए, प्रतिगमन रेखा की ढलान b1 की गणना करें।

Hint: अंश n*sum(xy) - sum(x)*sum(y) और हर n*sum() - (sum(x))^2 को अलग-अलग गणना करें।

The full worked solution stays in the interactive walkthrough.

Where it shows up

Real-World Context

एक अर्थशास्त्री विपणन व्यय और कुल बिक्री राजस्व के बीच संबंध को मॉडल करने के लिए इस समीकरण का उपयोग करता है ताकि यह अनुमान लगाया जा सके कि एक विशिष्ट बजट कितना राजस्व उत्पन्न करेगा।

Study smarter

Tips

  • हमेशा पहले एक स्कैटर प्लॉट बनाएं ताकि यह सुनिश्चित हो सके कि संबंध वास्तव में रैखिक है।
  • आउटलायर्स (outliers) की जाँच करें, क्योंकि वे प्रतिगमन रेखा की ढलान को असमान रूप से प्रभावित कर सकते हैं।
  • रैखिक संबंध की ताकत और दिशा को मापने के लिए सहसंबंध गुणांक (r) की गणना करें।

Avoid these traps

Common Mistakes

  • यह मान लेना कि एक मजबूत सहसंबंध कार्य-कारण (causation) को दर्शाता है।
  • प्रेक्षित x डेटा की सीमा से बहुत आगे प्रतिगमन रेखा को बाहर निकालना (extrapolating)।

Common questions

Frequently Asked Questions

यह व्युत्पत्ति प्रेक्षित डेटा बिंदुओं और रैखिक प्रतिगमन मॉडल के बीच अवशिष्टों के वर्गित योग को कम करने के लिए न्यूनतम वर्ग विधि का उपयोग करती है।

इसका उपयोग तब करें जब आपको दो निरंतर चर के बीच संबंध को मॉडल करने और रैखिक प्रवृत्तियों के आधार पर भविष्य के परिणामों का अनुमान लगाने की आवश्यकता हो।

यह पूर्वानुमानित विश्लेषण का मौलिक उपकरण है, जो शोधकर्ताओं और व्यवसायों को प्रवृत्तियों का पूर्वानुमान लगाने और चर के बीच संबंधों की ताकत को मापने में सक्षम बनाता है।

यह मान लेना कि एक मजबूत सहसंबंध कार्य-कारण (causation) को दर्शाता है। प्रेक्षित x डेटा की सीमा से बहुत आगे प्रतिगमन रेखा को बाहर निकालना (extrapolating)।

एक अर्थशास्त्री विपणन व्यय और कुल बिक्री राजस्व के बीच संबंध को मॉडल करने के लिए इस समीकरण का उपयोग करता है ताकि यह अनुमान लगाया जा सके कि एक विशिष्ट बजट कितना राजस्व उत्पन्न करेगा।

हमेशा पहले एक स्कैटर प्लॉट बनाएं ताकि यह सुनिश्चित हो सके कि संबंध वास्तव में रैखिक है। आउटलायर्स (outliers) की जाँच करें, क्योंकि वे प्रतिगमन रेखा की ढलान को असमान रूप से प्रभावित कर सकते हैं। रैखिक संबंध की ताकत और दिशा को मापने के लिए सहसंबंध गुणांक (r) की गणना करें।

References

Sources

  1. Montgomery, D. C., Peck, E. A., & Vining, G. G. (2012). Introduction to Linear Regression Analysis.
  2. Freedman, D., Pisani, R., & Purves, R. (2007). Statistics.