MathematicsStatistica e Analisi di RegressioneUniversity

Retta di Regressione Lineare Semplice

Questa equazione definisce la retta di migliore adattamento che minimizza la somma dei quadrati dei residui tra valori osservati e previsti per una relazione lineare tra due variabili.

Understand the formulaSee the free derivationOpen the full walkthrough

\overset{y}{^} = b_{0} + b_{1} x where b_{1} = \frac{n \sum x y - ( \sum x ) ( \sum y )}{n \sum x ^{2} - ( \sum x ) ^{2}} and b_{0} = \overset{y}{ˉ} - b_{1} \overset{x}{ˉ}

Open Full Walkthrough Try Calculator

This public page keeps the free explanation visible and leaves premium worked solving, advanced walkthroughs, and saved study tools inside the app.

Core idea

Overview

La retta di regressione viene calcolata utilizzando il metodo dei minimi quadrati ordinari (OLS), che cerca di minimizzare la varianza degli errori. La pendenza, b1, rappresenta la variazione attesa di y per unità di variazione di x, mentre l'intercetta, b0, indica il valore previsto di y quando x è zero. Insieme, questi parametri caratterizzano il trend lineare all'interno di un set di dati.

When to use: Utilizzare questo quando è necessario modellare la relazione tra due variabili continue e prevedere esiti futuri basati su trend lineari.

Why it matters: È lo strumento fondamentale per l'analisi predittiva, che consente a ricercatori e aziende di prevedere trend e quantificare la forza delle relazioni tra le variabili.

Symbols

Variables

y^ = Predicted Value, $b_{1}$ = Slope, $b_{0}$ = Y-Intercept, x = Independent Variable, n = Sample Size

Predicted Value

Variable

b_{1}

Slope

Variable

b_{0}

Y-Intercept

Variable

x

Independent Variable

Variable

n

Sample Size

Variable

\overset{y}{^}

\hat{y}

Variable

Walkthrough

Derivation

Derivazione della Retta di Regressione Lineare Semplice

Questa derivazione utilizza il Metodo dei Minimi Quadrati per minimizzare la somma dei quadrati dei residui tra i punti dati osservati e il modello di regressione lineare.

La relazione tra le variabili x e y è lineare.
Gli errori sono indipendenti e identicamente distribuiti con media zero.

Definire la Somma dei Quadrati dei Residui (SSR)

Definiamo la funzione obiettivo S come la somma dei quadrati delle distanze verticali tra ciascun punto dati osservato $y_{i}$ e il valore previsto sulla retta di regressione.

S (b_{0}, b_{1}) = i = 1 \sum n (y_{i} - (b_{0} + b_{1} x_{i}))^{2}

Note: Minimizzare i residui al quadrato assicura che le deviazioni positive e negative non si annullino a vicenda.

Differenziazione Parziale rispetto a b_0

Per minimizzare S, prendiamo la derivata parziale rispetto a $b_{0}$ e la poniamo a zero, il che porta all'equazione normale per l'intercetta.

\frac{\partial S}{\partial b _{0}} = - 2 i = 1 \sum n (y_{i} - b_{0} - b_{1} x_{i}) = 0

Note: La semplificazione di questo porta all'equazione $b_{0}$ = $\overset{y}{ˉ}$ - $b_{1}$ \bar{x}.

Differenziazione Parziale rispetto a b_1

Prendiamo la derivata parziale rispetto a $b_{1}$ e la poniamo a zero per trovare la pendenza che minimizza l'errore.

\frac{\partial S}{\partial b _{1}} = - 2 i = 1 \sum n x_{i} (y_{i} - b_{0} - b_{1} x_{i}) = 0

Note: Sostituire l'espressione per $b_{0}$ dal passaggio precedente in questa equazione per isolare $b_{1}$ .

Risolvere il Sistema per b_1

Sostituendo $b_{0} = \overset{y}{ˉ} - b_{1} \overset{x}{ˉ}$ nella seconda equazione normale e risolvendo algebricamente, deriviamo la formula computazionale per il coefficiente di pendenza.

b_{1} = \frac{n \sum x _{i} y _{i} - ( \sum x _{i} ) ( \sum y _{i} )}{n \sum x _{i}^{2} - ( \sum x _{i} ) ^{2}}

Note: Questo è equivalente a $b_{1} = \frac{Cov ( x , y )}{Var ( x )}$ .

Result

b_{1} = \frac{n \sum x _{i} y _{i} - ( \sum x _{i} ) ( \sum y _{i} )}{n \sum x _{i}^{2} - ( \sum x _{i} ) ^{2}}

Source: Montgomery, D. C., Peck, E. A., & Vining, G. G. (2012). Introduction to Linear Regression Analysis.

Why it behaves this way

Intuition

Immagina un grafico a dispersione di punti dati come una nuvola di particelle fluttuanti. La retta di regressione agisce come un bastone rigido e ponderato che passa attraverso il centro della nuvola. La formula agisce come un meccanismo di 'gravità' che ruota e sposta questo bastone finché la somma delle distanze verticali (al quadrato) tra il bastone e ogni punto nella nuvola non è al minimo assoluto.

Term

Variabile dipendente prevista

La prima voce (

\overset{y}{^}

) in Derivazione della Retta di Regressione Lineare Semplice va letta come il dato che aggancia il testo al modello matematico: prima si decide se sia nota o cercata, poi si controlla come modifica scala, verso e interpretazione del risultato.

Term

Pendenza (Coefficiente di Regressione)

Nella seconda voce (

b_{1}

) di Derivazione della Retta di Regressione Lineare Semplice, il punto pratico consiste nel seguire il passaggio dall'enunciato alla formula; questa quantita non e una lettera isolata, ma un contributo coerente con ipotesi e unita.

Term

Intercetta

Usa la terza voce (

b_{0}

) in Derivazione della Retta di Regressione Lineare Semplice per verificare quale parte del sistema sta cambiando. Se il suo valore aumenta o diminuisce, la relazione indica quale effetto attendersi sul calcolo finale.

Term

Dimensione del campione

Per la quarta voce (n) dentro Derivazione della Retta di Regressione Lineare Semplice, separa significato fisico e manipolazione algebrica: il simbolo entra nella formula solo dopo aver chiarito contesto, misura e vincoli del problema.

Signs and relationships

b_1: Prima spiegazione: il vincolo $b_{1}$ in Derivazione della Retta di Regressione Lineare Semplice stabilisce quale operazione e ammessa e quale lettura va evitata. Prima di usare il risultato numerico, controlla verso, uguaglianza o condizione limite e mantieni coerente il significato della relazione.
b_0: Seconda spiegazione: il vincolo $b_{0}$ in Derivazione della Retta di Regressione Lineare Semplice stabilisce quale operazione e ammessa e quale lettura va evitata. Prima di usare il risultato numerico, controlla verso, uguaglianza o condizione limite e mantieni coerente il significato della relazione.

One free problem

Practice Problem

Dati i punti dati (1, 2), (2, 3) e (3, 5), calcolare la pendenza b1 della retta di regressione.

Hint: Calcolare separatamente il numeratore n*sum(xy) - sum(x)*sum(y) e il denominatore n*sum( $x^{2}$ ) - (sum(x))^2.

The full worked solution stays in the interactive walkthrough.

Where it shows up

Real-World Context

Un economista utilizza questa equazione per modellare la relazione tra spesa di marketing e fatturato totale per prevedere quanto fatturato genererà un budget specifico.

Study smarter

Tips

Creare sempre prima un grafico a dispersione per assicurarsi che la relazione sia effettivamente lineare.
Verificare la presenza di valori anomali, poiché questi possono influenzare in modo sproporzionato la pendenza della retta di regressione.
Calcolare il coefficiente di correlazione (r) per quantificare la forza e la direzione della relazione lineare.

Avoid these traps

Common Mistakes

Presumere che una forte correlazione implichi causalità.
Estralolare la retta di regressione ben oltre l'intervallo dei dati x osservati.

Common questions

Frequently Asked Questions

Questa derivazione utilizza il Metodo dei Minimi Quadrati per minimizzare la somma dei quadrati dei residui tra i punti dati osservati e il modello di regressione lineare.

Utilizzare questo quando è necessario modellare la relazione tra due variabili continue e prevedere esiti futuri basati su trend lineari.

È lo strumento fondamentale per l'analisi predittiva, che consente a ricercatori e aziende di prevedere trend e quantificare la forza delle relazioni tra le variabili.

Presumere che una forte correlazione implichi causalità. Estralolare la retta di regressione ben oltre l'intervallo dei dati x osservati.

Un economista utilizza questa equazione per modellare la relazione tra spesa di marketing e fatturato totale per prevedere quanto fatturato genererà un budget specifico.

Creare sempre prima un grafico a dispersione per assicurarsi che la relazione sia effettivamente lineare. Verificare la presenza di valori anomali, poiché questi possono influenzare in modo sproporzionato la pendenza della retta di regressione. Calcolare il coefficiente di correlazione (r) per quantificare la forza e la direzione della relazione lineare.

References

Sources

Montgomery, D. C., Peck, E. A., & Vining, G. G. (2012). Introduction to Linear Regression Analysis.
Freedman, D., Pisani, R., & Purves, R. (2007). Statistics.