Linha de Regressão Linear Simples
Esta equação define a linha de melhor ajuste que minimiza a soma dos quadrados dos resíduos entre os valores observados e previstos para uma relação linear entre duas variáveis.
This public page keeps the free explanation visible and leaves premium worked solving, advanced walkthroughs, and saved study tools inside the app.
Core idea
Overview
A linha de regressão é calculada usando o método dos Mínimos Quadrados Ordinários (MQO), que busca minimizar a variância dos erros. O coeficiente angular, b1, representa a mudança esperada em y por unidade de mudança em x, enquanto o intercepto, b0, indica o valor previsto de y quando x é zero. Juntos, esses parâmetros caracterizam a tendência linear dentro de um conjunto de dados.
When to use: Use isso quando precisar modelar a relação entre duas variáveis contínuas e prever resultados futuros com base em tendências lineares.
Why it matters: É a ferramenta fundamental para a análise preditiva, permitindo que pesquisadores e empresas prevejam tendências e quantifiquem a força das relações entre variáveis.
Symbols
Variables
y^ = Predicted Value, = Slope, = Y-Intercept, x = Independent Variable, n = Sample Size
Walkthrough
Derivation
Derivação da Linha de Regressão Linear Simples
Esta derivação usa o Método dos Mínimos Quadrados para minimizar a soma dos resíduos quadrados entre os pontos de dados observados e o modelo de regressão linear.
- A relação entre as variáveis x e y é linear.
- Os erros são independentes e identicamente distribuídos com média zero.
Definir a Soma dos Resíduos Quadrados (SSR)
Definimos a função objetivo S como a soma dos quadrados das distâncias verticais entre cada ponto de dados observado e o valor predito na linha de regressão.
Note: Minimizar os resíduos quadrados garante que desvios positivos e negativos não se cancelem.
Diferenciação Parcial em relação a b_0
Para minimizar S, tomamos a derivada parcial em relação a e igualamos a zero, o que leva à equação normal para a interceptação.
Note: Simplificar isso resulta na equação = - \bar{x}.
Diferenciação Parcial em relação a b_1
Tomamos a derivada parcial em relação a e igualamos a zero para encontrar a inclinação que minimiza o erro.
Note: Substitua a expressão para do passo anterior nesta equação para isolar .
Resolver o Sistema para b_1
Ao substituir na segunda equação normal e resolver algebricamente, derivamos a fórmula computacional para o coeficiente de inclinação.
Note: Isso é equivalente a .
Result
Source: Montgomery, D. C., Peck, E. A., & Vining, G. G. (2012). Introduction to Linear Regression Analysis.
Why it behaves this way
Intuition
Imagine um gráfico de dispersão de pontos de dados como uma nuvem de partículas flutuantes. A linha de regressão atua como uma vara rígida e ponderada passando pelo centro da nuvem. A fórmula atua como um mecanismo de 'gravidade' que rotaciona e desloca essa vara até que a soma das distâncias verticais (ao quadrado) entre a vara e cada ponto na nuvem esteja em um mínimo absoluto.
Signs and relationships
- b_1: O sinal de indica a direção da relação: positivo significa que ambas as variáveis se movem na mesma direção, enquanto negativo indica uma relação inversa.
- b_0: Esta é uma constante aditiva que desloca toda a linha verticalmente, garantindo que a linha passe pelo centroide (média) dos dados.
One free problem
Practice Problem
Dados os pontos (1, 2), (2, 3) e (3, 5), calcule o coeficiente angular b1 da linha de regressão.
Hint: Calcule o numerador n*sum(xy) - sum(x)*sum(y) e o denominador n*sum() - (sum(x))^2 separadamente.
The full worked solution stays in the interactive walkthrough.
Where it shows up
Real-World Context
Um economista usa esta equação para modelar a relação entre gastos em marketing e receita total de vendas para prever quanta receita um orçamento específico gerará.
Study smarter
Tips
- Sempre crie um gráfico de dispersão primeiro para garantir que a relação seja realmente linear.
- Verifique se há outliers, pois eles podem influenciar desproporcionalmente o coeficiente angular da linha de regressão.
- Calcule o coeficiente de correlação (r) para quantificar a força e a direção da relação linear.
Avoid these traps
Common Mistakes
- Assumir que uma forte correlação implica causalidade.
- Extrapolar a linha de regressão muito além do intervalo dos dados de x observados.
Common questions
Frequently Asked Questions
Esta derivação usa o Método dos Mínimos Quadrados para minimizar a soma dos resíduos quadrados entre os pontos de dados observados e o modelo de regressão linear.
Use isso quando precisar modelar a relação entre duas variáveis contínuas e prever resultados futuros com base em tendências lineares.
É a ferramenta fundamental para a análise preditiva, permitindo que pesquisadores e empresas prevejam tendências e quantifiquem a força das relações entre variáveis.
Assumir que uma forte correlação implica causalidade. Extrapolar a linha de regressão muito além do intervalo dos dados de x observados.
Um economista usa esta equação para modelar a relação entre gastos em marketing e receita total de vendas para prever quanta receita um orçamento específico gerará.
Sempre crie um gráfico de dispersão primeiro para garantir que a relação seja realmente linear. Verifique se há outliers, pois eles podem influenciar desproporcionalmente o coeficiente angular da linha de regressão. Calcule o coeficiente de correlação (r) para quantificar a força e a direção da relação linear.
References
Sources
- Montgomery, D. C., Peck, E. A., & Vining, G. G. (2012). Introduction to Linear Regression Analysis.
- Freedman, D., Pisani, R., & Purves, R. (2007). Statistics.