Línea de Regresión Lineal Simple
Esta ecuación define la línea de mejor ajuste que minimiza la suma de los cuadrados de los residuos entre los valores observados y predichos para una relación lineal entre dos variables.
This public page keeps the free explanation visible and leaves premium worked solving, advanced walkthroughs, and saved study tools inside the app.
Core idea
Overview
La línea de regresión se calcula utilizando el método de Mínimos Cuadrados Ordinarios (MCO), que busca minimizar la varianza de los errores. La pendiente, b1, representa el cambio esperado en y por cada unidad de cambio en x, mientras que la intersección, b0, indica el valor predicho de y cuando x es cero. Juntos, estos parámetros caracterizan la tendencia lineal dentro de un conjunto de datos.
When to use: Utilice esto cuando necesite modelar la relación entre dos variables continuas y predecir resultados futuros basándose en tendencias lineales.
Why it matters: Es la herramienta fundamental para el análisis predictivo, permitiendo a investigadores y empresas pronosticar tendencias y cuantificar la fuerza de las relaciones entre variables.
Symbols
Variables
y^ = Predicted Value, = Slope, = Y-Intercept, x = Independent Variable, n = Sample Size
Walkthrough
Derivation
Derivacion de Línea de Regresión Lineal Simple
Esta derivación utiliza el Método de Mínimos Cuadrados para minimizar la suma de los residuos al cuadrado entre los puntos de datos observados y el modelo de regresión lineal.
- La relación entre las variables x e y es lineal.
- Los errores son independientes y están distribuidos de forma idéntica con media cero.
Definir la suma de los residuos al cuadrado (SSR)
Definimos la función objetivo S como la suma de los cuadrados de las distancias verticales entre cada punto de datos observado y el valor predicho en la línea de regresión.
Note: Minimizar los residuos al cuadrado asegura que las desviaciones positivas y negativas no se cancelen entre sí.
Diferenciación parcial con respecto a b_0
Para minimizar S, tomamos la derivada parcial con respecto a y la igualamos a cero, lo que lleva a la ecuación normal para la intersección.
Note: Simplificar esto resulta en la ecuación = - \bar{x}.
Diferenciación parcial con respecto a b_1
Tomamos la derivada parcial con respecto a y la igualamos a cero para encontrar la pendiente que minimiza el error.
Note: Sustituya la expresión para del paso anterior en esta ecuación para aislar .
Resolver el sistema para b_1
Al sustituir en la segunda ecuación normal y resolver algebraicamente, derivamos la fórmula computacional para el coeficiente de pendiente.
Note: Esto es equivalente a .
Result
Source: Montgomery, D. C., Peck, E. A., & Vining, G. G. (2012). Introduction to Linear Regression Analysis.
Why it behaves this way
Intuition
Imagine un diagrama de dispersión de puntos de datos como una nube de partículas flotantes. La línea de regresión actúa como un palo rígido y ponderado que pasa por el centro de la nube. La fórmula actúa como un mecanismo de 'gravedad' que gira y desplaza este palo hasta que la suma de las distancias verticales (al cuadrado) entre el palo y cada punto en la nube es un mínimo absoluto.
Signs and relationships
- b_1: El signo de indica la dirección de la relación: positivo significa que ambas variables se mueven en la misma dirección, mientras que negativo indica una relación inversa.
- b_0: Esta es una constante aditiva que desplaza toda la línea verticalmente, asegurando que la línea pase por el centroide (media) de los datos.
One free problem
Practice Problem
Dados los puntos de datos (1, 2), (2, 3) y (3, 5), calcule la pendiente b1 de la línea de regresión.
Hint: Calcule el numerador n*sum(xy) - sum(x)*sum(y) y el denominador n*sum() - (sum(x))^2 por separado.
The full worked solution stays in the interactive walkthrough.
Where it shows up
Real-World Context
Un economista utiliza esta ecuación para modelar la relación entre el gasto en marketing y los ingresos totales por ventas para predecir cuántos ingresos generará un presupuesto específico.
Study smarter
Tips
- Cree siempre un diagrama de dispersión primero para asegurarse de que la relación sea realmente lineal.
- Compruebe si hay valores atípicos, ya que pueden influir desproporcionadamente en la pendiente de la línea de regresión.
- Calcule el coeficiente de correlación (r) para cuantificar la fuerza y dirección de la relación lineal.
Avoid these traps
Common Mistakes
- Asumir que una correlación fuerte implica causalidad.
- Extrapolar la línea de regresión mucho más allá del rango de los datos de x observados.
Common questions
Frequently Asked Questions
Esta derivación utiliza el Método de Mínimos Cuadrados para minimizar la suma de los residuos al cuadrado entre los puntos de datos observados y el modelo de regresión lineal.
Utilice esto cuando necesite modelar la relación entre dos variables continuas y predecir resultados futuros basándose en tendencias lineales.
Es la herramienta fundamental para el análisis predictivo, permitiendo a investigadores y empresas pronosticar tendencias y cuantificar la fuerza de las relaciones entre variables.
Asumir que una correlación fuerte implica causalidad. Extrapolar la línea de regresión mucho más allá del rango de los datos de x observados.
Un economista utiliza esta ecuación para modelar la relación entre el gasto en marketing y los ingresos totales por ventas para predecir cuántos ingresos generará un presupuesto específico.
Cree siempre un diagrama de dispersión primero para asegurarse de que la relación sea realmente lineal. Compruebe si hay valores atípicos, ya que pueden influir desproporcionadamente en la pendiente de la línea de regresión. Calcule el coeficiente de correlación (r) para cuantificar la fuerza y dirección de la relación lineal.
References
Sources
- Montgomery, D. C., Peck, E. A., & Vining, G. G. (2012). Introduction to Linear Regression Analysis.
- Freedman, D., Pisani, R., & Purves, R. (2007). Statistics.