¿Que es regresión lineal simple?
Es un modelo de regresión lineal con una única variable explicativa. Una técnica de regresión lineal simple intenta trazar un grafico lineal en variables de datos X e Y.
Como variable independiente, X se traza a lo largo del eje horizontal. Las variables independientes también se denominan variables explicativas o variables predictivas.
¿PARA QUE SIRVE LA REGRESION LINEAL SIMPLE?
La regresión lineal simple sirve para convertir datos sin procesar de manera confiable y predecible en inteligencia empresarial y conocimiento practico.
Ventajas de la regresión lineal simple
Características
Métricas de regresión lineal.
La regresión es importante y conocer las métricas que se utilizan ,nos ayudan a entender su comportamiento y saber que tan correcta es.
•R2 y R2 ajustado se usan para explicar que tan bien la variable independiente en la regresión lineal explica la variabilidad de la variable dependiente. R2 siempre aumenta de valor cuando incrementamos la cantidad de variables independientes en nuestro modelo y es algo que tenemos que tener en cuenta y no dejarnos confundir al creer que realmente esta mejorando el modelo, puede que no, para solucionar esto usamos R2 ajustado.
R2 ajustado toma en cuenta el número de variables independientes, también conocidas como predictores, y su valor baja si el incremento en R2 debido a las variables adicionales no es lo suficientemente significativo.
Prueba de bondad.
La bondad de ajuste de un modelo de regresión se refiere al nivel de acoplamiento entre el conjunto de observaciones y los valores obtenidos mediante la regresión.
Una prueba de bondad de ajuste es donde:
O = valores observados (datos)
Tipos de regresión.
Podemos realizar 3 modelos de análisis distintos en función del número de variables y la forma de interactuar entre ellas:
•Modelo de regresión lineal simple: : Este tipo se presenta cuando una variable independiente ejerce influencia sobre otra variable dependiente. Ejemplo: Y = f(x)
Esta regresión se utiliza con mayor frecuencia en las ciencias económicas, y sus disciplinas tecnológicas. Cualquier función no lineal, es transformada en lineal para su estudio y efectos.
Objetivo: Se utiliza la regresión lineal simple para:
1.- Determinar la relación de dependencia que tiene una variable respecto a otra.
2.- Ajustar la distribución de frecuencias de una línea, es decir, determinar la forma de la línea de regresión.
3.- Predecir un dato desconocido de una variable partiendo de los datos conocidos de otra variable.
Por ejemplo: En una empresa de servicio de Internet busca relacionar las ganancias que obtiene cada computadora con el numero de usuarios que ingresan a dicha cabina diariamente. En la tabla representa Y (Ganancias S/.) e X (Numero de usuarios)
•Modelo de regresión lineal múltiple: Este tipo se presenta cuando dos o más variables independientes influyen sobre una variable dependiente. Ejemplo: Y = f(x, w, z).
Por ejemplo: Una Empresa de desarrollo de software establece relacionar sus Ventas en función del numero de pedidos de los tipos de software que desarrolla (Sistemas, Educativos y Automatizaciones Empresariales), para atender 10 proyectos en el presente año. En la Tabla representa Y (Ventas miles de S/.) e X (Nº pedidos de sistemas), W (Nº de pedidos de Aplicaciones Educativas) y Z (Nº de pedidos de Automatizaciones empresariales).
•Modelo de regresión no lineal: Genera una ecuación para describir la relación no lineal entre un a variable de respuesta continua y una o mas variables predictoras y predice nuevas observaciones, por ejemplo;
Unos investigadores del Instituto Nacional de Normas y Tecnología de Estados Unidos (NIST, por sus siglas en inglés) desean entender la relación que existe entre el coeficiente de expansión térmica del cobre y la temperatura en grados Kelvin.
Investigaciones anteriores indican que un modelo no lineal con 7 parámetros proporciona un ajuste adecuado. Los investigadores utilizan regresión no lineal para estimar los parámetros incluidos en el modelo.
- elija .
- En Respuesta, ingrese Expansión
- En Editar directamente, copie y pegue, o escriba lo siguiente: (b1+b2*Kelvin+b3*Kelvin^2+b4*Kelvin^3)/(1+b5*Kelvin+b6*Kelvin^2+b7*Kelvin^3)
- Haga clic en Parámetros.
- En Valores iniciales requeridos, ingrese estos valores:
7. Haga clic en Aceptar en cada cuadro de dialogo.
Interpretar los resultados
La gráfica de línea ajustada muestra que la línea ajustada sigue los valores observados, lo que indica visualmente que el modelo se ajusta a los datos. El valor p para la prueba de falta de ajuste es 0,679, que no proporciona ninguna evidencia de que el ajuste del modelo a los datos sea deficiente.
La advertencia sobre parámetros muy correlacionados indica que al menos un par de parámetros tiene una correlación mayor que un valor absoluto de 0,99. Sin embargo, puesto que estudios anteriores indican que un modelo no lineal con 7 parámetros proporciona un ajuste adecuado a los datos, los investigadores no cambian el modelo.
Dependerá del número de variables que necesitemos incluir elegir entre un modelo u otro.
Supuestos de regresión lineal.
Estos supuestos son cuatro:
•Supuesto de linealidad
La relación entre la variable de predicción (independiente) y de criterio (dependiente) debe ser lineal en el rango de valores observados de la variable de predicción. Una manera sencilla de comprobar este supuesto es la de representar un diagrama de dispersión y ver si la distribución de los puntos tiene lugar, de forma aproximada, a lo largo de una línea recta.
•Supuesto de homocedasticidad
Esto significa que los residuos deben distribuirse de forma homogénea para todos los valores de la variable de predicción. Podemos comprobarlo de forma sencilla con un diagrama de dispersión que represente, en el eje de abscisas, las estimaciones de la variable dependiente para los distintos valores de la variable independiente y, en el eje de coordenadas, los residuos correspondientes.
•Supuesto de normalidad
Como ya hemos mencionado, los residuos deben distribuirse de forma normal.
Una forma sencilla de comprobarlo sería representar el histograma o el gráfico de cuantiles teóricos de los residuos, en el que deberíamos ver su distribución a lo largo de la diagonal del gráfico.
•Supuesto de independencia
Para comprobar este supuesto, es necesario comprobar que los residuos sean independientes entre sí y que no haya ningún tipo de correlación entre ellos.
Esto puede contrastarse realizando la prueba de Durbin-Watson, cuya hipótesis nula supone, precisamente, que los residuos son independientes.
ELABORO:
AMAYA GUTIERREZ LAURA MISUKY
CALDERON ESTRADA MIRIAM GISEL
GONZALEZ CASTILLON HECTOR DANIEL
NAJERA JUAREZ REY ANGEL


Comentarios
Publicar un comentario