Una guía práctica del paso 4

El contenido de los datos y las recomendaciones de productos son editorialmente independientes. Podemos ganar dinero cuando hace clic en nuestros enlaces de afiliados. Aprende más.

Aprender la regresión lineal en Excel puede agregar una herramienta analítica versátil a su conjunto de habilidades, brindándole la capacidad de hacer predicciones sobre la relación entre variables dependientes e independientes. Aunque es relativamente sencilla de implementar, la regresión lineal (también conocida como análisis de regresión) es una poderosa técnica analítica que tiene una amplia aplicación en innumerables casos de uso empresarial.

Ejecutar una regresión lineal en Excel es una técnica relativamente sencilla que le permite hacer predicciones del mundo real examinando las relaciones lineales entre variables dependientes e independientes y el efecto de esas variables entre sí. Esta guía le muestra cómo desbloquear el potencial predictivo oculto en sus interacciones en cuatro sencillos pasos.

¿Cómo funciona la regresión lineal?

La regresión lineal se utiliza para medir la relación entre una variable independiente y una variable dependiente, lo que le permite hacer predicciones sobre cómo podrían desarrollarse los escenarios del mundo real. Esta habilidad sirve para una amplia gama de propósitos en el mundo empresarial.

Por ejemplo, una empresa de bebidas deportivas supone razonablemente que sus ventas de bebidas están directamente relacionadas con la temperatura exterior de una determinada zona geográfica de ventas. Cuanto más alta es la temperatura, más unidades de bebida se venden; en otras palabras, las ventas de bebidas locales dependen de la temperatura de la zona. A partir de esta información inicial, podrás reservar una «venta de bebidas». y La variable (dependiente), el objetivo o valor que intenta predecir, y la «temperatura» relativa a X (variable independiente.

Nuestro conjunto de datos de muestra compara la temperatura diaria promedio con las ventas diarias de bebidas deportivas durante un período determinado.

Temperatura promedio (°F)Ventas de Bebidas Deportivas – Mediodía (promedio/día)
7250
78sesenta y cinco
8280
8895
92110
97125
102140
108155
112170
118185
122200
128215

El objetivo es hacer predicciones basadas en puntos de datos históricos calculando y trazando una línea de tendencia.

Igualdad

Matemáticamente, la regresión lineal utiliza la fórmula fácil de interpretar que se muestra a continuación, seguida de un desglose detallado que representa cada variable en la fórmula:

y = a + bx

  • (y) Variable dependiente: Esta variable está relacionada con otros factores medidos a la derecha del signo de igualdad.
  • (a) Término de Regresión Intermedio: El valor constante de la variable dependiente mientras que la variable independiente X se establece en cero; en otras palabras, el punto donde la función cruza el eje y.
  • (b) Coeficiente de regresión: El valor que define la pendiente de la serie (es decir, el cambio en la variable independiente por unidad de la variable independiente y concepto).
  • (x) Variable independiente: Una variable utilizada para predecir el valor de otra variable; porque se utiliza para predecir el valor de la variable dependiente, X También conocido como predictor.
Diagrama de líneas de regresión y ecuación.
Fuente: https://bookdown.org/sbikienga/Intro_to_stat_book/images/chap7/regression_line1.gif

Un modelo de regresión lineal

Cuando se representa en un gráfico, la forma de una regresión lineal toma la forma de una línea recta en cualquier valor de pendiente válido; básicamente, el ángulo o dirección que tiene la línea:

  • Punto positivo: Eso es lo que significa y a medida que aumenta X aumenta y la función asciende de izquierda a derecha.
  • Punto negativo: Eso es lo que significa y a medida que disminuye X aumenta y la función desciende de izquierda a derecha.
  • Pendiente Cero: Eso es lo que significa y constante que no cambia; básicamente una línea horizontal.
Tres etapas diferentes de regresión lineal.
Fuente: https://bookdown.org/sbikienga/Intro_to_stat_book/introduction-to-simple-linear-regression.html

Cómo ejecutar una regresión lineal en Excel

Los siguientes pasos muestran cómo configurar y ejecutar una regresión lineal en versiones recientes de Microsoft Excel. También es posible en otras herramientas de hojas de cálculo como Google Sheets o Zoho Sheets; los pasos son generalmente similares, pero los detalles variarán.

A pesar de su simplicidad, las regresiones lineales pueden resultar difíciles de realizar en versiones anteriores de Excel, pero las versiones más nuevas tienen herramientas avanzadas de análisis de datos que facilitan las regresiones lineales.

Paso 1: Ingrese valores históricos en Excel

Comience ingresando sus datos históricos en Excel. Para nuestro ejemplo de empresa de bebidas deportivas, se ingresa la información de la base de datos detallada anteriormente; sus resultados deberían verse como en el ejemplo siguiente.

Ejemplo visual de Regresión Lineal en Excel: Paso 1.

Paso 2: Traza tus datos históricos usando un diagrama de dispersión

A continuación, trace sus datos históricos utilizando un diagrama de dispersión.

  1. Seleccione todos los campos con datos, incluidas las etiquetas de encabezado.
  2. Haga clic en la pestaña «Insertar» en el menú del nivel superior.
  3. Seleccione «Dispersión», seguido de la primera opción: «Solo marcadores de dispersión».

Sus resultados deberían parecerse al ejemplo siguiente.

Ejemplo visual de Regresión Lineal en Excel: Paso 2.

Incluso antes de colocar la línea de tendencia, se puede ver que se ve fácilmente una relación lineal muy consistente entre las variables.

Paso 3: coloca tu línea de tendencia

Para completar su regresión lineal, deberá trazar la línea de tendencia con respecto a su diagrama de dispersión.

  1. Haga clic derecho en el diagrama de dispersión y seleccione «Agregar línea de tendencia».
  2. En el menú de la pestaña Formato, seleccione «Lineal».
  3. Marque las casillas para «Mostrar ecuación en el gráfico» y «Mostrar valor de R cuadrado en el gráfico».

Ejemplo visual de Regresión Lineal en Excel: Paso 3.

Dado que eligió mostrar la ecuación de regresión lineal y el valor de R cuadrado, los resultados (que se enumeran a continuación) se colocan directamente dentro del gráfico.

y = 2,983x – 165,56

R² = 0,9992

Paso 4: Calcula tu pronóstico

Usando esta ecuación, ahora puede calcular un pronóstico de cifra de ventas tomando directamente un valor para el cálculo. X. Para este ejemplo, podemos predecir las ventas de bebidas deportivas en un clima de 65°F.

  1. Descargar X en la ecuación y = a + bx:

y = 2,983 (65) – 165,56

2. Resuelve la ecuación para y.

En este ejemplo, el valor es 28, lo que significa que en un clima de 65°F podemos esperar vender $28 en bebida deportiva. Puedes verificar esto trazando nuevos valores en el gráfico original:

Ejemplo visual de Regresión Lineal en Excel: Paso 4.

El valor R², también llamado coeficiente de determinación, indica qué tan bien se ajustan los datos al modelo de regresión (bondad de ajuste). El mejor valor de R² suele ser 0,9 o superior, por lo que su modelo de regresión lineal tiene una alta bondad de ajuste.

Desventajas de la regresión lineal

La simplicidad y la elegancia tienen un precio, y las fórmulas de regresión lineal no están exentas de salvedades. Una regla general con respecto al tamaño de la muestra en una fórmula de regresión lineal es al menos de 10 a 20 casos para cada variable independiente. Si se utilizan tres variables independientes, por ejemplo, se necesita un tamaño de muestra mínimo de 30 a 60 elementos para hacer predicciones precisas.

Cuando se utiliza la regresión lineal, las siguientes cinco condiciones deben cumplirse para que los resultados sean válidos:

  • Relación lineal: Las variables dependientes e independientes deben tener una relación lineal.
  • Distribución normal: Todas las variables, y especialmente la variable independiente, siguen una distribución normal conocida como normalidad multivariada.
  • Sin compatibilidad: La multicolinealidad es cuando dos o más variables independientes están altamente correlacionadas entre sí.
  • No personalizado: La correlación es el grado en que la misma variable se correlaciona entre dos intervalos de tiempo consecutivos.
  • La homocedasticidad existe: La varianza entre los datos debe ser consistente, siendo el error consistente con los valores de la variable dependiente.

Preguntas frecuentes (FAQ)

¿Cómo evalúo el desempeño de una regresión lineal?

Puede utilizar métricas comunes para evaluar el rendimiento de su modelo de regresión lineal, incluido el valor R² para medir la cantidad de varianza explicada por su ecuación, así como el error cuadrático medio (MSE) o el error cuadrático medio (RMSE) para medir . diferencia media cuadrática entre los valores previstos y observados.

¿Cómo sé cuándo utilizar la fórmula de regresión lineal?

Cuando se encuentra o se sospecha una relación lineal entre las variables dependientes e independientes en su base de datos, debe utilizar la fórmula de regresión lineal. Además, la regresión lineal es ideal para predecir un resultado consistente cuando se cumplen los supuestos mencionados anteriormente según la naturaleza de los datos.

¿Cuál es la diferencia entre regresión lineal simple y regresión lineal múltiple?

Una regresión lineal simple toma una variable dependiente y una variable independiente y describe su relación lineal con una línea recta. Por otro lado, la regresión lineal múltiple incorpora dos o más variables independientes para predecir una sola variable, lo que permite un modelo de relaciones más complejo.

¿Cómo afecta la medicación a los resultados del análisis de regresión lineal?

Los valores atípicos pueden afectar significativamente los resultados de una regresión lineal, distorsionando los coeficientes estimados y afectando la línea de tendencia. Se pueden utilizar técnicas como la transformación de datos o métodos de regresión robustos para reducir el efecto de los valores atípicos.

En pocas palabras: regresión lineal basada en Excel para predicciones de escritorio simples

Ya sea que esté buscando mejorar sus procesos de toma de decisiones, optimizar las estrategias comerciales o simplemente obtener una comprensión más profunda de los datos que lo rodean, la regresión lineal en Excel permite a los profesionales de datos en una herramienta de software versátil, a menudo utilizar poderosas herramientas estadísticas para identificar . Dicho esto, también debes comprender las limitaciones del software no profesional; Tenga en cuenta que, aunque Excel es una herramienta sencilla para el análisis de regresión básico, es posible que le falten algunas funciones avanzadas que se encuentran en el software estadístico dedicado. Interprete siempre los resultados con cuidado y, si es necesario, utilice software estadístico más especializado para un análisis en profundidad.

Si está aprendiendo a realizar análisis estadísticos utilizando las herramientas de hojas de cálculo disponibles, lea nuestra guía para utilizar simulaciones de Monte Carlo en Excel mediante cinco sencillos pasos.

Puede interesarte

Se nota bien en el marco retrógrado de cualquiera.

¿»La misma vieja defensa, diferente trono»? Tuve que verificar dos veces para ver si la …

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *