Objetivo General
La aplicación del análisis de regresión múltiple en temas de administración, economía y finanzas, entre otros, es útil cuando se estudia la relación lineal que existe entre una variable dependiente (z) y dos o más variables independientes (x, y).
El objetivo de este estudio es explicar el uso y la aplicación de esta técnica estadística, mediante la ejemplificación de un caso de generación de demanda de un producto (impresoras) por medio de la aplicación de la táctica de mercadotecnia directa conocida como telemarketing o telemercadeo, asimismo conocer el impacto que tiene en las finanzas de la empresa.
Antecedentes
Aunque el análisis de regresión simple es útil y representativo para comprender la importancia de medir el nivel de relación entre dos variables, una dependiente y otra independiente, cuando se pretende hacer un estudio real acerca de ciertos fenómenos económicos y administrativos no resulta funcional, dado que en éstos suelen verse involucradas más de dos variables independientes. El análisis de regresión múltiple, por su parte, funciona como una extensión del simple, logrando involucrar más de dos variables independientes y explicando su impacto en la que se denomina como dependiente.
Para explicar el comportamiento y la aplicación del análisis de regresión múltiple, se ha tomado como referencia un caso de estudio de administración real, en el que se pretende encontrar el nivel de relación que existe entre las ventas de impresoras de marca propia y remarketing (usadas) de cierta compañía de cómputo, con la inversión publicitaria y el número de llamadas realizadas a clientes potenciales mediante el telemercadeo.
Justificación
La necesidad de aplicar técnicas estadísticas de regresión múltiple para comprender el comportamiento y la relación entre dos o más variables es más común en un ambiente real que la técnica de regresión simple.
La razón es obvia. En el mundo real, todos los fenómenos de estudio son fácilmente influenciados por dos o más factores, y aunque en muchas ocasiones es necesario delimitar el número de variantes para lograr un estudio matemático de los mismos, también es cierto que entre más variables de un mismo caso puedan ser estudiadas e incluidas en la investigación, las conclusiones serán más completas e integrales, y podrán servir de apoyo en el proceso de toma de decisiones.
Pregunta de investigación
- Para el caso de estudio, ¿es posible que se pueda encontrar una relación de regresión múltiple entre las ventas de impresoras de marca propia con la inversión en publicidad, y las llamadas personales (o uno a uno) generadas a clientes potenciales?
Hipótesis:
El nivel de inversión publicitaria y el número de llamadas realizadas a la base de datos de clientes actuales y potenciales de cierta compañía de cómputo, mediante su departamento de telemarketing, han impactado directamente a las ventas de impresoras de marca propia y usadas en los últimos 10 años. La aplicación de un análisis de regresión múltiple servirá para estudiar el caso y comprender el comportamiento de las variables involucradas en el estudio y observar si esto es favorable para las finanzas de la empresa.
MARCO TEÓRICO
La estadística está formada por un conjunto de herramientas matemáticas que apoyan a los administradores en las tareas de toma de decisiones al mostrar los patrones de comportamiento de ciertas variables y fenómenos, así como las correspondencias entre éstos. También son útiles para visualizar el futuro, basándose en datos del pasado y con la ayuda de las técnicas de probabilidad.
Para algunas funciones, tales como la de mercadotecnia (que en este caso de estudio se ocupa de coordinar los esfuerzos de telemarketing) sería imposible tomar decisiones sin el apoyo de la estadística y sus herramientas. Las organizaciones son ricas en información, la cual es útil sólo si se encuentra disponible y se aprovecha de la forma más conveniente.
Para la función de marketing, existen cuatro aspectos de la información importantes: los datos operativos, marketing inteligente, la construcción y mantenimiento de las bases de datos, y la administración de las relaciones con los clientes.
El análisis de regresión múltiple forma parte de la estadística y es en realidad una extensión del análisis de regresión simple, que aplica para situaciones en las que se involucra a dos o más variables independientes, considerando su nivel o grado de asociación con la variable dependiente.
Con la finalidad de dejar más claro todo lo relacionado con en análisis de regresión estadístico, se incluyen las siguientes definiciones generales:
Análisis de regresión: es el conjunto de
técnicas estadísticas que se utilizan para medir la intensidad de la asociación entre dos variables. El principal
objetivo de este análisis es determinar la intensidad de la naturaleza de la relación entre las mismas. Cuando esta técnica se amplía a fenómenos en los que intervienen más de dos variables independientes, se le conoce como análisis de regresión múltiple. Variable Dependiente: es la variable que se predice o calcula. Su representación más común es mediante la letra Z . Variable Independiente: es la variable que proporciona las bases para el cálculo. Se representan mediante las letras X y Y (dos variables) o se enumeran como X1, X2, X3… cuando se trata de más de dos variables independientes.
Coeficiente de Correlación: describe la intensidad de la relación lineal entre las variables. Aplica tanto para estudios de regresión simple como múltiple.
Ecuación de Regresión Múltiple
Entonces, si se cree que existe una relación lineal entre una variable dependiente z, y dos independientes (x, y), se buscará una ecuación de la forma: z= a + bx + cy, la cual se denomina como ecuación de regresión de z sobre x, y
Para encontrar el grado de relación entre las variables, se puede estudiar el coeficiente de correlación múltiple (Ry12, para el caso de dos variables), el cual indica la relación que se forma entre las dos variables independientes, tomadas como grupo, y la dependiente. Sin embargo, es posible que una variable independiente mantenga una relación positiva con la dependiente, mientras que la otra lo haga de forma negativa. Todos los resultados del coeficiente de relación múltiple se reportan sin signo aritmético.
Por su parte, existe también el coeficiente de determinación múltiple el cual indica la proporción de varianza de la variable dependiente que se contabiliza estadísticamente para conocimiento de las dos variables independientes.
En el análisis de correlación múltiple se asume, al igual que en el simple, que: (1) las variables son al azar (2) la relación entre éstas es lineal, (3) las varianzas condicionales son iguales, (4) para cada variable, los valores observados son independientes de los otros, y (5) las distribuciones condicionales son normales.
El análisis de regresión múltiple es una técnica de dependencia, lo cual significa que todo experimentador debe ser capaz de clasificar las variables que intervienen como dependientes o independientes. Dado que es una herramienta estadística, este tipo de análisis utiliza variables cuantificables. Sólo en ocasiones muy especiales, se podrían considerar datos no numéricos
Para complementar en análisis de regresión múltiple, se consideran otros conceptos estadísticos, tales como el coeficiente de correlación parcial, que indica la relación que existe entre una variable independiente y la dependiente. Si denotamos como r123 como el coeficiente de correlación parcial entre X1 (variable dependiente) y X2 (variable independiente 1), manteniendo X3 constante (variable independiente 2) se tiene que:
Además, se puede estudiar el coeficiente de determinación parcial, que indica la varianza estadística proporcional para una variable independiente, cuando la otra se mantiene como constante. Por otro lado, el error estándar de estimación está dado por:
El único inconveniente con el análisis de regresión múltiple, a diferencia del simple, es que con el primero no es posible graficar el comportamiento de relación en dos dimensiones, como se hace con los diagramas de dispersión en el segundo (Schmuller, 2005)
El análisis de regresión múltiple es una técnica de dependencia, lo cual significa que el experimentador debe ser capaz de clasificar las variables que intervienen como dependientes o independientes. Dado que es una herramienta estadística, este tipo de análisis utiliza variables cuantificables. Sólo en ocasiones muy especiales, se podrían considerar datos no numéricos (Stamatis, 2003)
Pasos necesarios
Para efectos del presente estudio, el análisis de regresión se realizará con los siguientes pasos, de acuerdo con los resultados que el software MINITAB 14 genera:
1.- Obtener las estadísticas de regresión (coeficiente de correlación múltiple, coeficiente de determinación R2, R2 ajustado y error típico)
2.- Desarrollar conclusiones pertinentes de acuerdo con las estadísticas de regresión
3.- Análisis de varianza, con grados de libertad, suma de cuadrados, promedio de los cuadrados, F, y valor crítico de F. También se analizarán (para cada variable) los coeficientes, el error típico, estadístico t y la probabilidad.
4.- Desarrollar la ecuación de regresión múltiple
5.- Aplicar las estadísticas de regresión entre la variable dependiente y cada una de las variables independientes por separado, para determinar cuál está más relacionada con la variable dependiente Z.
Software Disponible
Existen una gran cantidad de aplicaciones de software disponibles para el desarrollo de análisis de regresión. Entre las más conocidas se encuentran MINITAB 14 y Microsoft Excel. Para efectos del presente estudio, se utilizará MINITAB 14. Para el uso de MINITAB se ha consultado el libro “Statistics for Six Sigma Made Easy”, descrito en la bibliografía de este estudio.
DESARROLLO DE PROYECTO
Descripción de la investigación
Cierta compañía de tecnología (el nombre no será revelado por cuestiones de confidencialidad) demostró su capacidad de innovación al ser una de las primeras en promover la venta de sus equipos de impresoras de marca propia y remarketing (usados) por medio de las ventas por teléfono o telemarketing.
Dado que la dedicación al éxito de sus clientes es uno de los valores de la compañía, el departamento de Marketing tiene la responsabilidad de transmitir exitosamente el mensaje de innovación de la empresa entre su comunidad de clientes, y apoyar así a éstos, en la toma de la decisión para la implementación de las soluciones que ofrece.
"Nuestra tarea es transformar la dedicación al éxito de nuestros clientes en un mensaje de innovación que podamos transmitir al mercado, y que nos permita crear relaciones de confianza con éstos. Al final, como unidad de staff, tenemos también que pensar en equilibrar costos y en los resultados a corto y mediano plazo, porque si por un lado es cierto que en Marketing tenemos la obligación de pensar y visualizar a largo plazo, también tenemos que ofrecer resultados en un corto periodo de tiempo", explica su director de mercadotecnia.
Dentro de la unidad de marketing de la empresa se encuentra el departamento de bases de datos, el cual se encarga mantener actualizada la información de los clientes y de crear el puente de información con el departamento externo de telemarketing, quienes a su vez, tienen la tarea de promover los artículos de consumo que la empresa vende entre sus clientes actuales y potenciales, mediante llamadas personales y la distribución de propaganda y ofertas especiales.
El departamento de telemarketing de esta compañía ofrece a los clientes una variada gama de productos de consumo, que van desde impresoras hasta terminales de punto de venta, unidades de CD/DVD internas y externas, y servidores de pequeño alcance.
Pasos de investigación
Para la presente investigación, se han realizado los siguientes pasos:
1. Delimitación del alcance del estudio a un sólo producto: las impresoras de marca propia y remarketing, entendiéndose por éstos últimos a los equipos de impresión que son recolectados de los clientes de outsourcing, reparados, y vendidos como equipos usados.
2. Las variables que impactan a las ventas de telemarketing son diversas, sin embargo se han seleccionado dos: la inversión en publicidad y las llamadas generadas a clientes
3. Del total de ventas de telemarketing por año se extrajeron los valores correspondientes a los porcentajes de venta de equipos de impresión. Lo mismo se hizo con la inversión en publicidad y el número de llama Los datos resultantes se muestran en la siguiente tabla:
Año | Ventas (USD) | Llamadas | Publicidad (USD) |
1996 | 264000 | 550 | 15840 |
1997 | 384000 | 590 | 19250 |
1998 | 400200 | 680 | 26013 |
1999 | 422400 | 700 | 16896 |
2000 | 543000 | 750 | 16290 |
2001 | 285500 | 500 | 13765 |
2002 | 345000 | 570 | 17600 |
2003 | 410500 | 630 | 22470 |
2004 | 515000 | 730 | 15790 |
2005 | 360000 | 550 | 18790 |
Dado que el análisis de regresión múltiple es una extensión del análisis de regresión simple, y aplica para situaciones en las que se involucra a dos o más variables independientes, considerando su nivel o grado de asociación con la variable dependiente (Kazmier, 2003), se utilizará esa técnica para encontrar el nivel de relación entre las variables de estudio.
RESULTADOS
Análisis de datos
Para el análisis se utilizaron las siguientes variables: ventas (variable dependiente), número de llamadas generadas (variable independiente X1) e inversión publicitaria (variable independiente X2)
ingresar a MINITAB 14 los datos, se obtienen las siguientes estadísticas de regresión: (el coeficiente de correlación múltiple se obtiene de la raíz cuadrada del coeficiente de determinación R2. MINITAB no lo muestra abiertamente)
Estadísticas de Regresión |
Coeficiente de correlación múltiple | 0.92195 |
Coeficiente de determinación R2 | 0.85 |
R2 ajustado | 0.808 |
Error típico | 38747.3 |
De lo anterior, se puede deducir que:
- Al observar el coeficiente de correlación múltiple, se puede afirmar que tanto el número de llamadas generadas como la inversión en publicidad guardan una relación muy estrecha con la variable dependiente, ventas. (92% de relación).
- Gracias al coeficiente de determinación R2, se puede determinar que el 85% de las ventas están explicadas y justificadas por la realización de las llamadas y los gastos de publicidad.
A N Á L I S I S D E V A R I A N Z A |
| Grados de libertad | Suma de cuadrados | Prom. de los cuadrados | F | Valor crítico de F |
Regresión | 2 | 59768213336 | 29884106668 | 19.90 | 0.001 |
Residuos | 7 | 10509470664 | 1501352952 | | |
Total | 9 | 70277684000 | | | |
| Coeficientes | SE Coeficientes | Estadístico t | P |
Constante | -171836 | 106172 | -1.62 | .150 |
Llamadas | 961 | 153.3 | 6.27 | 0 |
Publicidad | -1.962 | 3.646 | -0.54 | .607 |
De lo anterior, se desprende la ecuación de regresión múltiple:
Y = -171836 + 961 X1 – 1.962 X2
Por medio de esta ecuación, pueden ahora determinarse otros valores de ventas al otorgar otros valores a las variables independientes X1 y X2. Así podrían tomarse decisiones acerca de qué tanto impactan el número de llamadas y la inversión publicitaria a los resultados. Por ejemplo:
Ventas (USD) | Llamadas | Publicidad (USD) |
298654 | 510 | 10000 |
529294 | 750 | 10000 |
Ahora, para determinar el nivel de relación de cada variable independiente con la dependiente, por separado, se mantendrán como constantes según sea el caso.
Relación de Ventas con las llamadas generadas (X1)
Estadísticas de Regresión |
Coeficiente de correlación múltiple | .918 |
Coeficiente de determinación R2 | .844 |
R2 ajustado | 0.825 |
Error típico | 36986.6 |
A N Á L I S I S D E V A R I A N Z A |
| Grados de libertad | Suma de cuadrados | Prom. de los cuadrados | F | Valor crítico de F |
Regresión | 1 | 59333479022 | 59333479022 | 43.37 | 0 |
Residuos | 8 | 10944204978 | 1368025622 | | |
Total | 9 | 70277684000 | | | |
| Coeficientes | SE Coeficientes | Estadístico t | P |
Constante | -197625 | 90436 | -2.19 | 0.60 |
Llamadas | 944.9 | 143.5 | 6.59 | 0 |
Relación de Ventas con la inversión publicitaria (X2)
Estadísticas de Regresión |
Coeficiente de correlación múltiple | 0.316 |
Coeficiente de determinación R2 | 0.1 |
R2 ajustado | 0.0 |
Error típico | 93237.2 |
A N Á L I S I S D E V A R I A N Z A |
| Grados de libertad | Suma de cuadrados | Prom. de los cuadrados | F | Valor crítico de F |
Regresión | 1 | 732207161 | 732207161 | 0.08 | 0.779 |
Residuos | 8 | 69545476839 | 8693184605 | | |
Total | 9 | 70277684000 | | | |
| Coeficientes | SE Coeficientes | Estadístico t | P |
Constante | 347338 | 159938 | 2.17 | 0.062 |
Publicidad | 2.497 | 8.604 | .29 | .779 |
Así, de acuerdo con los cuadros anteriores, se puede deducir que:
- La variable que tiene más relación con ventas, es la de llamadas generadas (X1), ya que su coeficiente de determinación R2 ajustado es de 84%. Por su parte, la inversión publicitaria, parece no estar teniendo un efecto sustancioso en el impacto en ventas. Podría evaluarse con más profundidad y tomarse una decisión en relación con su uso.
La conclusión anterior es la aportación que el análisis de regresión haría al proceso de toma de decisiones de la compañía. Quizá resulte que pueden obtenerse ahorros al disminuir la inversión en publicidad, o incluso eliminarla, continuando fuertemente con el impulso de las llamadas generadas a los clientes de la base de datos.
CONCLUSIONES
De acuerdo con el estudio de regresión múltiple mostrado, se tiene que tanto el número de llamadas generadas por el departamento de telemarketing como la inversión publicitaria afectan directamente a la variable de ventas, aunque en realidad es la primera la que más relación tiene con ésta última. El análisis de regresión múltiple sirvió como herramienta para estudiar el caso, y para comprender el comportamiento de las variables involucradas por lo que la hipótesis establecida se cumple.
En lo que se relaciona con las preguntas de estudio, se concluye que:
- El análisis de regresión múltiple es una herramienta estadística útil y de aplicación real para estudiar un fenómeno administrativo en el que se involucra a más de dos variables.
- Se encontró la relación entre las ventas de impresoras con las llamadas generadas y la publicidad.
- La relación entre las variables independientes y la dependiente es fuerte, aunque en realidad es la primera, la de las llamadas generadas, la que afecta más a los valores de ventas.
El alcance de la presente investigación no contempla otras variantes involucradas en las ventas de telemarketing, por lo que tendría que estudiarse con más profundidad antes de realizarse una recomendación integral acerca de la disminución o cancelación de la inversión publicitaria. Sin embargo, funciona para efectos de mostrar la aplicación del análisis de regresión múltiple.
Este estudio ha sido importante para comprender la extensión del modelo de análisis de regresión simple hacia el múltiple, el cual incluye más de dos variables en el estudio de fenómenos administrativos, siendo más viable su uso en ambientes reales. Desde el punto de vista profesional, la aplicación de esta herramienta será útil para el estudio del comportamiento de variables que afecten los resultados de un fenómeno particular\cite{simbana2014nueva}.