Objetivo General 

La aplicación del análisis de regresión múltiple en temas de administración, economía y finanzas, entre otros, es útil cuando se estudia la relación lineal que existe entre una variable dependiente (z) y dos o más variables independientes (x, y). 
El objetivo de este estudio es explicar el uso y la aplicación de esta técnica estadística, mediante la ejemplificación de un caso de generación de demanda de un producto (impresoras) por medio de la aplicación de la táctica de mercadotecnia directa conocida como telemarketing o telemercadeo, asimismo conocer el impacto que tiene en las finanzas de la empresa.

Antecedentes 

Aunque el análisis de regresión simple es útil y representativo para comprender la importancia de medir el nivel de relación entre dos variables, una dependiente y otra independiente, cuando se pretende hacer un estudio real acerca de ciertos fenómenos económicos y administrativos no resulta funcional, dado que en éstos suelen verse involucradas más de dos variables independientes. El análisis de regresión múltiple, por su parte, funciona como una extensión del simple, logrando involucrar más de dos variables independientes y explicando su impacto en la que se denomina como dependiente.
Para explicar el comportamiento y la aplicación del análisis de regresión múltiple, se ha tomado como referencia un caso de estudio de administración real, en el que se pretende encontrar el nivel de relación que existe entre las ventas de impresoras de marca propia y remarketing (usadas) de cierta compañía de cómputo, con la inversión publicitaria y el número de llamadas realizadas a clientes potenciales mediante el telemercadeo.

Justificación 

La necesidad de aplicar técnicas estadísticas de regresión múltiple para comprender el comportamiento y la relación entre dos o más variables es más común en un ambiente real que la técnica de regresión simple.
La razón es obvia. En el mundo real, todos los fenómenos de estudio son fácilmente influenciados por dos o más factores, y aunque en muchas ocasiones es necesario delimitar el número de variantes para lograr un estudio matemático de los mismos, también es cierto que entre más variables de un mismo caso puedan ser estudiadas e incluidas en la investigación, las conclusiones serán más completas e integrales, y podrán servir de apoyo en el proceso de toma de decisiones.

Pregunta de investigación 

Hipótesis:

El nivel de inversión publicitaria y el número de llamadas realizadas a la base de datos de clientes actuales y potenciales de cierta compañía de cómputo, mediante su departamento de telemarketing, han impactado directamente a las ventas de impresoras de marca propia y usadas en los últimos 10 años. La aplicación de un análisis de regresión múltiple servirá para estudiar el caso y comprender el comportamiento de las variables involucradas en el estudio y observar si esto es favorable para las finanzas de la empresa.
 

MARCO TEÓRICO

La estadística está formada por un conjunto de herramientas matemáticas que apoyan a los administradores en las tareas de toma de decisiones al mostrar los patrones de comportamiento de ciertas variables y fenómenos, así como las correspondencias entre éstos. También son útiles para visualizar el futuro, basándose en datos del pasado y con la ayuda de las técnicas de probabilidad.  
Para algunas funciones, tales como la de mercadotecnia (que en este caso de estudio se ocupa de coordinar los esfuerzos de telemarketing) sería imposible tomar decisiones sin el apoyo de la estadística y sus herramientas. Las organizaciones son ricas en información, la cual es útil sólo si se encuentra disponible y se aprovecha de la forma más conveniente.
Para la función de marketing, existen cuatro aspectos de la información importantes: los datos operativos, marketing inteligente, la construcción y mantenimiento de las bases de datos, y la administración de las relaciones con los clientes.
El análisis de regresión múltiple forma parte de la estadística y es en realidad una extensión del análisis de regresión simple,  que aplica para situaciones en las que se involucra a dos o más variables independientes, considerando su nivel o grado de asociación con la variable dependiente.
Con la finalidad de dejar más claro todo lo relacionado con en análisis de regresión estadístico, se incluyen las siguientes definiciones generales: 
Análisis de regresión: es el conjunto de técnicas estadísticas que se utilizan para medir la intensidad de la asociación entre dos variables. El principal objetivo de este análisis es determinar  la intensidad de la naturaleza de la relación entre las mismas. Cuando esta técnica se amplía a fenómenos en los que intervienen más de dos variables independientes, se le conoce como análisis de regresión múltiple. Variable Dependiente: es la variable que se predice o calcula. Su representación más común es mediante la letra Z . Variable Independiente: es la variable que proporciona las bases para el cálculo. Se representan mediante las letras X y Y (dos variables) o se enumeran como X1, X2, X3… cuando se trata de más de dos variables independientes.
Coeficiente de Correlación: describe la intensidad de la relación lineal entre las variables. Aplica tanto para estudios de regresión simple como múltiple.  

Ecuación de Regresión Múltiple

Entonces, si se cree que existe una relación lineal entre una variable dependiente z, y dos independientes (x, y), se buscará una ecuación de la forma: z= a + bx + cy, la cual se denomina como ecuación de regresión de z sobre x, y
Para encontrar el grado de relación entre las variables, se puede estudiar el coeficiente de correlación múltiple (Ry12, para el caso de dos variables), el cual indica la relación que se forma entre las dos variables independientes, tomadas como grupo, y la dependiente. Sin embargo, es posible que una variable independiente mantenga una relación positiva con la dependiente, mientras que la otra lo haga de forma negativa. Todos los resultados del coeficiente de relación múltiple se reportan sin signo aritmético.
Por su parte, existe también el coeficiente de determinación múltiple el cual indica la proporción de varianza de la variable dependiente que se contabiliza estadísticamente para conocimiento de las dos variables independientes. 
En el análisis de correlación múltiple se asume, al igual que en el simple, que: (1) las variables son al azar (2) la relación entre éstas es lineal, (3) las varianzas condicionales son iguales, (4) para cada variable, los valores observados son independientes de los otros, y (5) las distribuciones condicionales son normales. 
El análisis de regresión múltiple es una técnica de dependencia, lo cual significa que todo experimentador debe ser capaz de clasificar las variables que intervienen como dependientes o independientes. Dado que es una herramienta estadística, este tipo de análisis utiliza variables cuantificables. Sólo en ocasiones muy especiales, se podrían considerar datos no numéricos
Para complementar en análisis de regresión múltiple, se consideran otros conceptos estadísticos, tales como el coeficiente de correlación parcial, que indica la relación que existe entre una variable independiente y la dependiente.  Si denotamos como r123 como el coeficiente de correlación parcial entre X1 (variable dependiente) y X2 (variable independiente 1), manteniendo X3 constante (variable independiente 2) se tiene que:
Además, se puede estudiar el coeficiente de determinación parcial, que indica la varianza estadística proporcional para una variable independiente, cuando la otra se mantiene como constante. Por otro lado, el error estándar de estimación está dado por:
El único inconveniente con el análisis de regresión múltiple, a diferencia del simple, es que con el primero no es posible graficar el comportamiento de relación en dos dimensiones, como se hace con los diagramas de dispersión en el segundo (Schmuller, 2005)
El análisis de regresión múltiple es una técnica de dependencia, lo cual significa que el experimentador debe ser capaz de clasificar las variables que intervienen como dependientes o independientes. Dado que es una herramienta estadística, este tipo de análisis utiliza variables cuantificables. Sólo en ocasiones muy especiales, se podrían considerar datos no numéricos (Stamatis, 2003)

Pasos necesarios

Para efectos del presente estudio, el análisis de regresión se realizará con los siguientes pasos, de acuerdo con los resultados que el software MINITAB 14 genera:
1.- Obtener las estadísticas de regresión (coeficiente de correlación múltiple, coeficiente de determinación R2, R2 ajustado y error típico)
2.- Desarrollar conclusiones pertinentes de acuerdo con las estadísticas de regresión
3.- Análisis de varianza, con grados de libertad, suma de cuadrados, promedio de los cuadrados, F, y valor crítico de F. También se analizarán (para cada variable) los coeficientes, el error típico, estadístico t y la probabilidad.
4.- Desarrollar la ecuación de regresión múltiple
5.- Aplicar las estadísticas de regresión entre la variable dependiente y cada una de las variables independientes por separado, para determinar cuál está más relacionada con la variable dependiente Z.

Software Disponible

Existen una gran cantidad de aplicaciones de software disponibles para el desarrollo de análisis de regresión. Entre las más conocidas se encuentran MINITAB 14 y Microsoft Excel. Para efectos del presente estudio, se utilizará MINITAB 14. Para el uso de MINITAB se ha consultado el libro “Statistics for Six Sigma Made Easy”, descrito en la bibliografía de este estudio.

DESARROLLO DE PROYECTO

Descripción de la investigación

Cierta compañía de tecnología (el nombre no será revelado por cuestiones de confidencialidad) demostró su capacidad de innovación al ser una de las primeras en promover la venta de sus equipos de impresoras de marca propia y remarketing (usados) por medio de las ventas por teléfono o telemarketing.
Dado que la dedicación al éxito de sus clientes es uno de los valores de la compañía, el departamento de Marketing tiene la responsabilidad de transmitir exitosamente el mensaje de innovación de la empresa entre su comunidad de clientes, y apoyar así a éstos, en la toma de la decisión para la implementación de las soluciones que ofrece.
"Nuestra tarea es transformar la dedicación al éxito de nuestros clientes en un mensaje de innovación que podamos transmitir al mercado, y que nos permita crear relaciones de confianza con éstos. Al final, como unidad de staff, tenemos también que pensar en equilibrar costos y en los resultados a corto y mediano plazo, porque si por un lado es cierto que en Marketing tenemos la obligación de pensar y visualizar a largo plazo, también tenemos que ofrecer resultados en un corto periodo de tiempo", explica su director de mercadotecnia.
Dentro de la unidad de marketing de la empresa se encuentra el departamento de bases de datos, el cual se encarga mantener actualizada la información de los clientes y de crear el puente de información con el departamento externo de telemarketing, quienes a su vez, tienen la tarea de promover los artículos de consumo que la empresa vende entre sus clientes actuales y potenciales, mediante llamadas personales y la distribución de propaganda y ofertas especiales.
El departamento de telemarketing de esta compañía ofrece a los clientes una variada gama de productos de consumo, que van desde impresoras hasta terminales de punto de venta, unidades de CD/DVD internas y externas, y servidores de pequeño alcance.

Pasos de investigación

Para la presente investigación, se han realizado los siguientes pasos:
1.   Delimitación del alcance del estudio a un sólo producto: las impresoras de marca propia y remarketing, entendiéndose por éstos últimos a los equipos de impresión que son recolectados de los clientes de outsourcing, reparados, y vendidos como equipos usados.
2.   Las variables que impactan a las ventas de telemarketing son diversas, sin embargo se han seleccionado dos: la inversión en publicidad y las llamadas generadas a clientes
3.  Del total de ventas de telemarketing por año se extrajeron los valores correspondientes a los porcentajes de venta de equipos de impresión. Lo mismo se hizo con la inversión en publicidad y el número de llama Los datos resultantes se muestran en la siguiente tabla:
Año
Ventas (USD)
Llamadas
Publicidad (USD)
1996
264000
550
15840
1997
384000
590
19250
1998
400200
680
26013
1999
422400
700
16896
2000
543000
750
16290
2001
285500
500
13765
2002
345000
570
17600
2003
410500
630
22470
2004
515000
730
15790
2005
360000
550
18790
Dado que el  análisis de regresión múltiple es una extensión del análisis de regresión simple, y aplica para situaciones en las que se involucra a dos o más variables independientes, considerando su nivel o grado de asociación con la variable dependiente (Kazmier, 2003), se utilizará esa técnica para encontrar el nivel de relación entre las variables de estudio.

RESULTADOS

Análisis de datos

Para el análisis se utilizaron las siguientes variables: ventas (variable dependiente), número de llamadas generadas (variable independiente X1) e inversión publicitaria (variable independiente X2)
ingresar a MINITAB 14 los datos, se obtienen las siguientes estadísticas de regresión: (el coeficiente de correlación múltiple se obtiene de la raíz cuadrada del coeficiente de determinación R2. MINITAB no lo muestra abiertamente)
Estadísticas de Regresión
Coeficiente de correlación múltiple
0.92195
Coeficiente de determinación R2
0.85
R2 ajustado
0.808
Error típico
38747.3
De lo anterior, se puede deducir que:
- Al observar el coeficiente de correlación múltiple, se puede afirmar que tanto el número de llamadas generadas como la inversión en publicidad guardan una relación muy estrecha con la variable dependiente, ventas. (92% de relación).
- Gracias al coeficiente de determinación R2, se puede determinar que el 85% de las ventas están explicadas y justificadas por la realización de las llamadas y los gastos de publicidad.
A N Á L I S I S D E V A R I A N Z A
 
Grados de libertad
Suma de cuadrados
Prom. de los cuadrados
F
Valor crítico de F
Regresión
2
59768213336
29884106668
19.90
0.001
Residuos
7
10509470664
1501352952
 
 
Total
9
70277684000
 
 
 
 
 
 
Coeficientes
SE Coeficientes
Estadístico t
P
Constante
-171836
106172
-1.62
.150
Llamadas
961
153.3
6.27
0
Publicidad
-1.962
3.646
-0.54
.607
 
De lo anterior, se desprende la ecuación de regresión múltiple:
                        Y = -171836 + 961 X1 – 1.962 X2
Por medio de esta ecuación, pueden ahora determinarse otros valores de ventas al otorgar otros valores a las variables independientes X1 y X2. Así podrían tomarse decisiones acerca de qué tanto impactan el número de llamadas y la inversión publicitaria a los resultados. Por ejemplo:
Ventas (USD)
Llamadas
Publicidad (USD)
298654
510
10000
529294
750
10000
Ahora, para determinar el nivel de relación de cada variable independiente con la dependiente, por separado, se mantendrán como constantes según sea el caso.
Relación de Ventas con las llamadas generadas (X1)
Estadísticas de Regresión
Coeficiente de correlación múltiple
.918
Coeficiente de determinación R2
.844
R2 ajustado
0.825
Error típico
36986.6
 
A N Á L I S I S D E V A R I A N Z A
 
Grados de libertad
Suma de cuadrados
Prom. de los cuadrados
F
Valor crítico de F
Regresión
1
59333479022
59333479022
43.37
0
Residuos
8
10944204978
1368025622
 
 
Total
9
70277684000
 
 
 
 
 
Coeficientes
SE Coeficientes
Estadístico t
P
Constante
-197625
90436
-2.19
0.60
Llamadas
944.9
143.5
6.59
0
 
Relación de Ventas con la inversión publicitaria (X2)
 Estadísticas de Regresión
Coeficiente de correlación múltiple
0.316
Coeficiente de determinación R2
0.1
R2 ajustado
0.0
Error típico
93237.2
 
A N Á L I S I S D E V A R I A N Z A
 
Grados de libertad
Suma de cuadrados
Prom. de los cuadrados
F
Valor crítico de F
Regresión
1
732207161
732207161
0.08
0.779
Residuos
8
69545476839
8693184605
 
 
Total
9
70277684000
 
 
 
 
 
Coeficientes
SE Coeficientes
Estadístico t
P
Constante
347338
159938
2.17
0.062
Publicidad
2.497
8.604
.29
.779
Así, de acuerdo con los cuadros anteriores, se puede deducir que:
-          La variable que tiene más relación con ventas, es la de llamadas generadas (X1), ya que su coeficiente de determinación R2 ajustado es de 84%. Por su parte, la inversión publicitaria, parece no estar teniendo un efecto sustancioso en el impacto en ventas. Podría evaluarse con más profundidad y tomarse una decisión en relación con su uso.
La conclusión anterior es la aportación que el análisis de regresión haría al proceso de toma de decisiones de la compañía. Quizá resulte que pueden obtenerse ahorros al disminuir la inversión en publicidad, o incluso eliminarla, continuando fuertemente con el impulso de las llamadas generadas a los clientes de la base de datos.
CONCLUSIONES
De acuerdo con el estudio de regresión múltiple mostrado, se tiene que tanto el número de llamadas generadas por el departamento de telemarketing como la inversión publicitaria afectan directamente a la variable de ventas, aunque en realidad es la primera la que más relación tiene con ésta última. El análisis de regresión múltiple sirvió como herramienta para estudiar el caso, y para comprender el comportamiento de las variables involucradas por lo que la hipótesis establecida se cumple.
En lo que se relaciona con las preguntas de estudio, se concluye que:
 
El alcance de la presente investigación no contempla otras variantes involucradas en las ventas de telemarketing, por lo que tendría que estudiarse con más profundidad antes de realizarse una recomendación integral acerca de la disminución o cancelación de la inversión publicitaria. Sin embargo, funciona para efectos de mostrar la aplicación del análisis de regresión múltiple.
Este estudio ha sido importante para comprender la extensión del modelo de análisis de regresión simple hacia el múltiple, el cual incluye más de dos variables en el estudio de fenómenos administrativos, siendo más viable su uso en ambientes reales. Desde el punto de vista profesional, la aplicación de esta herramienta será útil para el estudio del comportamiento de variables que afecten los resultados de un fenómeno particular\cite{simbana2014nueva}.