El libro de Maza Zavala y González, aquí el enlace:
https://mega.nz/#!scwwGYaK!4C-NT8jgL6mgr1U1Lyb4LfmdCAv0Dds6KXGldurKpRw
Espero lo disfruten.
Este es un blog de Economía general, creado para transmitir ideas, pensamientos, material de apoyo y una forma de comunicación.
Buscar en el blog
miércoles, 7 de noviembre de 2018
miércoles, 12 de septiembre de 2018
EJERCICIOS DE REGRESIÓN LINEAL MÚLTIPLE
EJERCICIOS DE REGRESIÓN LINEAL MÚLTIPLE
1.- El gerente
de ventas de una compañía de distribución de repuestos para automóviles, quiere
predecir las ventas anuales totales. El número de repuestos de cada estado que
mantiene en inventario y el número de automóviles nuevos registrados (últimos 5
años) para cada estado, son las dos variables de predicción que el gerente
quiere investigar. Este obtiene los siguientes datos.
Región
|
Ventas
(millones)
y
|
Número
de repuestos
|
Número
de automóviles nuevos reg. (miles)
|
Caracas
|
52.3
|
2011
|
24,6
|
Zulia
|
26.0
|
2850
|
22,1
|
Táchira
|
20.2
|
650
|
7,9
|
Miranda
|
16.0
|
480
|
12,5
|
Aragua
|
30.0
|
1694
|
9,0
|
Carabobo
|
46.2
|
2302
|
11,5
|
Anzoátegui
|
35.0
|
2214
|
20,5
|
Nueva
Esparta
|
3.5
|
125
|
4,1
|
Bolívar
|
33.1
|
1840
|
8,9
|
Lara
|
25.2
|
1233
|
6,1
|
Cojedes
|
38.2
|
1699
|
9,5
|
a) Analice la
matriz de correlación b) ¿Son válidos
los coeficientes de regresión? c) ¿Cuál
es el error involucrado en el pronóstico para región 1 d) Indique cómo se calculó el error estándar
de la estimación e) ¿Cómo puede mejorar
esta ecuación de regresión?
Análisis
de Regresión Múltiple
-----------------------------------------------------------------------------
Variable
dependiente: Y
-----------------------------------------------------------------------------
Error Estadístico
Parámetro Estimación estándar T P-Valor
-----------------------------------------------------------------------------
CONSTANTE 10,1093 7,21956 1,40026 0,1990
X2 0,0109889 0,00520014 2,11319 0,0675
X3 0,19466 0,639844 0,304231 0,7687
-----------------------------------------------------------------------------
Análisis de Varianza
-----------------------------------------------------------------------------
Fuente Suma de cuadrados GL Cuadrado medio Cociente-F P-Valor
-----------------------------------------------------------------------------
Modelo 1043,66 2
521,832 4,91 0,0405
Residuo 849,564
8
106,196
-----------------------------------------------------------------------------
Total (Corr.) 1893,23
10
R-cuadrado =
55,1262 porcentaje
R-cuadrado
(ajustado para g.l.) = 43,9077 porcentaje
Error estándar de
est. = 10,3051
Error absoluto
medio = 6,22424
Estadístico de
Durbin-Watson = 2,45921 (P=0,1735)
Autocorrelación
residual en Lag 1 = -0,401176
Y = 10,1093 + 0,0109889*X2 + 0,19466*X3
Matriz de correlación de los estimadores de los
coeficientes
-----------------------------------------------------------------------------
CONSTANTE X2 X3
CONSTANTE 1,0000 0,7390 0,5480
X2 0.7390 1,0000
0.6700
X3 0.5480
0.6700
1,0000
-----------------------------------------------------------------------------
y
|
X2
|
X3
|
Pronóstico
|
ME
|
52,3
|
2011
|
24,6
|
36,51
|
15,79
|
26
|
2850
|
22,1
|
36,51
|
-10,51
|
20,2
|
650
|
7,9
|
36,51
|
-16,31
|
16
|
480
|
12,5
|
36,51
|
-20,51
|
30
|
1694
|
9
|
36,51
|
-6,51
|
46,2
|
2302
|
11,5
|
36,51
|
9,69
|
35
|
2214
|
20,5
|
36,51
|
-1,51
|
3,5
|
125
|
4,1
|
36,51
|
-33,01
|
33,1
|
1840
|
8,9
|
36,51
|
-3,41
|
25,2
|
1233
|
6,1
|
36,51
|
-11,31
|
38,2
|
1699
|
9,5
|
36,51
|
1,69
|
a) El número
de distribuidoras se relaciona con las ventas anuales y es una buena variable de predicción
potencial. El número de automóviles
registrados tiene una relación moderada con las ventas anuales y, debido a la multicolinealidad ,
no será un buen predictor junto con el número de distribuidoras
b) NO, la
multicolinealidad está presente y causa que los coeficientes de regresión no
sean confiables.
c) el error
involucrado en el pronóstico para la región 1 es 15.79
d) Del
análisis de varianza obtenemos el valor de residuo
=10.3
e)
Se deben probar nuevas variables de predicción
El
gerente decide investigar una nueva variable de predicción: el ingreso personal en la región. Los datos para esta nueva variable son:
Región
|
Ingreso
Personal
(miles
de millones)
|
1
|
98.5
|
2
|
31.1
|
3
|
34.8
|
4
|
32.7
|
5
|
68.8
|
6
|
94.7
|
7
|
67.6
|
8
|
19.7
|
9
|
67.9
|
10
|
61.4
|
11
|
85.6
|
f) ¿Es el
ingreso personal por región una buena variable de predicción potencial?
g) ¿Qué porcentaje de la varianza en las
ventas se explicará usando solamente el ingreso personal como variable de
predicción? h) ¿Qué porcentaje de la
varianza en las ventas se explicará usando las tres variables de
predicción? i) ¿Explica la ecuación de
predicción de la ejecución número 1 un porcentaje significativo de la varianza
en las ventas? Pruebe a un nivel de
significancia del 5% j) Realice una
prueba con un nivel de significancia del 5% para determinar si se debe usar
cada una de las tres variables de predicción
k) Realice una prueba con un nivel de significancia del 5% para
determinar si el ingreso personal y el número de distribuidoras deben usarse para predecir las ventas. l) realice una prueba con un nivel de
significancia del 5% para determinar si el ingreso personal y el número de
automóviles registrados deben usarse para predecir las vetas m) ¿Qué modelo debe usar el gerente? n) Interprete el coeficiente de regresión
estimados para la ecuación del punto j
o) ¿Son válidos estos coeficientes de regresión? p) Analice la exactitud de este modelo
Ejecución 1
Análisis
de Regresión Múltiple
-----------------------------------------------------------------------------
Variable
dependiente: Y
-----------------------------------------------------------------------------
Error Estadístico
Parámetro Estimación estándar T P-Valor
-----------------------------------------------------------------------------
CONSTANTE -3,9177 2,29017 -1,71066 0,1309
X2 0,00238409 0,00157212 1,51648 0,1732
X3 0,457426 0,167499 2,73091 0,0293
X4 0,400576 0,0377914 10,5996 0,0000
-----------------------------------------------------------------------------
Análisis de Varianza
-----------------------------------------------------------------------------
Fuente Suma de cuadrados GL Cuadrado medio Cociente-F P-Valor
-----------------------------------------------------------------------------
Modelo 1843,4 3
614,467 86,32 0,0000
Residuo 49,8268 7
7,11812
-----------------------------------------------------------------------------
Total (Corr.) 1893,23 10
R-cuadrado =
97,3682 porcentaje
R-cuadrado
(ajustado para g.l.) = 96,2402 porcentaje
Error estándar de
est. = 2,66798
Error absoluto
medio = 1,65087
Estadístico de
Durbin-Watson = 2,01049 (P=0,4483)
Autocorrelación residual
en Lag 1 = -0,013595
Ejecución
2
Análisis
de Regresión Múltiple
-----------------------------------------------------------------------------
Variable
dependiente: Y
-----------------------------------------------------------------------------
Error Estadístico
Parámetro Estimación estándar T P-Valor
-----------------------------------------------------------------------------
CONSTANTE -4,0269 2,46799
-1,63165 0,1414
X3 0,620922 0,13821 4,49259 0,0020
X4 0,430169 0,0348932 12,3281 0,0000
-----------------------------------------------------------------------------
Análisis de Varianza
-----------------------------------------------------------------------------
Fuente Suma de cuadrados GL Cuadrado medio Cociente-F P-Valor
-----------------------------------------------------------------------------
Modelo 1827,03 2
913,516 110,40 0,0000
Residuo 66,1964 8
8,27455
-----------------------------------------------------------------------------
Total (Corr.) 1893,23 10
R-cuadrado =
96,5035 porcentaje
R-cuadrado
(ajustado para g.l.) = 95,6294 porcentaje
Error estándar de
est. = 2,87655
Error absoluto
medio = 2,18538
Estadístico de
Durbin-Watson = 2,17004 (P=0,2940)
Autocorrelación
residual en Lag 1 = -0,100016
Ejecución 3
Análisis
de Regresión Múltiple
-----------------------------------------------------------------------------
Variable
dependiente: Y
-----------------------------------------------------------------------------
Error Estadístico
Parámetro Estimación estándar T P-Valor
-----------------------------------------------------------------------------
CONSTANTE -1,60819 2,86116
-0,562076 0,5895
X2 0,00514754 0,00161745 3,1825 0,0129
X4 0,385301 0,0502448 7,66847 0,0001
-----------------------------------------------------------------------------
Análisis de Varianza
-----------------------------------------------------------------------------
Fuente Suma de cuadrados GL Cuadrado medio Cociente-F P-Valor
-----------------------------------------------------------------------------
Modelo 1790,32 2
895,158 69,59 0,0000
Residuo 102,913 8
12,8641
-----------------------------------------------------------------------------
Total (Corr.) 1893,23 10
R-cuadrado =
94,5642 porcentaje
R-cuadrado
(ajustado para g.l.) = 93,2052 porcentaje
Error estándar de
est. = 3,58666
Error absoluto
medio = 2,57292
Estadístico de
Durbin-Watson = 1,0611 (P=0,0568)
Autocorrelación residual
en Lag 1 = 0,298956
Matriz de
correlación de los estimadores de los coeficientes
-----------------------------------------------------------------------------
CONSTANTE X2 X3
X4
CONSTANTE 1,0000 0,739
0.548 0.936
X2 0.739 1,0000
0.670 0.556
X3 0.548 0.670 1,0000
0.281
X4 0.936 0.556
0.281 1,0000
-----------------------------------------------------------------------------
f) Si, el ingreso personal tiene una fuerte
relación con las ventas anuales
g)
h)
i)
Las hipótesis nula y alternativa son:
En la salida
del análisis de varianza de la ejecución 1, se observa que el p-valor del
modelo es 0.000 y como ,
por tanto se rechaza la hipótesis nula y el gerente concluye que la ecuación de
regresión muestral explica un porcentaje significativo de la varianza en las
ventas
j) Las hipótesis adecuadas
son:
El ingreso
personal (es una variable significativa, lo mismo
que el número de registros ( ya que el p-valor es 0.000 y 0.0293 por el
contrario el número de distribuidoras no es una variable significativa
k) Las variables que deben
probarse están en la ejecución número 3.
Las hipótesis adecuadas son:
La hipótesis
nula se rechaza de acuerdo con los p-valores 0.0129 y 0.0001 respectivamente,
por tanto el gerente concluye que ambas variables explican una parte
significativa de la varianza en las ventas.
l) Las
variables que deben probarse están en la ejecución número 2. Las hipótesis adecuadas son:
La hipótesis nula se rechaza de acuerdo con los p-valores
0.0020 y 0.000 respectivamente, el gerente concluye que ambas variables
explican una porción significativa de la varianza en las ventas.
m) El gerente de ventas debe elegir el modelo que incluye a
los automóviles registrados y al ingreso personal por que explican un mayor porcentaje de la
varianza
n) La ecuación es . Si el número de automóviles registrados en la
región aumenta en un millón, mientras que el ingreso personal se mantiene
constante, las ventas aumentarán en un promedio de 620.920. Si el ingreso personal aumenta en mil
millones, mientras que el número de automóviles registrados se deja constante,
las ventas aumentarán en promedio de 430.170
o) Los coeficientes de regresión deben ser válidos, ya que
las variables 3 y 4 tiene una relación muy fuerte entre ellas ( de manera que la multicolinealidad no es un
problema.
p) El modelo explica el 96.5% de la varianza en las ventas y
debe ser bastante adecuado. Cada
pronóstico se aleja alrededor de 2.877 millones (el valor de la desviación
estándar de la estimación) (Ejecución
número 2)
2.- Un promotor inmobiliario
quiere comprar un conjunto de galpones industriales en el Municipio Caroní.
Para conocer las características y el valor de los inmuebles, fue al Registro
Subalterno y escogió al azar los inmuebles vendidos que se detallan a
continuación, con sus respectivas características:
Inmueble
|
superficie (m cuadrado)
|
oficinas
|
baños
|
antigüedad (años)
|
valor (miles bs.)
|
1
|
2310
|
2
|
2
|
20
|
1420000
|
2
|
2333
|
2
|
2
|
12
|
1440000
|
3
|
2356
|
3
|
1,5
|
33
|
1510000
|
4
|
2273
|
3
|
2
|
40
|
3600000
|
5
|
2402
|
2
|
3
|
53
|
1390000
|
6
|
2425
|
4
|
2
|
23
|
1690000
|
7
|
2448
|
2
|
1,5
|
99
|
1260000
|
8
|
2471
|
2
|
2
|
34
|
1429000
|
9
|
2494
|
3
|
3
|
23
|
1630000
|
10
|
2517
|
4
|
4
|
55
|
1890000
|
11
|
2540
|
2
|
3
|
22
|
1490000
|
3.- Suponga que hemos
estimado la regresión múltiple siguiente:
En cada una de las siguientes
afirmaciones, indique si está o no está de acuerdo, justificando su respuesta:
a.- Si es 10 veces , entonces podemos inferir que la
variable es más importante que la variable con respecto a la variación de Y.
b.- mide el cambio esperado en Y como consecuencia
de un aumento de en una unidad.
c.- Las variaciones de y
explican en una proporción las variaciones de
Y.
d.- 1,79% de la varianza de Y
no son explicadas por y
4.- Se pretenden estimar los
gastos en alimentación de una familia en base a la información que proporcionan
las variables regresoras 'ingresos mensuales y 'número de miembros de la familia'.
Para ello se recoge una muestra aleatoria simple de 15 familias, cuyos
resultados se facilitan en la tabla adjunta. (El gasto e ingreso se expresan en
cien mil dólares).
5.- Se desea estimar el siguiente
modelo:
6.- Dados los siguientes conjuntos de
datos:
Calcular
la recta de regresión de los conjuntos de datos y dibujarla en´el diagrama de
dispersión, considerando como variables independientes las variables U,W,X. Realice
el respectivo análisis econométrico.
7.- Un gerente de recursos humanos desea determinar el salario que debe
pagar a cierta categoría de obreros. Para determinar dicho salario que debe
pagar a cierta categoría de obreros. Para determinar dicho salario se realiza
un estudio en el que intervienen las variables Salario Mensual (en miles de Bs),
Nivel de Producción Anual en la Empresa (en millones de Bs) y Nivel de especialización
Media del Trabajador (de 0 a 10). El gerente obtiene esta serie de resultados:
8.- Las
calificaciones obtenidas por 10 alumnos en los exámenes del prime, segundo y
tercer corte son:
Alumno
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
1er corte
|
10
|
12
|
08
|
19
|
15
|
07
|
06
|
14
|
12
|
11
|
2º corte
|
10
|
14
|
07
|
20
|
16
|
12
|
05
|
10
|
13
|
08
|
3er corte
|
09
|
13
|
12
|
18
|
13
|
10
|
10
|
08
|
14
|
11
|
Realice el análisis econométrico correspondiente.
9.- No es algo desconocido el
hecho de que las entradas de turistas extranjeros en Venezuela no han hecho
sino crecer de forma continuada durante las últimas décadas, coadyuvando a este
hecho las peculiares características climatológicas, económicas y culturales de
nuestro país. A partir de esta idea de principio, se ha querido ahondar en el
tema, analizando si la riqueza del turista y la distancia de su país al nuestro
son factores vinculantes a la hora de tomar la decisión de visitarnos. Para
ello, hemos recogido en la siguiente tabla las entradas de turistas procedentes
de 5 países diversos para un determinado ejercicio económico, junto con su PIB
per capita (en miles de euros) y la distancia en kilómetros desde cada uno de
los países considerados al nuestro:
A partir de tal información, se le pide que:
a) Determine la relación lineal que explicaría las
entradas de turistas en función del PIB per
cápita y de la distancia.
b) ¿Es dicho modelo suficientemente explicativo?
c) ¿Cuál de las dos variables explicativas está más
correlacionada con la entrada de turistas?
10.- Una determinada cooperativa
agrícola dedicada a la producción y comercialización de fresas se plantea hacer
un estudio para explicar el volumen de sus ventas (X1), expresadas en millones
de pesetas. Para ello, a partir de los datos semestrales obtenidos desde la
creación de la cooperativa,
se plantea un modelo lineal usando
como variables explicativas el gasto en publicidad (X2), expresado en millones
de pesetas, y el número de supermercados que comercializan sus productos (X3).
Seguidamente recogemos la información de la que dispone la empresa:
1.
Determine el modelo de regresión planteado e interprete
sus coeficientes, indicando a su vez
cuál es la capacidad explicativa del mismo.
2.
A partir de los resultados obtenidos en el apartado
anterior, ¿sugeriría usted que pueden existir otras variables no tenidas en cuenta
aquí y de importancia relevante para la explicación de las ventas?
Suscribirse a:
Entradas (Atom)