Análisis de regresión lineal

AutorVictoria Eugenia Sánchez García
Páginas287-318
EL AGUA QUE BEBEMOS. LA NECESIDAD DE UN NUEVO SISTEMA DE TARIFAS EN ESPAÑA
ANEXO IV
Análisis de regresión lineal
El análisis de regresión lineal es una técnica estadística utilizada para
estudiar la relación entre variables. Si utilizamos dos variables (regresión
simple) como si utilizamos más de do s (regresión múltiple), el análisi s de
regresión se utiliza para investigar y cuantificar la relación entre la variable
llamada dependiente o criterio (Y) en nuestro caso el consumo de agua de
uso doméstico y una o más variables llamadas predictorias o independientes
(X1,X2, … Xn), en nuestro caso las variables: población, población ocupada,
número de viviendas, renta disponible y precio del agua de uso doméstico.
Vamos a realizar este análisis comenzando por Barcelona y
continuaremos con todas y cada una de las ciudades.
BARCELONA
Con la ciudad de Barcelona iremos explicando detalladamente el proceso
de datos y la interpretación de los resultados, para luego en cada ciudad
omitir esta explicación yendo a los r esultados directamente con el f in de
simplificar y no resultar reiterativo s.
Regresión Simple: BARCELONA
Vamos a comenzar con la variable nº de viviendas por ser la variable con
mayor correlación respecto al consumo del agua de uso domestico (r=
0,976) y continuaremos con la renta disponible precio del agua y finalmente
población siguiendo el orden de correlacion existente descendente
Variables: consumo de agua y nº de viviendas
El valor de R2 = 0,953 significa que el 95,3% de la variación del consumo
del agua está explicada por el nº de viviendas. En principio esto nos permite
afirmar que existe un grado alto de relación pero no nos permite afi rmar que
esta relación sea de tipo causal.
Resum en de l model o
,976
a
,953
,946
853855,014
Modelo
1
R
R cuadrado
R cuadrado
corregida
Error típ . de l a
estima ción
Variables p redictoras: (C onstante), Nº Viviendas Ba rcelona
2003-10
287
VICTORIA EUGENIA SANCHEZ GARCÍA
El R2 corregida es una corrección a la baja de R2 que se basa en el nº de
casos y de variables independientes. En una situación con pocos casos y
muchas variables independientes, R2 puede ser artificialmente alto. En tal
caso, el valor de R2 corregida será sustancia lmente más bajo que el R2. En
nuestro análisis, como hay siete casos y una sola variable independiente (nº
de viviendas), los dos valores de R2 (el corregido y el no corregido) son muy
parecidos.
El error típico de estimación representa una medida de la parte de
variabilidad de la variable dependiente (precio del agua) que no es explicada
por la recta de regresión.
En general, cuanto mejor es el ajuste, más pequeño es este error típico.
Veremos cuando realicemos el mismo a nálisis de regresión lineal pero
respecto al precio, en lugar de respecto al consumo de agua, que el error
típico de la estimación es muy pequeño. En el análisis que nos concierne
ahora, con el consumo como variable dependiente, dado que las cifras son
muy altas en términos absolutos (millones de m3/año)y que las unidades de
medida de consumo de agua y de nº de vivienda es muy dispar, motiva que la
significación no sea un indicador representativo. El error de estimación viene
cuantificado por las varianzas de los predictores. Además, el error de
estimación se basa en análisis de intervalo, no en medidas puntuales. Lo
importante es que la significatividad asociada sea inferior a 0,05, aquí es
donde tiene que cumplirse un requisito, no en el error de estimación.
Cuando no se cumple que la significatividad asociada sea inferior a 0,05,
entonces el error de estimación se dispara (sobre todo en análisis de
regresión múltiple). Como vemos en la siguiente tabla ese requisito se
cumple.
La tabla resumen del ANOVA nos informa sobre si existe o no relaci ón
significativa entre las variab les. El estadístico F permite con trastar la
hipótesis nula de que el valor poblaci onal de R es cero, lo cual, en el modelo
ANOV A
b
8,96E+ 013
1
9,0E+ 013
122,90 5
,000
a
4,37E+ 012
6
7,3E+ 011
9,40E+ 013
7
Regres ión
Residu al
Tot al
Modelo
1
Suma de
cuadra dos
gl
Media
cuadrá tica
F
Sig.
Variab les predic toras: ( Constant e), Nº Viviendas Barcel ona 2003-10
a.
Variab le dependien te: Consum o Agua B arcelona 200 3-10
b.
288
EL AGUA QUE BEBEMOS. LA NECESIDAD DE UN NUEVO SISTEMA DE TARIFAS EN ESPAÑA
de regresión simple, equivale a contrastar la hipótesis de que la pendiente de
la recta de regresión vale cero. El nivel crítico (Sig.) indica que, si suponemos
que el valor poblacional de R es cero, es improbable (probabilidad = 0,000)
que R, en esta muestra, tome el valor 0,976 . Lo cual implica que R es ma yor
que cero y que, en consecuencia, ambas variables están linealmente
relacionadas y son simultáneamente significativas.
El coeficiente correspondiente a la constante es el origen de la recta de
regresión (B0), y el coeficiente correspondiente al nº de viviendas es la
pendiente de la recta de regresión (B1). B1 indica el cambio medio que
corresponde a la variable dependiente (consumo de agua) por cada unidad
de cambio de la variable independiente (nº de viviendas). Así pues, la
ecuación de regresión queda de la siguiente manera:
Pronóstico en consumo de agua = -278,846 + 2E+008. (nº de viviendas)
A cada valor del nº de viviendas le corresponde un pronóstico en precio
del agua basado en una disminución constante (-278,846) más (2E+008)
veces el valor del nº de viviendas.
Coeficientes de regresión estandarizados
Los coeficientes Beta (coeficientes de regresión parcial estandarizados)
son los coeficientes que definen la ecuación de regresión cuando ésta se
obtiene tras estandarizarse las variables originales, es decir, tras convertir las
puntuaciones directas en típicas. Se obtiene de la siguiente manera:
Beta 1 = B1 (Sx/Sy)
En el análisis de regresión simple, el coeficiente de regresión
estandarizado correspondiente a la única variable independiente presente en
la ecuación, coincide exactamente con el coeficiente de correlación de
Pearson. En nuestro caso:
Beta 1 = -278,846 (12.830,829 / 3.664.121,414) = -0,9764
Comprobamos que efectivamente co incide con el coeficiente de Pearson.
Coeficientes
a
2E+008
2E+007
15,352
,000
-278,846
25,152
-,976
-11,086
,000
(Constan te)
Nº Viviendas
Barcelona 20 03-10
Modelo
1
B
Error típ.
Coeficien tes no
estandar izados
Beta
Coeficien tes
estandar izad
os
t
Sig.
Variable dep endiente: Con sumo Agu a Barcelon a 2003-10
a.
289

Para continuar leyendo

Solicita tu prueba

VLEX utiliza cookies de inicio de sesión para aportarte una mejor experiencia de navegación. Si haces click en 'Aceptar' o continúas navegando por esta web consideramos que aceptas nuestra política de cookies. ACEPTAR