Anexo A. Comprobación de las asunciones de los modelos

AutorAlfonso Serrano Maíllo
Cargo del AutorDoctor en Derecho por la Universidad Complutense de Madrid
Páginas277-306

Page 277

La regresión lineal multivariante de acuerdo con el método de los mínimos cuadrados ordinarios constituye, como es sabido, una herramienta de rancia tradición y habitual uso en las ciencias humanas y sociales y en Criminología en particular1. El mismo constituye un tipo de análisis muy sólido cuando se cumplen sus asunciones, e incluso en el caso de violación más o menos moderada de algunas de ellas. Dicho con otras palabras, es un método bastante robusto. A la vez, cuenta con la sobresaliente ventaja de que sus asunciones han sido estudiadas de modo prácticamente exhaustivo2, de manera que las condiciones en las que aquéllas pueden considerarse cumplidas son conocidas; igual que el proceder para comprobarlo formalmente -en realidad, el cumplimiento o violación de las asunciones de los modelos es a menudo más una cuestión de grado que de blanco o negro-; así como las consecuencias de los incumplimientos y las formas, en su caso, bien de introducir correcciones o bien de recurrir a métodos estadísticos alternativos más flexibles que tomen en cuenta estas desviaciones de las exigencias del modelo. Por último, también es robusto para el caso de muestras pequeñas y relativamente pequeñas. Naturalmente, en todas estas áreas sigue avanzándose, pero puede afirmarse que el modelo de los mínimos cuadrados ordinarios se encuentra en una situación ventajosa frente a otras alternativas en regresión. A la vez y como acaba de decirse, existen recientes aproximaciones más generales que tratan de flexibilizar las asunciones del modelo de los mínimos cuadrados, o bien corregir determinadas vulneraciones de las mismas, pero es dudoso que estén en condiciones, en Criminología, de sustituir por defecto a aquél por el momento3. Habiendo dicho lo anterior, es menester insistir en las dramáticas consecuencias que pueden tener violaciones, incluso leves, de dichas asunciones. A continuación y para el presente estudio, procedemos a revisarlas y ofrecemos correcciones o formas

Page 278

alternativas de estimación en los casos en que no se cumplan. En todo ello seguiremos fielmente a la rica literatura en la materia. En todo lo que sigue me referiré, fundamentalmente y salvo indicación en contrario, a nuestro modelo completo.

La regresión lineal múltiple según el método de los mínimos cuadrados ordinarios exige en primer lugar que la variable dependiente se encuentre medida, al menos, a nivel de intervalo4. Es posible considerar que, en la naturaleza, las variables son por regla continuas, solo que en ocasiones no es posible medirlas a este nivel5. Lo relevante, pues, es el nivel al que se ha medido una variable, así como su distribución. Nuestro cuestionario fue diseñado para cumplir con esta asunción, de modo que no existen problemas al respecto.

Una de las asunciones del método de mínimos cuadrados ordinarios es que se estime el modelo correcto6. Eso quiere decir que en el mismo se incluyan y se incluyan sólo las variables (independientes) apropiadas y, además, que se incluyan en la forma funcional adecuada7. El no cumplimiento de esta doble condición implica un error de especificación. Aunque el mismo puede provenir, por supuesto, de la inclusión de variables irrelevantes y ello puede tener efectos en las estimaciones8; nuestra principal preocupación es, más bien, la no inclusión de variables relevantes. En efecto, el hecho de contar con una muestra pequeña aconseja limitar el número de variables que se incluyen en cada modelo -algo que ya ha sido mencionado más arriba. Aunque teóricamente podría llevarse a cabo una regresión múltiple con tantas variables como observaciones9, ésta es una opción muy arriesgada y resulta preferible contar con al menos 5 o mejor 10 casos para cada variable (independientes y dependiente). En el presente estudio se ha optado, como

Page 279

regla, por el conservadurismo. Debido a estas restricciones sobre el número de regresores, pues, es más probable la exclusión de variables relevantes. A mayor abundamiento, las consecuencias de la especificación insuficiente son mucho más serias que las de la sobreespecificación de un modelo10.

Gujarati señala que un modelo debería ser inclusivo, esto es «abarcar o incluir a todos los modelos rivales»11. En la práctica, sin embargo, esto es imposible, por lo menos en Criminología. Vistas así las cosas, lo que importa es, más bien, mantener un equilibrio entre las variables de control que pueden incluirse en el modelo y la parsimonia12. No debe olvidarse, asimismo, que la inclusión descontrolada de variables puede conllevar ulteriores problemas, por ejemplo de dimensionalidad.

Estos supuestos de error de especificación son especialmente problemáticos cuando las variables incorrectamente excluidas del modelo correlacionan con las incluidas. En general, esta es una situación que, en términos generales, tenderá a no ser extraña. Como es fácil de comprender intuitivamente, la variable excluida en realidad entra en el modelo de regresión, pero en el término de error (?), de modo que la variable -o variables- sí incluida con la que correlacione pasa a correlacionar con el error. Esto, naturalmente, viola una asunción importante. En estos casos, la variable -o variables- incluida en el modelo toma parte del impacto de la «excluida» sobre la variable dependiente. La dirección y magnitud dependen de ciertas circunstancias. Así las cosas, pues, los estimadores de las variables del mode-lo estarán sesgados. Más aún, el error estándar de estos estimadores se ve reducido, con lo que las estimaciones pueden alcanzar la significación estadística de modo artificial13.

Es importante comprender que la especificación de los modelos tiene un carácter fundamentalmente teórico14. Por ello, se ha abordado esta cues-tión aquí desde este punto de vista, esto es incluyendo en nuestro cuestionario y en nuestros modelos las variables que se consideraban relevantes según las teorías. Una consecuencia de esta relevancia teórica para la correcta especificación de modelos es que «es difícil enfrentarse al mismo al nivel del análisis de los datos»15. Una posibilidad en este sentido16, sin

Page 280

embargo, es la prueba del error de especificación en regresión o test RESET, propuesto por Ramsey. El mismo se centra en la omisión de variables relevantes. Su lógica es que si combinaciones de ulteriores variables -por ejemplo transformaciones o combinaciones no lineales de los regresores- son capaces de predecir con un cierto éxito la variable dependiente, entonces es probable que exista un error de especificación, concretamente que se hayan omitido variables relevantes17. Debido a este planteamiento, no han faltado consideraciones críticas según las cuales en realidad se testaría la linealidad del modelo18. Su gran ventaja, como puede observarse fácilmente, es que no exige especificar modelos alternativos, ya que simplemente y como acaba de decirse se pueden utilizar transformaciones de las variables ya existentes en el modelo original19. Stata permite realizar esta prueba en dos modalidades, según se utilice o no la variable dependiente. En ambos casos no es posible, para nuestro análisis, rechazar la hipótesis nula de que el modelo no omite variables. Para la primera opción del test -que utiliza la potencia de los valores ajustados de delincuencia-, sin embargo, 0,05

exógena al modelo, o sea que no hay evidencia de problemas relativos a la forma funcional -otro de los usos de nuestro test20. Puesto que una lectura conserva-dora como la aquí promocionada impide considerar, precisamente por dicho hallazgo, como concluyente este test para el caso de nuestro modelo completo, pueden traerse aquí a colación los estadísticos de bondad de ajuste. La idea es que un modelo incorrectamente especificado no puede alcanzar un buen ajuste. En el caso de nuestros dos modelos, sobre todo del completo, el coeficiente de determinación corregido por los grados de libertad es elevado, desde luego si se compara con los hallazgos habituales en nuestra disciplina21. Esta estrategia apunta a que no hay pruebas evidentes de errores de especificación.

Quizá merezca la pena añadir que, en el estado actual de la disciplina, no existe, probablemente, investigación alguna que no pueda verse sometida

Page 281

a consideraciones sobre potenciales errores de especificación. Nos encontramos, en realidad, ante un problema de términos relativos. Aunque es cierto que, como se ha dicho, un modelo puede estar basado en una única teoría -y a este planteamiento responde nuestro primer modelo-, es igualmente importante controlar la ausencia de espuriedad de las relaciones entre variables. Nunca se insistirá lo suficiente en que los análisis de regresión no establecen relaciones causales entre modelos y/o variables por un lado y otras variables por otro, sino meras correlaciones. La relación entre dos variables puede revelarse espuria cuando se considera una tercera variable. En este caso, podrá seguir afirmándose que existe una correlación bivariada o de orden cero entre las dos variables; pero también que no puede existir una relación causal al faltar uno de los criterios de la misma. Es esta preocupación con la espuriedad lo que explica la justificada obsesión contemporánea por el control de variables. A esta inquietud responde, limitadamente, nuestro segundo modelo o ecuación. Un tercer requisito de las relaciones causales, la direccionalidad, no puede ser ni establecida ni controlada empíricamente mediante estos expedientes22.

El método de los mínimos cuadrados ordinarios asume que la relación entre los regresores de interés y, en nuestro caso, la delincuencia es lineal. Es probable que la propia teoría general del delito hipotetice una relación de esta naturaleza también entre autocontrol y delincuencia23.

Aunque es menester recordar que, en su caso, no es posible extrapolar estas características de la relación fuera del rango de observaciones con que se cuenta24, un importante motivo para esperar esta...

Para continuar leyendo

Solicita tu prueba

VLEX utiliza cookies de inicio de sesión para aportarte una mejor experiencia de navegación. Si haces click en 'Aceptar' o continúas navegando por esta web consideramos que aceptas nuestra política de cookies. ACEPTAR