|
Análisis Multivariado
Al igual que cuando examinamos el problema del atraso escolar,
ahora es conveniente explorar, en conjunto, cómo las diversas variables,
en gran parte descritas en los cuadros precedentes, influyen en el
comportamiento de la deserción acumulada.
Se utiliza para este efecto el análisis de regresión múltiple,
precisando como variable dependiente la "deserción acumulada en niños de
6-14 años", donde las variables independientes son las siguientes:
x1 = porcentaje de población rural
x2 = porcentaje de hogares con necesidades básicas insatisfechas
x3 = porcentaje de niños de 6-12 años que no asisten a la escuela
x4 = tasa de PEA en niños de 6-14 años
x5 = porcentaje de niños de 5-14 años cuya lengua materna es el
castellano
x6 = porcentaje de madres sin instrucción
Este examen tomará como unidad de análisis las 188 provincias del
Perú, lo cual ofrece consistencia a los resultados.
Siguiendo los parámetros del procedimiento stepwise, iniciamos el
análisis seleccionando la primera variable que entrará al modelo. Para
ello obtenemos previamente las correlaciones simples bivariadas entre
deserción acumulada 6-14 años y las demás variables independientes.
Coeficientes de Correlación con Deserción Acumulada 6-14 años
+-------+-------+-------+--------+-------+--------+
| x1 | x2 | x3 | x4 | x5 | x6 |
+-------+-------+-------+--------+-------+--------+
| 0.221 | 0.144 | 0.602 | -0.016 | 0.341 | -0.073 |
+-------+-------+-------+--------+-------+--------+
La variable seleccionada es la x3 (porcentaje de niños de 6-12 años
que no asisten a la escuela) por ser la que tiene mas alto coeficiente
de asociación.
Esta variable traduce el deficit de la cobertura escolar. Si es así,
esta variable incluye tanto a aquellos que nunca han asistido como a
aquellos que se han retirado y que luego se incorporaran al sistema
educativo y a los desertores. Quizá esto explique la alta correlación.
El coeficiente de determinación ajustado entre deserción acumulada
6-14 años y porcentaje de niños 6-12 años que no asisten a la escuela es
de 0.3586.
Es decir, el 35% de la variación de la deserción es explicada por
esta variable.
Con la finalidad de seleccionar de las otras variables
independientes cual ha de incorporarse al modelo, aplicamos las prueba t
con los resultados siguientes.
+------------------------------------------------+
| Variables T Sig. T |
+------------------------------------------------+
| x2 -3.427 .0008 |
| x3 -4.363 .0000 |
| x4 -0.257 .7975 |
| x5 11.962 .0000* |
| x6 -10.381 .0000 |
+------------------------------------------------+
* más significativo
Vemos que la más significativa es la variable "porcentaje de niños
de 5-14 años cuya lengua materna es el castellano".
El coeficiente de determinación ajustado para un modelo con dos
variables (porcentaje de niños 6-12 que no asisten a la escuela y
porcentaje de niños 5-14 años cuya lengua materna es el castellano)
arroja 0.6364; lo cual se interpreta como que el 63% de la variación de
la deserción acumulada se explica estadísticamente por estas dos
variables.
Continuaremos con el análisis dando a conocer los resultados de las
pruebas t individuales que se obtuvieron con las otras variables que
permanecían fuera del modelo.
+------------------------------------------------+
| Variables T Sig. T |
+------------------------------------------------+
| x1 0.691 .4906 |
| x2 0.027 .9784 |
| x4 1.036 .3013 |
| x6 4.059 .0001* |
+------------------------------------------------+
* más significativo
Los resultados de la prueba indican que x6 (porcentajes de madres
sin instrucción) ha de entrar al modelo. El coeficiente de determinación
ajustado indica que el conjunto de variables analizadas explican el 66%
del comportamiento de la deserción acumulada.
Es importante notar cómo la inclusión de esta última variable poco
aporta en incrementar la explicación estadística de la deserción.
Continuando con el procedimiento se aplica la prueba t para las
variables aún no incorporadas.
+------------------------------------------------+
| Variables T Sig. T |
+------------------------------------------------+
| x1 3.141 .0020 |
| x2 1.426 .1556 |
| x4 0.829 .4080 |
+------------------------------------------------+
* más significativo
La variable "porcentaje de población rural" se incluye al modelo
logrando un coeficiente de determinación ajustado de 0.6799; vale decir,
el 67% de la variación de la deserción es explicada por todas las
variables del modelo. Esta variable al igual que la anterior incrementa
muy débilmente la capacidad explicativa del modelo.
Finalmente presentamos las pruebas t de las variables restantes.
+------------------------------------------------+
| Variables T Sig. T |
+------------------------------------------------+
| x2 -0.104 0.9176 |
| x4 0.649 0.5171 |
+------------------------------------------------+
* más significativo
Ninguna de estas dos variables (porcentaje de hogares con NBI y
tasa de PEA en niños de 6-14 años) arroja coeficientes significativos.
De esto se deduce que el mejor modelo para explicar estadísticamente la
variación de la deserción acumulada está dado por la intervención de las
variables: x1. x3. x5 y x6.
El análisis de regresión múltiple corrobora que en el
comportamiento de la deserción acumulada las variables contextuales de
pobreza no son fundamentales. A este respecto cabe notar que,
precisamente, la variable utilizada para medir la condición de pobreza
(% hogares con necesidades básicas insatisfechas) no es significativa
para explicar la dinámica de deserción.
|