|
Análisis Multivariado
Luego de este examen porcentual de los cuadros que anteceden, es
conveniente aplicar una prueba que determine de las diversas variables
en análisis (involucrando además algunas otras), cuáles de ellas
explican estadísticamente con mayor fuerza el fenómeno en estudio, es
decir, el atraso escolar.
Para ello nos valemos del análisis de regresión múltiple donde la
variable dependientes es "atraso escolar en niños de 6-14 años" y las
variables independientes son: a) "porcentaje de población rural";
b) "porcentaje de hogares con necesidades básicas insatisfechas";
c) "porcentaje de niños 6-12 años que no asisten a la escuela";
d) "tasa PEA en niños 6-14 años; e) "porcentaje de niños de 5-14 años
cuya lengua materna es el castellano"; f) "porcentaje de madres sin
instrucción".
La unidad de análisis es la provincia, por lo cual nuestra matriz
de datos se basa en los indicadores correspondientes a las 188
provincias del país.
Se ha considerado limitar el análisis de regresión a la población
atrasada entre 6 a 14 años por ser este el tramo de edad de mayor
preocupación.
Para seleccionar el "mejor modelo" se utilizó el procedimiento
stepwise. Los pasos de este procedimiento se describen a continuación.
En primer lugar se obtuvieron las correlaciones bivariadas simples
entre la variable dependiente (atraso escolar) y cada una de las
variables independientes arriba señaladas con la finalidad de determinar
cuál es la primera variable que ingresa al modelo.
x1 = % población rural
x2 = % hogares con NBI
x3 = % de niños de 6-12 años que no asisten a escuela
x4 = Tasa de PEA en niños 6-14 años
x5 = % de niños de 5-14 años cuya lengua materna es el castellano
x6 = % de madres sin instrucción
Coeficientes de Correlación con Deserción Acumulada 6-14 años
+-------+-------+-------+-------+--------+-------+
| x1 | x2 | x3 | x4 | x5 | x6 |
+-------+-------+-------+-------+--------+-------+
| 0.824 | 0.769 | 0.783 | 0.042 | -0.498 | 0.745 |
+-------+-------+-------+-------+--------+-------+
Como la variable x1 (porcentaje de la población rural) es la más
fuertemente asociada al atraso escolar, con elle se inicia el ejercicio.
Es importante destacar la elección de esta variable en tal sentido
que, a la luz de los resultados, el atraso escolar tendría que ver
básicamente con problemas de nivel de desarrollo socio-económico. Las
zonas más atrasadas o más rurales son aquellas que manifiestan mayor
correlación con la variable dependiente.
Se obtiene el coeficiente de determinación ajustado el cual es de
0.6764. Es decir, el 67% de la variación de la tasa de atraso escolar en
población de 6 a 14 años es explicada por la variable "porcentaje de
población rural".
En seguida se consignan las pruebas t parciales para las variables
que no se encuentran aún en el modelo. Estas pruebas nos ayudan a
identificar la siguiente variable que debe entrar en el análisis.
+------------------------------------------------+
| Variables T Sig. T |
+------------------------------------------------+
| x2 5.404 .0000 |
| x3 10.472 .0000* |
| x4 -0.087 .9611 |
| x5 -2.665 .0084 |
| x6 5.158 .0000 |
+------------------------------------------------+
* más significativo
De acuerdo a los resultados vemos que 3x (porcentaje de niños de
6-12 que no asisten a la escuela) es la siguiente variable a ser
introducida en el modelo pues la prueba t indicidual resultser la más
significativa (valor de t más alto).
Esto nos sugiere que las zonas de mayor atraso escolar también son
aquellas donde la cobertura es menor. Esto tiene que ver, precisamente
con el grado de urbanización o ruralidad de la zona. El déficit de
cobertura es más fuerte en las áreas más rurales y aisladas.
El modelo con dos variables independientes (porcentaje de población
rural y porcentaje de niños 6-12 años que no asisten a la escuela)
producen un coeficiente de determinación ajustado de 0.7957. Vale decir,
el 79% de la variación del atraso escolar es explicado por ambas
variables.
Continuamos el análisis presentando los resultados de las pruebas t
individuales que se obtuvieron de las variables que no están en el
análisis.
+------------------------------------------------+
| Variables T Sig. T |
+------------------------------------------------+
| x2 4.740 .0000* |
| x4 0.367 .7139 |
| x5 -3.879 .0000 |
| x6 4.588 .0000 |
+------------------------------------------------+
* más significativo
Esta prueba indica que la variable "porcentaje de hogares con
necesidades básicas insatisfechas" es la siguiente que ha de ser
introducida al modelo.
El coeficiente de determinación ajustado es de 0.8169; lo cual
quiere decir que el 81% de la variación del atraso escolar es explicado
en términos estadísticos por el modelo con tres variables independiente.
Comparando con los resultados anteriores se puede deducir que el
aporte de esta última variable es menor. La pobreza -medida a través del
indicador hogares con necesidades básicas insatisfechas-, siendo
importante para explicar el atraso escolar, tiene menos capacidad
explicativa que la ruralidad de la zona.
Siguiendo con el procedimiento se aplica la prueba t para las
variables que no están en el modelo a fin de definir cual de ellas habrá
de ser incorporada.
+------------------------------------------------+
| Variables T Sig. T |
+------------------------------------------------+
| x4 0.491 .6240 |
| x5 -2.800 .0057 |
| x6 3.792 .0002* |
+------------------------------------------------+
* más significativo
El coeficiente de determinación ajustado para el modelo con cuatro
variables explicativas es de 0.8293; sólo se gana el 1.2% de la
explicación respecto al modelo anterior.
Así, el análisis de regresión múltiple relativiza la importancia de
la variable "madres sin instrucción" para explicar el comportamiento del
atraso escolar.
Finalmente, aplican las pruebas t para las varibles "tasa de PEA en
niños de 6-14 años" y "porcentaje de niños 5-14 cuya lengua materna es
el castellano".
+------------------------------------------------+
| Variables T Sig. T |
+------------------------------------------------+
| x4 0.543 0.5877 |
| x5 -0.864 0.3889 |
+------------------------------------------------+
* más significativo
Como las pruebas t para x4 y x5 resultarion no significativas, el
procedimiento se detiene y se concluye que el mejor modelo para explicar
el atraso escolar en niños de 6 a 14 años es aquel que tiene al
porcentaje de población rural, porcentaje de niños 6-12 años que no
asiste a la escuela; porcentaje de hogares con NBI y porcentaje de
madres sin instrucción, como las variables explicativas.
Es interesante esta discriminación de variables sociales que
explicarían el atraso escolar. A pesar de su importancia, en conjunto la
condición laboral del niño y la lengua materna de éste pierden
significación estadística para explicar el atraso.
Este fenómeno tiene que ver más directamente con factores que en su
mayoría traducen la situación de pobreza, básicamente rural. Cabe
recordar en este sentido que la variable con mayor relevancia es,
precisamente, el grado de ruralización de la zona.
|