Análisis Multivariado

     Luego  de  este  examen porcentual de los cuadros que anteceden, es
conveniente aplicar una prueba que determine de las  diversas  variables
en  análisis  (involucrando  además  algunas  otras),  cuáles  de  ellas
explican estadísticamente  con mayor fuerza  el fenómeno en estudio,  es
decir, el atraso escolar.

     Para ello nos valemos del  análisis  de regresión múltiple donde la
variable dependientes es  "atraso escolar en niños de 6-14 años"  y  las
variables  independientes  son:   a) "porcentaje  de  población  rural";
b) "porcentaje   de  hogares  con  necesidades  básicas  insatisfechas";
c) "porcentaje  de  niños   6-12   años   que  no asisten a la escuela";
d) "tasa  PEA  en  niños 6-14 años; e) "porcentaje de niños de 5-14 años
cuya  lengua  materna  es  el  castellano"; f) "porcentaje de madres sin
instrucción".

     La unidad de análisis es la provincia,  por  lo cual nuestra matriz
de  datos  se  basa  en  los  indicadores  correspondientes  a  las  188
provincias del país.

     Se ha considerado limitar  el  análisis de regresión a la población
atrasada  entre  6  a  14  años  por  ser este el tramo de edad de mayor
preocupación.

     Para  seleccionar  el  "mejor  modelo"  se utilizó el procedimiento
stepwise. Los pasos de este procedimiento se describen a continuación.

     En primer lugar se obtuvieron  las correlaciones bivariadas simples
entre  la  variable  dependiente  (atraso  escolar)  y  cada  una de las
variables independientes arriba señaladas con la finalidad de determinar
cuál es la primera variable que ingresa al modelo.

     x1 = % población rural
     x2 = % hogares con NBI
     x3 = % de niños de 6-12 años que no asisten a escuela
     x4 = Tasa de PEA en niños 6-14 años
     x5 = % de niños de 5-14 años cuya lengua materna es el castellano
     x6 = % de madres sin instrucción

Coeficientes de Correlación con Deserción Acumulada 6-14 años

+-------+-------+-------+-------+--------+-------+         
|   x1  |   x2  |   x3  |   x4  |   x5   |  x6   |          
+-------+-------+-------+-------+--------+-------+          
| 0.824 | 0.769 | 0.783 | 0.042 | -0.498 | 0.745 |
+-------+-------+-------+-------+--------+-------+

     Como la variable  x1  (porcentaje de la población rural)  es la más
fuertemente asociada al atraso escolar, con elle se inicia el ejercicio.

     Es  importante destacar la elección de esta variable en tal sentido
que,  a la luz de los resultados,  el  atraso  escolar  tendría  que ver
básicamente  con  problemas  de nivel de desarrollo socio-económico. Las
zonas  más  atrasadas  o  más rurales son aquellas que manifiestan mayor
correlación con la variable dependiente.

     Se obtiene el coeficiente  de  determinación ajustado el cual es de
0.6764. Es decir, el 67% de la variación de la tasa de atraso escolar en
población  de 6 a 14 años  es  explicada  por la variable "porcentaje de
población rural".

     En seguida se  consignan las pruebas t parciales para las variables
que no se encuentran  aún  en  el  modelo.  Estas  pruebas  nos ayudan a
identificar la siguiente variable que debe entrar en el análisis.

+------------------------------------------------+
|   Variables           T               Sig. T   |
+------------------------------------------------+
|      x2             5.404             .0000    |
|      x3            10.472             .0000*   |
|      x4            -0.087             .9611    |
|      x5            -2.665             .0084    |
|      x6             5.158             .0000    |
+------------------------------------------------+
  * más significativo

    De acuerdo a los resultados vemos que 3x  (porcentaje  de  niños  de
6-12  que  no  asisten  a  la  escuela)  es  la siguiente variable a ser
introducida  en  el  modelo pues la prueba t indicidual resultser la más
significativa (valor de t más alto).

    Esto  nos  sugiere que las zonas de mayor atraso escolar también son
aquellas donde la cobertura es menor.  Esto tiene que ver,  precisamente
con  el  grado  de  urbanización  o ruralidad de la zona.  El déficit de
cobertura es más fuerte en las áreas más rurales y aisladas.

    El modelo  con dos variables independientes (porcentaje de población
rural  y  porcentaje  de  niños  6-12  años que no asisten a la escuela)
producen un coeficiente de determinación ajustado de 0.7957. Vale decir,
el  79%  de  la  variación  del  atraso  escolar  es explicado por ambas
variables.

    Continuamos el análisis presentando los resultados  de las pruebas t
individuales  que  se  obtuvieron  de  las  variables que no están en el
análisis.
     
+------------------------------------------------+
|   Variables           T               Sig. T   |
+------------------------------------------------+
|      x2             4.740             .0000*   |
|      x4             0.367             .7139    |
|      x5            -3.879             .0000    |
|      x6             4.588             .0000    |
+------------------------------------------------+
  * más significativo

     Esta prueba indica que  la  variable  "porcentaje  de  hogares  con
necesidades  básicas  insatisfechas"  es  la  siguiente  que  ha  de ser
introducida al modelo.

     El coeficiente de determinación  ajustado  es  de  0.8169;  lo cual
quiere decir que el 81% de  la variación del atraso escolar es explicado
en términos estadísticos por el modelo con tres variables independiente.

     Comparando con los  resultados  anteriores  se puede deducir que el
aporte de esta última variable es menor. La pobreza -medida a través del
indicador   hogares   con  necesidades  básicas  insatisfechas-,  siendo
importante  para  explicar  el  atraso  escolar,  tiene  menos capacidad
explicativa que la ruralidad de la zona.

      Siguiendo  con  el  procedimiento  se  aplica la prueba t para las
variables que no están en el modelo a fin de definir cual de ellas habrá
de ser incorporada.    

+------------------------------------------------+
|   Variables           T               Sig. T   |
+------------------------------------------------+
|      x4             0.491             .6240    | 
|      x5            -2.800             .0057    |
|      x6             3.792             .0002*   |
+------------------------------------------------+ 
  * más significativo

     El coeficiente de determinación  ajustado para el modelo con cuatro
variables  explicativas  es  de  0.8293;  sólo  se  gana  el  1.2% de la
explicación respecto al modelo anterior.

     Así, el análisis de regresión múltiple relativiza la importancia de
la variable "madres sin instrucción" para explicar el comportamiento del
atraso escolar.

     Finalmente, aplican las pruebas t para las varibles "tasa de PEA en
niños de 6-14 años"  y  "porcentaje de niños 5-14 cuya lengua materna es
el castellano".

+------------------------------------------------+
|   Variables           T               Sig. T   |
+------------------------------------------------+
|      x4             0.543             0.5877   | 
|      x5            -0.864             0.3889   |
+------------------------------------------------+ 
  * más significativo

     Como las pruebas t para  x4  y x5 resultarion no significativas, el
procedimiento se detiene y se concluye que el mejor modelo para explicar
el atraso  escolar  en  niños  de  6  a  14  años  es aquel que tiene al
porcentaje  de  población  rural,  porcentaje  de niños 6-12 años que no
asiste  a  la  escuela;  porcentaje  de  hogares con NBI y porcentaje de
madres sin instrucción, como las variables explicativas.

     Es  interesante  esta  discriminación  de  variables  sociales  que 
explicarían el atraso escolar. A pesar de su importancia, en conjunto la
condición  laboral  del  niño  y  la  lengua  materna  de  éste  pierden 
significación estadística para explicar el atraso.

     Este fenómeno tiene que ver más directamente con factores que en su 
mayoría  traducen  la  situación  de  pobreza,  básicamente  rural. Cabe
recordar  en  este  sentido  que  la  variable  con mayor relevancia es,
precisamente, el grado de ruralización de la zona.