![]() ![]() ![]() |
|
Análisis Multivariado Luego de este examen porcentual de los cuadros que anteceden, es conveniente aplicar una prueba que determine de las diversas variables en análisis (involucrando además algunas otras), cuáles de ellas explican estadísticamente con mayor fuerza el fenómeno en estudio, es decir, el atraso escolar. Para ello nos valemos del análisis de regresión múltiple donde la variable dependientes es "atraso escolar en niños de 6-14 años" y las variables independientes son: a) "porcentaje de población rural"; b) "porcentaje de hogares con necesidades básicas insatisfechas"; c) "porcentaje de niños 6-12 años que no asisten a la escuela"; d) "tasa PEA en niños 6-14 años; e) "porcentaje de niños de 5-14 años cuya lengua materna es el castellano"; f) "porcentaje de madres sin instrucción". La unidad de análisis es la provincia, por lo cual nuestra matriz de datos se basa en los indicadores correspondientes a las 188 provincias del país. Se ha considerado limitar el análisis de regresión a la población atrasada entre 6 a 14 años por ser este el tramo de edad de mayor preocupación. Para seleccionar el "mejor modelo" se utilizó el procedimiento stepwise. Los pasos de este procedimiento se describen a continuación. En primer lugar se obtuvieron las correlaciones bivariadas simples entre la variable dependiente (atraso escolar) y cada una de las variables independientes arriba señaladas con la finalidad de determinar cuál es la primera variable que ingresa al modelo. x1 = % población rural x2 = % hogares con NBI x3 = % de niños de 6-12 años que no asisten a escuela x4 = Tasa de PEA en niños 6-14 años x5 = % de niños de 5-14 años cuya lengua materna es el castellano x6 = % de madres sin instrucción Coeficientes de Correlación con Deserción Acumulada 6-14 años +-------+-------+-------+-------+--------+-------+ | x1 | x2 | x3 | x4 | x5 | x6 | +-------+-------+-------+-------+--------+-------+ | 0.824 | 0.769 | 0.783 | 0.042 | -0.498 | 0.745 | +-------+-------+-------+-------+--------+-------+ Como la variable x1 (porcentaje de la población rural) es la más fuertemente asociada al atraso escolar, con elle se inicia el ejercicio. Es importante destacar la elección de esta variable en tal sentido que, a la luz de los resultados, el atraso escolar tendría que ver básicamente con problemas de nivel de desarrollo socio-económico. Las zonas más atrasadas o más rurales son aquellas que manifiestan mayor correlación con la variable dependiente. Se obtiene el coeficiente de determinación ajustado el cual es de 0.6764. Es decir, el 67% de la variación de la tasa de atraso escolar en población de 6 a 14 años es explicada por la variable "porcentaje de población rural". En seguida se consignan las pruebas t parciales para las variables que no se encuentran aún en el modelo. Estas pruebas nos ayudan a identificar la siguiente variable que debe entrar en el análisis. +------------------------------------------------+ | Variables T Sig. T | +------------------------------------------------+ | x2 5.404 .0000 | | x3 10.472 .0000* | | x4 -0.087 .9611 | | x5 -2.665 .0084 | | x6 5.158 .0000 | +------------------------------------------------+ * más significativo De acuerdo a los resultados vemos que 3x (porcentaje de niños de 6-12 que no asisten a la escuela) es la siguiente variable a ser introducida en el modelo pues la prueba t indicidual resultser la más significativa (valor de t más alto). Esto nos sugiere que las zonas de mayor atraso escolar también son aquellas donde la cobertura es menor. Esto tiene que ver, precisamente con el grado de urbanización o ruralidad de la zona. El déficit de cobertura es más fuerte en las áreas más rurales y aisladas. El modelo con dos variables independientes (porcentaje de población rural y porcentaje de niños 6-12 años que no asisten a la escuela) producen un coeficiente de determinación ajustado de 0.7957. Vale decir, el 79% de la variación del atraso escolar es explicado por ambas variables. Continuamos el análisis presentando los resultados de las pruebas t individuales que se obtuvieron de las variables que no están en el análisis. +------------------------------------------------+ | Variables T Sig. T | +------------------------------------------------+ | x2 4.740 .0000* | | x4 0.367 .7139 | | x5 -3.879 .0000 | | x6 4.588 .0000 | +------------------------------------------------+ * más significativo Esta prueba indica que la variable "porcentaje de hogares con necesidades básicas insatisfechas" es la siguiente que ha de ser introducida al modelo. El coeficiente de determinación ajustado es de 0.8169; lo cual quiere decir que el 81% de la variación del atraso escolar es explicado en términos estadísticos por el modelo con tres variables independiente. Comparando con los resultados anteriores se puede deducir que el aporte de esta última variable es menor. La pobreza -medida a través del indicador hogares con necesidades básicas insatisfechas-, siendo importante para explicar el atraso escolar, tiene menos capacidad explicativa que la ruralidad de la zona. Siguiendo con el procedimiento se aplica la prueba t para las variables que no están en el modelo a fin de definir cual de ellas habrá de ser incorporada. +------------------------------------------------+ | Variables T Sig. T | +------------------------------------------------+ | x4 0.491 .6240 | | x5 -2.800 .0057 | | x6 3.792 .0002* | +------------------------------------------------+ * más significativo El coeficiente de determinación ajustado para el modelo con cuatro variables explicativas es de 0.8293; sólo se gana el 1.2% de la explicación respecto al modelo anterior. Así, el análisis de regresión múltiple relativiza la importancia de la variable "madres sin instrucción" para explicar el comportamiento del atraso escolar. Finalmente, aplican las pruebas t para las varibles "tasa de PEA en niños de 6-14 años" y "porcentaje de niños 5-14 cuya lengua materna es el castellano". +------------------------------------------------+ | Variables T Sig. T | +------------------------------------------------+ | x4 0.543 0.5877 | | x5 -0.864 0.3889 | +------------------------------------------------+ * más significativo Como las pruebas t para x4 y x5 resultarion no significativas, el procedimiento se detiene y se concluye que el mejor modelo para explicar el atraso escolar en niños de 6 a 14 años es aquel que tiene al porcentaje de población rural, porcentaje de niños 6-12 años que no asiste a la escuela; porcentaje de hogares con NBI y porcentaje de madres sin instrucción, como las variables explicativas. Es interesante esta discriminación de variables sociales que explicarían el atraso escolar. A pesar de su importancia, en conjunto la condición laboral del niño y la lengua materna de éste pierden significación estadística para explicar el atraso. Este fenómeno tiene que ver más directamente con factores que en su mayoría traducen la situación de pobreza, básicamente rural. Cabe recordar en este sentido que la variable con mayor relevancia es, precisamente, el grado de ruralización de la zona. |
![]() ![]() ![]() |