![]() ![]() ![]() |
4. Procedimientos de Selección de Variables para los Dominios
Como se mencionó anteriormente, cada Sub-población no solo será modelado de manera independiente, sino que todo el proceso de selección de las variables también será desarrollado de modo exclusivo para cada una de ellas. Este proceso de selección de variables se va a ilustrar con el realizado para los Dominios de Estudio y que se presenta a continuación.
4.1. Lima Metropolitana
1. De la matriz de correlación obtenida para las seis variables de intervalo de Lima Metropolitana se obtiene la información del Cuadro Nº 1 y de la cual se deducen los siguientes resultado:
Claramente se observa que las variables:
Están altamente correlacionadas (0.868), lo que implica que la información que una proporciona está siendo también proporcionada (de manera redundante) por la otra.
¿Cuál de las dos variables eliminar?
En el cuadro también se presentan las correlaciones entre la variable respuesta, (Logaritmo del Ingreso) con cada una de las variables explicativas, por tanto, para decidir por la variable que queda para el modelo, se observan las correlaciones entre el Logaritmo del Ingreso y la otras dos, de modo que se prescindirá de la variable que esté menos asociada a la variable respuesta.
Según lo descrito, se eliminan
Además, otra de las condiciones que aseguran una buena aplicación del Modelo de Regresión, son las relaciones (correlaciones) entre el Logaritmo del Ingreso y las variables explicativas, que deben ser altas. Por tanto, otro criterio para la eliminación de variables, será seleccionar las que no presenten una correlación con el Logaritmo del Ingreso cercana a cero. En general se aceptarán las variables cuyas correlaciones con el Logaritmo del Ingreso sean mayores a ½0.21½.
Según esta regla, las variables:
También serán eliminadas del modelo.
En resumen, de las 5 variables de intervalo, (sin considerar el Logaritmo del Ingreso) quedan para posteriores análisis:
![]()
2. El Modelo Loglineal Jerárquico aplicado a las variables nominales, proporciona los siguientes resultados
Las cinco variables nominales, además de la variable Logaritmo del Ingreso, previamente categorizada en cinco intervalos, son:
Los resultados del modelo, muestran lo siguiente.
![]()
El Modelo Loglineal, muestra que las variables Fuente de Mayor Ingreso y Categoría Ocupacional están relacionadas de modo considerable, y de ellas, la que más se correlaciona con el Logaritmo del Ingreso es Categoría Ocupacional, por tanto es posible prescindir de la variable Fuente de Mayor Ingreso.
3. En principio, el Modelo de Regresión Múltiple que se construirá para describir el ingreso en Lima Metropolitana estará conformado por 6 variables independientes:
![]()
4.2. Costa Norte
1. De la matriz de correlación obtenida para las variables cuantitativas en el Dominio Costa Norte se obtiene la información que se detalla en el Cuadro Nº 2, y de la cual se deducen los siguientes resultados.
Se observa entonces nuevamente que las variables:
Están altamente correlacionadas (0.88), y de las cuales se elimina la variable Escolaridad del que más gana, por estar menos correlacionada con el Logaritmo del Ingreso que la escolaridad promedio.
![]()
Por lo que se puede apreciar en el Cuadro Nº 2, También se elimina la variable Edad del que gana más por su muy reducida correlación con el Logaritmo del Ingreso.
En resumen, de las 5 variables cuantitativas, quedan para posteriores análisis:
2. El Modelo Loglineal Jerárquico aplicado a las variables nominales, proporciona los siguientes resultados.
![]()
El Modelo Loglineal muestra, que las variables Fuente de Mayor Ingreso y Categoría Ocupacional están relacionadas de modo considerable, y de ellas, la que más se correlaciona con el Logaritmo del Ingreso es Categoría Ocupacional, por tanto es posible prescindir de la variable Fuente de Mayor Ingreso.
3. Las variables con las cuales se cuenta para la aplicación del Modelo de Regresión Múltiple para el Dominio de la Costa Norte son:
![]()
4.3. Costa Centro
1. Los resultados en el Dominio de la Costa Centro, se detallan a continuación:
Siguiendo los anteriores procesos de eliminación de variables, así como los resultados que se presentan en el Cuadro Nº 3, se observa que las variables de intervalo con las cuales se construirá el Modelo de Regresión para la Costa Centro son:
![]()
2. El Modelo Loglineal Jerárquico aplicado a las variables nominales, indican que las variables Fuente de Mayor Ingreso y Categoría Ocupacional están altamente asociadas, eliminándose la Fuente de Mayor Ingreso para el Modelo de Regresión a construirse.
3. Las variables con las cuales se construirá el modelo son las siguientes:
![]()
4.4. Costa Sur
1. Se presenta el Cuadro Nº 4 construido en base a la matriz de correlación. CUADRO Nº 4
![]()
Las variables cuantitativas con las cuales se construirá el Modelo de Regresión para la Costa Sur son:
2. El Modelo Loglineal Jerárquico aplicado a las variables nominales, indican que las variables Fuente de Mayor Ingreso y Categoría Ocupacional están altamente asociadas, eliminándose la Fuente de Mayor Ingreso para el Modelo de Regresión a construirse.
3. En resumen, las variables, tanto cuantitativas como categóricas en base a las cuales se formulará el Modelo de Regresión para el Dominio de la Costa Sur son:
![]()
4.5. Sierra Norte
1. Se presenta el Cuadro Nº 5 construido en base a la matriz de correlación.
![]()
Las variables cuantitativas con las cuales se construirá el Modelo de Regresión para la Sierra Norte son:
2. El Modelo Loglineal Jerárquico aplicado a las variables nominales, indican que las variables Fuente de Mayor Ingreso y Categoría Ocupacional están altamente asociadas, eliminándose la Fuente de Mayor Ingreso para el Modelo de Regresión a construirse.
3. En resumen, las variables, tanto cuantitativas como categóricas en base a las cuales se formulará el Modelo de Regresión para el Dominio de la Sierra Norte es:
![]()
4.6. Sierra Centro
1. Se presenta el cuadro Nº6 construido en base a la matriz de correlación.
![]()
Las variables de intervalo con las cuales se construirá el Modelo de Regresión para la Sierra Centro son:
2. El Modelo Loglineal Jerárquico aplicado a las variables nominales, indican que las variables Fuente de Mayor Ingreso y Categoría Ocupacional están altamente asociadas, eliminándose la Fuente de Mayor Ingreso para el Modelo de Regresión a construirse.
3. En resumen, las variables, tanto cuantitativas como categóricas en base a las cuales se formulará el Modelo de Regresión para el Dominio de la Sierra Centro son:
![]()
4.7. Sierra Sur
1. Se presenta el Cuadro Nº 7 construido en base a la matriz de correlación.
![]()
Las variables cuantitativas con las cuales se construirá el Modelo de Regresión para la Sierra Sur son:
2. El Modelo Loglineal Jerárquico aplicado a las variables nominales, indican que las variables Fuente de Mayor Ingreso y Categoría Ocupacional están altamente asociadas, eliminándose la Fuente de Mayor Ingreso para el Modelo de Regresión a construirse.
3. En resumen, las variables, tanto cuantitativas como categóricas en base a las cuales se formulará el Modelo de Regresión para el Dominio de la Sierra Sur son:
![]()
4.8. SELVA
1. Se presenta el cuadro Nº8 construido en base a la matriz de correlación.
Las variables cuantitativas con las cuales se construirá el Modelo de Regresión para la Sierra Sur son:
2. El Modelo Loglineal Jerárquico aplicado a las variables nominales, indica que las variables Fuente de Mayor Ingreso y Categoría Ocupacional están altamente asociadas, eliminándose la Fuente de Mayor Ingreso para el Modelo de Regresión a construirse.
3. En resumen, las variables, tanto cuantitativas como categóricas en base a las cuales se formulará el Modelo de Regresión para el Dominio de la Selva son:
![]()
![]()
|