![]() ![]() ![]() |
5.2 SELECCIÓN DE VARIABLES PARA CADA SUB-POBLACIÓN
El procedimiento de la selección de variables para cada Sub-población es:
1. Cálculo de la Matriz de Correlación. La matriz de correlación proporciona la información de las relaciones lineales existentes entre variables cuantitativas dos a dos y se construye a partir de la Matriz de varianza de los datos originales. (Ver Anexo Nº 4)
2. Construcción del Modelo Loglineal, el cual partiendo de una Tabla de Contingencia de entradas múltiples obtiene un Modelo Lineal para los logaritmos de las frecuencias de la tabla, con la finalidad de interpretar las relaciones entre variables categóricas. (Ver Anexo Nº 5)
3. Una vez que las variables han sido seleccionadas, tanto las variables cuantitativas, utilizando la Matriz de correlación; como las variables nominales bajo el método de Modelo Loglineal Jerárquico; se aplica el Modelo de Regresión Múltiple con estos dos grupos de variables (Ver Anexo 7), para tal efecto se transformaron las variables nominales en variables artificiales.
El procedimiento detallado realizado para cada Dominio de Estudio se presenta en el Anexo 6.
. Variables Seleccionadas para los Dominios de Estudio
En el Cuadro Nº 1 se presentan las variables que van a entrar en el Modelo de Regresión por Dominios de Estudio.
Variables que entran en el Modelo de Regresión por Dominios de Estudio
Entre las variables nominales se ha eliminado "Fuente de Mayor Ingreso". Las demás variables nominales entran en todos los Dominios. Costa Norte, Sierra Norte y Sierra Centro tienen en común además de las variables categóricas las siguientes variables:
. Tasa de dependencia . Escolaridad promedio de los perceptores
Así mismo Costa Sur y Selva tienen en común además de las variables categóricas las siguientes variables:
. Total de Perceptores en el hogar
Siguiendo el mismo procedimiento realizado para los Dominios de Estudio se realizó la selección de variables para las otras Sub-poblaciones, cuyos resultados se presentan a continuación. . Variables Seleccionadas para los Estratos de Ingresos
En el Cuadro Nº 2 se presentan las variables que van a entrar en el Modelo de Regresión por Estratos de Ingreso.
Variables que entran en el Modelo de Regresión por Estratos de Ingresos
Con respecto a las variables seleccionadas para los Dominios de Estudio no entran en los Estratos de Ingresos
. Tasa de dependencia
En los dos estratos más bajos entran el mismo conjunto de variables, un hecho importante es que entra la "Fuente de Mayor Ingreso del hogar", que fue eliminado en caso de los dominios. En los tres estratos más altos entra en su lugar "Categoría Ocupacional del que Más gana".
Los Estratos de Ingresos Medios y Medios Altos tienen el mismo conjunto de variables con excepción de "Edad del Perceptor que Más gana" que sólo entra en el Estrato de Ingresos Medios.
Las variables que entran en el Estrato de Ingresos Altos son sólo cuatro, las cuales también están en alguno de los otros estratos.
Las variables que entran en todos los Estratos son "Escolaridad Promedio de Perceptores" y "Estrato Geográfico". . Variables Seleccionadas para Áreas Urbano y Rural
En el Cuadro Nº 3 se presentan las variables que van a entrar en el Modelo de Regresión por Áreas Urbano y Rural.
Variables que entran en el Modelo de Regresión por Áreas Urbano y Rural
Con respecto a los Estratos de Ingresos no entran en estas áreas "Número de Miembros del Hogar" y "Fuente de Mayor Ingreso del Hogar". Las dos áreas tienen las mismas variables con excepción de "Edad del Perceptor que Más gana" que sólo entra en el Área Urbana. . Variables Seleccionadas para Regiones Geográficas
En el Cuadro Nº 4 se presentan las variables que van a entrar en el Modelo de Regresión por Regiones Geográficas.
Variables que entran en el Modelo de Regresión por Regiones Geográficas
Entran las mismas variables que en las Áreas Urbano y Rural. Entre ellas sólo se diferencian en que "Edad del Perceptor que Más gana", sólo entra en Sierra.
Al inicio de esta sección se detalló la metodología seguida para la selección de las variables, de modo que se cumpla la independencia entre una y otra. Como se explicó, las técnicas de análisis fueron diversas, para las variables cuantitativas se utilizó la Matriz de Correlación Múltiple; en tanto que para las variables de tipo cualitativo se ajustó un Modelo Loglineal.
En los resultados de aplicación del Modelo Loglineal, se encontró alta asociación entre la variable Logaritmo del Ingreso (categorizada) y algunas variables cualitativas. Para que éstas puedan ser incluidas en el Modelo de Regresión Múltiple, han sido convertidas en variables artificiales (dummy), obteniendo para cada variable cualitativa con k categorías, k-1 variables artificiales. Se ilustra el procedimiento para el caso de la variable "Categoría Ocupacional del Perceptor que Más gana", que tiene cuatro categorías, se establecen las siguientes variables:
La variable Necesidades Básicas Insatisfechas (NBI) será considerada como variable cuantitativa para cada Hogar, "Número de NBI".
![]() |