5.2 SELECCIÓN DE VARIABLES PARA CADA SUB-POBLACIÓN

El procedimiento de la selección de variables para cada Sub-población es:

1. Cálculo de la Matriz de Correlación. La matriz de correlación proporciona la información de las relaciones lineales existentes entre variables cuantitativas dos a dos y se construye a partir de la Matriz de varianza de los datos originales. (Ver Anexo Nº 4)

2. Construcción del Modelo Loglineal, el cual partiendo de una Tabla de Contingencia de entradas múltiples obtiene un Modelo Lineal para los logaritmos de las frecuencias de la tabla, con la finalidad de interpretar las relaciones entre variables categóricas. (Ver Anexo Nº 5)

3. Una vez que las variables han sido seleccionadas, tanto las variables cuantitativas, utilizando la Matriz de correlación; como las variables nominales bajo el método de Modelo Loglineal Jerárquico; se aplica el Modelo de Regresión Múltiple con estos dos grupos de variables (Ver Anexo 7), para tal efecto se transformaron las variables nominales en variables artificiales.

El procedimiento detallado realizado para cada Dominio de Estudio se presenta en el Anexo 6.

. Variables Seleccionadas para los Dominios de Estudio

En el Cuadro Nº 1 se presentan las variables que van a entrar en el Modelo de Regresión por Dominios de Estudio.

Cuadro Nº 1

Variables que entran en el Modelo de Regresión por Dominios de Estudio

Variables

Dominios de Estudio

LM

CN

CC

CS

SN

SC

SS

Se

Explicada

Logaritmo del Ingreso del Hogar

x

x

x

x

x

x

x

x

Explicativas

Número de Miembros del hogar

x

 

Número de Perceptores del hogar

x

x

x

x

x

x

x

x

Tasa de dependencia

x

x

   

x

x

   

Escolaridad promedio de perceptores

 

x

 

x

x

x

x

x

Escolaridad del que Más gana

x

 

x

         

Edad del que Más gana

           

x

 

NBI

x

x

x

x

x

x

x

x

Tenencia de Vivienda

x

x

x

x

x

x

x

x

Estrato Geográfico

x

x

x

x

x

x

x

x

Categoría Ocupacional del que Más gana

x

x

x

x

x

x

x

x

Entre las variables nominales se ha eliminado "Fuente de Mayor Ingreso". Las demás variables nominales entran en todos los Dominios. Costa Norte, Sierra Norte y Sierra Centro tienen en común además de las variables categóricas las siguientes variables:

    . Total de Perceptores en el hogar
    . Tasa de dependencia
    . Escolaridad promedio de los perceptores

    Así mismo Costa Sur y Selva tienen en común además de las variables categóricas las siguientes variables:

    . Total de Perceptores en el hogar
    . Escolaridad promedio de los perceptores

    Siguiendo el mismo procedimiento realizado para los Dominios de Estudio se realizó la selección de variables para las otras Sub-poblaciones, cuyos resultados se presentan a continuación.

    . Variables Seleccionadas para los Estratos de Ingresos

En el Cuadro Nº 2 se presentan las variables que van a entrar en el Modelo de Regresión por Estratos de Ingreso.

Cuadro Nº 2

Variables que entran en el Modelo de Regresión por Estratos de Ingresos

Variables

Estratos de Ingresos de los Hogares

Bajos

Medios Bajos

Medios

Medios Altos

Altos

Explicada

Logaritmo del Ingreso del Hogar

x

x

x

x

x

Explicativas

Número de miembros del hogar

x

x

   

x

Número de Perceptores del hogar

x

x

x

x

 

Escolaridad promedio de perceptores

x

x

x

x

x

Edad del que Más gana

x

x

x

   

NBI

x

x

x

x

 

Tenencia de Vivienda

x

x

x

x

 

Estrato Geográfico

x

x

x

x

x

Fuente de Mayor Ingreso del hogar

x

x

     

Categoría Ocupacional del que Más gana

   

x

x

x

Con respecto a las variables seleccionadas para los Dominios de Estudio no entran en los Estratos de Ingresos

. Tasa de dependencia
. Escolaridad del que Más gana

En los dos estratos más bajos entran el mismo conjunto de variables, un hecho importante es que entra la "Fuente de Mayor Ingreso del hogar", que fue eliminado en caso de los dominios. En los tres estratos más altos entra en su lugar "Categoría Ocupacional del que Más gana".

Los Estratos de Ingresos Medios y Medios Altos tienen el mismo conjunto de variables con excepción de "Edad del Perceptor que Más gana" que sólo entra en el Estrato de Ingresos Medios.

Las variables que entran en el Estrato de Ingresos Altos son sólo cuatro, las cuales también están en alguno de los otros estratos.

Las variables que entran en todos los Estratos son "Escolaridad Promedio de Perceptores" y "Estrato Geográfico".

. Variables Seleccionadas para Áreas Urbano y Rural

En el Cuadro Nº 3 se presentan las variables que van a entrar en el Modelo de Regresión por Áreas Urbano y Rural.

Cuadro Nº 3

Variables que entran en el Modelo de Regresión por Áreas Urbano y Rural

Variables

Área

Urbana

Rural

Explicada

Logaritmo del Ingreso del Hogar

x

x

Explicativas

Número de Perceptores del hogar

x

x

Escolaridad promedio de perceptores

x

x

Edad del que Más gana

x

 

NBI

x

x

Tenencia de Vivienda

x

x

Estrato Geográfico

x

x

Categoría Ocupacional del que Más gana

x

x

Con respecto a los Estratos de Ingresos no entran en estas áreas "Número de Miembros del Hogar" y "Fuente de Mayor Ingreso del Hogar". Las dos áreas tienen las mismas variables con excepción de "Edad del Perceptor que Más gana" que sólo entra en el Área Urbana.

. Variables Seleccionadas para Regiones Geográficas

En el Cuadro Nº 4 se presentan las variables que van a entrar en el Modelo de Regresión por Regiones Geográficas.

Cuadro Nº 4

Variables que entran en el Modelo de Regresión por Regiones Geográficas

Variables

Regiones Geográficas

Costa

Sierra

Selva

Explicada

Logaritmo del Ingreso del Hogar

x

x

x

Explicativas

Número de Perceptores del hogar

x

x

x

Escolaridad promedio de perceptores

x

x

x

Edad del que Más gana

 

x

 

NBI

x

x

x

Tenencia de Vivienda

x

x

x

Estrato Geográfico

x

x

x

Categoría Ocupacional del que Más gana

x

x

x

Entran las mismas variables que en las Áreas Urbano y Rural. Entre ellas sólo se diferencian en que "Edad del Perceptor que Más gana", sólo entra en Sierra.

Al inicio de esta sección se detalló la metodología seguida para la selección de las variables, de modo que se cumpla la independencia entre una y otra. Como se explicó, las técnicas de análisis fueron diversas, para las variables cuantitativas se utilizó la Matriz de Correlación Múltiple; en tanto que para las variables de tipo cualitativo se ajustó un Modelo Loglineal.

En los resultados de aplicación del Modelo Loglineal, se encontró alta asociación entre la variable Logaritmo del Ingreso (categorizada) y algunas variables cualitativas. Para que éstas puedan ser incluidas en el Modelo de Regresión Múltiple, han sido convertidas en variables artificiales (dummy), obteniendo para cada variable cualitativa con k categorías, k-1 variables artificiales. Se ilustra el procedimiento para el caso de la variable "Categoría Ocupacional del Perceptor que Más gana", que tiene cuatro categorías, se establecen las siguientes variables:

La variable Necesidades Básicas Insatisfechas (NBI) será considerada como variable cuantitativa para cada Hogar, "Número de NBI".