Análisis de la Calidad de la Base de Datos: ENAHO 1997 Y 1998
El manejo de la base de datos, a sugerencia del INEI, se ha realizado con el programa de computación estadístico SPSS 7.5. No ha habido ningún problema de corrupción de archivos y/o de lectura de datos. Los problemas están referidos principalmente al uso metodológico de los mismos y a la lógica de la construcción de la base. 1. Uso de los factores de expansión En principio, los factores de expansión para las ENAHO 1997-IV y 1998-IV deben suponerse ser de la misma naturaleza y no distintos. El factor de expansión correspondiente a la base de datos de las variables calculadas del año 1997-IV trimestre es para hogares, mientras que el factor de expansión de la base de datos para el 1998-IV es poblacional. Esto resulta en el problema de que al trabajar con los datos expandidos se obtienen valores poblacionales altisimos para 1998, aunque guardan lógica en la proporción. Aparentemente la solución se encuentra en que los factores de expansión para 1998 deben dividirse por 10. 2. Uso de los diccionarios de datos Las variables de interés para el análisis del presente trabajo están relacionadas a los niveles de pobreza y al empleo. Para tal efecto, se han utilizado las bases de datos que corresponden a las variables sumarias construidas por el INEI junto con las bases de datos que contienen las preguntas referidas a las preguntas de empleo (capítulo 500). Se han encontrado las siguientes dificultades: 2.1 Para el caso de la población a) No fue posible identificar una variable que reporte directamente los niveles poblacionales en la base de datos sumaria para ambos años (1997 IV - 1998 IV). De este modo, al calcular indirectamente la población, la suma total de ella, no concuerda con las reportadas por el INEI. Esto vuelve problemático el cálculo de valores percápita. 2.2 Para el caso de la variables relacionadas con pobreza: a) En las bases de datos de las variables calculadas (1997-IV y 1998-IV) existe una variable llamada pobreza, cuyos valores son 1, 2 y 3 que corresponden a las categorías Pobres extremos, Pobres no extremos, y No pobres respectivamente. No se conoce sobre la base de qué variable se ha tipificado esta: por ingreso o por gasto. Los resultados parecen sugerir que se basan en el gasto. b) En la misma base, existe tambien el dato del quintil al que pertenece la vivienda en cuestión, sin embargo en la base de datos de 1997-IV, existe el quintil "cero", además de los quintiles uno a cinco. Este problema no se presenta en la base correspondiente a 1998-IV. c) Siendo que se tiene toda la libertad de construir las variables necesarias para el análisis, a partir de los datos alcanzados; y teniendo como referencia, en el caso específico, las variables de ingresos construidas, ¿Cuál de las que se presenta en las bases (total bruto, total neto, total permanente) fue utilizada para el cálculo de la pobreza por ingreso en los datos publicados por el INEI? En todo caso, ¿Qué otro refinamiento de los datos es necesario para estimar los niveles de pobreza?. Esto es imprescindible de dejar en claro ya que por lo general es necesario poder identificar los niveles de pobreza de la población no solo a traves del gasto sino tambien a traves de los niveles de ingreso familiar percapita. 2.3 Para el caso de las variables relacionadas con el empleo: De acuerdo a la propuesta del presente estudio, es necesario calcular el empleo según actividad económica, principalmente por grandes grupos económicos. Las variables a tomar en cuenta son las que permiten el empleo de acuerdo a la CIIU. Sin embargo su codificación no es conocida. El diccionario de datos refiere al operario a utilizar la tabla de rama de actividad económica y su correspondiente base de datos de clasificación pero no la forma de decodificarla. |