|
ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿
³ 3.4. JERARQUIZACION DE LAS PROVINCIAS DEL PERU SEGUN GRADO DE ³
³ POBREZA: ASPECTOS METODOLOGICOS (1) ³
ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ
Jorge Bravo
Centro Latinoamericano de Demograf¡a (CELADE)
Santiago, Chile
1. Antecedentes y objetivo
Este documento se elabora como un aporte del Convenio BID/CELADE a
los programas de inversi¢n social que el Banco Interamericano de
Desarrollo (BID) apoya en el Per£. El documento persigue, m s
particularmente, presentar una propuesta metodol¢gica para
integrar informaci¢n sociodemogr fica de censos y encuestas del
Per£, con el prop¢sito de obtener indicadores de pobreza a nivel
de provincias que sirvan a una m s eficiente asignaci¢n de
recursos en las pol¡ticas y los programas sociales.
Uno de los principios que gu¡an el dise¤o y la ejecuci¢n de dichas
pol¡ticas y programas, sobre todo aquellos que tienen un alcance
no universal o focalizado, es la priorizaci¢n de la asignaci¢n de
recursos. Esta priorizaci¢n se establece, de modo importante, en
funci¢n del grado de necesidad o de carencias que afecta a los
diferentes grupos que componen la poblaci¢n; es decir, en funci¢n
de su grado de pobreza. Una de las dimensiones importantes de
dicha priorizaci¢n es la geogr fica o pol¡tico-administrativa, en
atenci¢n a la funcionalidad que ella representa para la ejecuci¢n
de programas. Quedan comprendidos en tal caso, por ejemplo, los
programas o fondos de inversi¢n social que funcionan en muchos
pa¡ses de la regi¢n, y algunos proyectos de emergencia, como el de
alivio y reducci¢n de la pobreza en el Per£, iniciado el a¤o 1994.
En general, la jerarquizaci¢n de las unidades pol¡tico-
administrativas es relevante en todo programa orientado a aliviar
las condiciones de pobreza mas cr¡ticas.
Sin embargo, al intentar operacionalizar dicho principio y obtener
indicadores sint‚ticos apropiados, se encuentran algunas
dificultades pr cticas. Por un lado, los datos que tienen un
adecuado nivel de desagregaci¢n son generalmente insuficientes.
Estos datos son, t¡picamente, indicadores de necesidades b sicas
insatisfechas provenientes del censo. Si bien se encuentra all¡
una cantidad de informaci¢n relevante a niveles geogr ficos
suficientemente desagregados, no resulta f cil obtener un
indicador sint‚tico de aceptaci¢n generalizada por parte de los
analistas o los tomadores de decisiones. En particular, el censo
de 1993, as¡ como la gran mayor¡a de los censos de la regi¢n de
Am‚rica Latina y el Caribe, no recogen informaci¢n de ingresos, lo
que impide una estimaci¢n directa de la proporci¢n de hogares
debajo de la l¡nea de pobreza, que es un indicador s¡ntesis de
relativamente amplia aceptaci¢n y utilizaci¢n. Por otro lado, las
encuestas nacionales de hogares y de caracter¡sticas socioecon¢-
micas contienen informaci¢n suficientemente detallada de ingresos
para hacer las estimaciones requeridas, pero su representatividad
alcanza s¢lo a grandes regiones, reas urbanas o aun
metropolitanas.
En una primera mirada, pues, y en ausencia de otras estad¡sticas
completas y confiables al nivel requerido, el problema pareciera
ser insalvable. Sin embargo, tal como sugiere este documento, es
posible obtener estimaciones indirectas de la distribuci¢n del
ingreso de los hogares mediante la combinaci¢n de ambas fuentes de
informaci¢n (censo y encuestas) y del uso de m‚todos estad¡sticos
apropiados. Un antecedente de que dicha combinaci¢n es no tan s¢lo
factible sino tambi‚n £til desde el punto de vista de las
pol¡ticas sociales, lo constituye el cruce de informaci¢n de
ingresos y de necesidades b sicas insatisfechas, expuesto en el
extensamente aplicado desarrollo de Rub‚n Kaztman (1989) para la
caracterizaci¢n de la pobreza.
Partiendo de la posibilidad de combinar los tipos de informaci¢n
antedichos, estas notas exponen brevemente una posible forma de
integrar las fuentes de informaci¢n (l‚ase el Censo de 1993 y la
Encuesta nacional de prop¢sitos m£ltiples, ENAPROM) para obtener
ciertos indicadores del nivel de vida en departamentos y
provincias. Es importante anotar que la ENAPROM cubr¡a, hasta
1994, s¢lo el rea metropolitana de Lima y Callao y las 24
ciudades capitales del resto de los departamentos del pa¡s. A
partir de 1995, la encuesta de hogares del Per£ ha extendido su
cobertura a la totalidad del pa¡s, con representatividad a nivel
nacional, rea urbana y rural. A partir de 1995 la encuesta se
denomina Encuesta nacional de hogares (ENAHO).
La idea b sica del m‚todo aqu¡ propuesto es realizar una
estimaci¢n indirecta del nivel de vida en cada provincia,
expresado a trav‚s del porcentaje de pobreza, en dos etapas:
i) Establecer una relaci¢n estad¡stica entre el nivel de ingreso
de los hogares y un conjunto de caracter¡sticas de las personas,
de la vivienda y del tipo de localidad donde ellas habitan;
ii) Usar el modelo desarrollado para estimar el porcentaje de
pobreza a nivel departamental y provincial sobre la base de las
caracter¡sticas ya se¤aladas. Dicho indicador puede servir para el
objetivo deseado de jerarquizaci¢n de distritos.
2. Metodolog¡a
2.1 Factibilidad de combinar fuentes
Esta secci¢n examina brevemente la posibilidad pr ctica de
combinar la informaci¢n sobre los hogares y sus miembros del Censo
de 1993 y la ENAPROM. Tal como sugiere el cuadro 1, hay una gran
cantidad de variables que fueron recogidas tanto en el Censo como
en la ENAPROM. Existen varias excepciones, como la informaci¢n
sobre los materiales de paredes, techo y piso, que fue recopilada
en el Censo pero no en la ENAPROM, as¡ como algunas variables
espec¡ficas que fueron captadas en la ENAPROM pero no en el Censo
(p.ej., preguntas sobre combustible para cocinar, por qu‚ no
asiste a la escuela, actividades secundarias , y otras). Con todo,
el conjunto de variables comunes es bastante amplio para los
prop¢sitos presentes. Adem s, la gran mayor¡a de estas variables
tienen un formato similar y c¢digos compatibles. Lo anterior,
sumado al hecho de que los cuestionarios son bastante coherentes
entre s¡ y que ambas encuestas se llevan bajo la responsabilidad
de una sola instituci¢n, el Instituto Nacional de Estad¡stica e
Inform tica (INEI), hace presumir que la informaci¢n recogida
debiera ser suficientemente comparable.
2.2 Modelo estad¡stico
Ya se se¤al¢ que un antecedente £til para lo que se plantea aqu¡
son los m‚todos que usan informaci¢n de encuestas en cruces de
necesidades b sicas insatisfechas con l¡neas de pobreza. La
propuesta presente persigue extender ese recurso a la vinculaci¢n
entre censo y encuesta, de modo de poder jerarquizar las
provincias seg£n indicadores del nivel de vida.
Cuadro 1
INFORMACION SOBRE HOGARES EN PERU, A¥O 1993, SEGUN FUENTES
ÂÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÂÄÄÄÄÄÄÄÄÄÄÂÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÂÄÄÄÄÄÄÄÄÄÄÄÄ¿
³ ³ ³ C¢digos ³ ³
³ M¢dulo/tema/pregunta ³ Censo ³ compatibles? ³ ENAPROM ³
ÁÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÁÄÄÄÄÄÄÄÄÄÄÁÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÁÄÄÄÄÄÄÄÄÄÄÄÄÙ
Localizaci¢n û si û
Vivienda
tipo (particular) û si û
propiedad/uso û si û
material de paredes û -
material de techo û -
material del piso û -
abastecimiento de agua û si û
ba¤os û si û
alumbrado el‚ctrico û si û
combustible para cocina - û
n£m. de habitaciones û si û
n£m. de dormitorios û si û
cocina û -
producci¢n de ingresos
en el hogar û -
equipamiento û si û
Personas
Educaci¢n
n£m. de personas û si û
parentesco û si û
permanencia - û
sexo û si û
edad û si û
estado civil û si û
religi¢n û -
idioma materno û -
alfabetismo û si û
asiste û no û
£ltimo grado û no û
por qu‚ no asiste - û
Ocupaci¢n y empleo
profesi¢n u oficio û -
actividad semana pasada û si û
ocupaci¢n semana pasada û si û
rama de actividad û si û
categor¡a û si û
n£m. de trabajadores
tipo, lugar, horas - û
actividad principal
y secundaria - û
Salud - û
Migraci¢n - û
Gastos del hogar - û
Transferencias realizadas - û
Transferencias financieras - û
Ingresos - û
ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
Fuente: INEI (1993) Cédula Censal; INEI (1993b) Cuestionario ENAPROM-93
Para efectos del modelo aqu¡ propuesto, se parte de la premisa
general de que existe una relaci¢n entre el nivel de ingreso de un
hogar (Y) y el n£mero de miembros econ¢micamente activos (n), sus
caracter¡sticas individuales (i), las caracter¡sticas de la
vivienda (v) y la zona de residencia (z) dentro del pa¡s. Se
propone, como primer paso, la estimaci¢n de un modelo de regresi¢n
de la variable dependiente Y respecto de las variables
independientes n, i, v, z, sobre la base de los datos de la
ENAHO1995, y ajustar el modelo a nivel provincial con base en las
variables independientes del Censo de 1993 (INEI, 1994). Un
procedimiento an logo se llev¢ a cabo para efectos de estratifi-
caci¢n en una encuesta de hogares en Paraguay (Sauma, 1993, anexo
3), con el objeto de imputar el nivel relativo de ingreso de 1982
a partir de la informaci¢n censal de ese a¤o y la relaci¢n
estad¡stica entre ingreso de 1990 y variables no ingreso de ese
mismo a¤o.
La lista preliminar de variables independientes debe incluir a
todas aquellas que sean comunes, ya sea exacta o aproximadamente,
a la ENAHO y al Censo. Una posible especificaci¢n de las variables
es la siguiente:
n - n£mero de miembros econ¢micamente activos (EA)
i - edad promedio de los EA en el hogar
- nivel educativo promedio de los EA en el hogar
- tipo de ocupaci¢n de los EA en el hogar
- rama de actividad de los EA en el hogar
v - tipo de vivienda
- abastecimiento de agua
- tipo de servicios sanitarios
- disponibilidad de electricidad
- hacinamiento
- disponibilidad de veh¡culos
- equipamiento del hogar
z - zona de residencia ( rea metropolitana,
ciudades grandes, ciudades medianas y peque¤as, reas rurales)
N¢tese que algunas de estas variables deben ser calculadas o
codificadas previamente a la realizaci¢n de regresiones propuestas
en la secci¢n siguiente. Por ejemplo, el tipo de ocupaci¢n y la
rama de actividad deber n agruparse en unas pocas categor¡as y
definir un ¡ndice (p.ej., un promedio ponderado) de composici¢n de
ocupaciones y rama de actividad. La forma m s simple de este
procedimiento ser¡a tomar, respecto de la ocupaci¢n, la proporci¢n
de los miembros EA en ocupaciones pertenecientes a los grupos
principales, 0 a 5, de la clasificaci¢n del Censo de 1993, que
incluye a los miembros de las fuerzas armadas, miembros del poder
ejecutivo, profesionales, t‚cnicos, jefes y empleados de oficina,
y a trabajadores calificados. Este grupo est m s estrechamente
asociado al sector ®moderno¯ del mercado laboral y, es de
presumir, podr¡a determinar una relaci¢n distinta entre ingreso
del hogar y las variables de vivienda, individuales y de zona de
residencia, ya mencionadas.
Consideraciones y definiciones an logas deber n realizarse con
relaci¢n a todas las dem s variables categoriales. Entre ‚stas,
cabe destacar la variable z, referida a la zona de residencia.
Si se define la variable dependiente como el ingreso per c pita en
lugar del ingreso total del hogar, parece razonable redefinir la
variable n como el cociente del n£mero de miembros econ¢micamente
activos entre el n£mero total de personas en el hogar.
Como un paso previo a cualquier an lisis estad¡stico, ser¡a
altamente conveniente una evaluaci¢n de la variable ingreso,
especialmente en lo relativo a posibles problemas de
subdeclaraci¢n. Un procedimiento com£nmente utilizado en an lisis
de pobreza es tomar como referencia las cuentas de ingresos y
gastos de las cuentas nacionales y realizar ajustes diferenciados
seg£n tipo de ingreso.
2.3 Ajuste y estimaci¢n
Recu‚rdese que el objetivo final del trabajo es obtener una medida
de la proporci¢n (P) de los hogares de cada distrito que se ubican
por debajo de la l¡nea de pobreza. El primer paso propuesto es
ajustar a los datos de la ENAHO 1995 un modelo general a nivel de
hogar, del tipo:
Y = Y(n , i , v , e ) (1)
h h h h h
donde h denota el hogar de referencia y h el t‚rmino de error del
ingreso del hogar, o bien uno del tipo:
p = p(h , i , u , m ) (2)
h h h h h
donde ph denota la probabilidad de que el hogar h se sit£e bajo la
l¡nea de pobreza y uh el t‚rmino de error de esta ecuaci¢n. Deber
considerarse atentamente la especificaci¢n, ajuste y validaci¢n
del modelo de regresi¢n. Habr que ensayar con diferentes formas
funcionales en las variables independientes, as¡ como detectar y
minimizar posibles problemas de multicolinearidad, especialmente
en el conjunto de variables v.
Una vez determinado el modelo de regresi¢n final, existen dos
posibilidades para estimar P: i) se usan los coeficientes
estimados de la ecuaci¢n (1) y la informaci¢n del censo correspon-
diente a las variables independientes de cada hogar, y se hace una
estimaci¢n de su nivel de ingreso o de su ingreso per c pita. Para
cada provincia, se calcula el porcentaje de pobreza sobre la base
de los valores estimados de Yh ; ii) se usan los coeficientes
estimados de la ecuaci¢n (2) y la informaci¢n del censo
correspondiente a las variables independientes de cada provincia,
y se calcula directamente el valor ajustado de P para la
provincia. Cada una de estas variantes tiene ventajas y
desventajas (v‚ase el ap‚ndice); eventualmente, podr¡an implemen-
tarse ambas para evaluar la consistencia de los ordenamientos
resultantes.
Finalmente, ser¡a deseable realizar alg£n an lisis de consistencia
de los resultados globales de la ENAHO y de su sensibilidad
respecto de la especificaci¢n del modelo estad¡stico, que permita
evaluar la robustez de la jerarquizaci¢n resultante.
3. Comentarios y sugerencias
Como puede deducirse de las secciones anteriores, la combinaci¢n
de informaci¢n de la Encuesta nacional de hogares y del Censo es
factible y -mediante un trabajo estad¡stico cuidadoso- puede
resultar de mucha utilidad para basar una jerarquizaci¢n de
departamentos y provincias seg£n nivel de vida. Que la ENAHO
recoja una cantidad apreciable de informaci¢n del mismo car cter y
en un formato similar al Censo y que tenga representatividad a
nivel nacional, urbano y rural, son factores que permiten tener
optimismo en cuanto a la utilidad y confiabilidad de los
resultados.
Un primer acercamiento a la jerarquizaci¢n podr¡a realizarse a
nivel departamental y provincial sobre la base de los indicadores
censales recientemente publicados (INEI, 1994). Como primer punto
de comparaci¢n y de posterior verificaci¢n de consistencia, parece
conveniente obtener un primer conjunto de ordenamientos uni o
multivariados, con la informaci¢n censal solamente. Los
componentes principales de la matriz {n i v z} o mediante an lisis
de discriminantes podr¡an ser particularmente £tiles a este
efecto. La preparaci¢n de un archivo de las variables ya
mencionadas a nivel de hogar ser , en cualquier caso,
indispensable para la segunda etapa propuesta, por lo que ese
an lisis preliminar complementar las fases siguientes del
trabajo.
Ap‚ndice
Tal como se se¤ala en la p gina 7, en el contexto presente existen
dos formas de obtener una estimaci¢n de la proporci¢n (P) de los
hogares de cada provincia que se ubican por debajo de la l¡nea de
pobreza: i) realizar un ajuste (mediante la ecuaci¢n 1) del
ingreso de cada hogar en el distrito y usar la distribuci¢n de
hogares seg£n nivel de ingreso para calcular P, o ii) realizar un
ajuste (mediante la ecuaci¢n 2) de la probabilidad ph de que el
hogar h se sit£e bajo la l¡nea de pobreza y utilizar el valor
ajustado de p para cada provincia como la estimaci¢n de P.
El procedimiento i tiene como ventaja que su interpretaci¢n
conceptual es bastante directa y entrega adicionalmente una
distribuci¢n de los hogares seg£n ingreso, la que se puede
utilizar para hacer diferentes cortes, adem s del de la l¡nea de
pobreza aqu¡ privilegiado. Tiene como desventaja un requerimiento
de un gran volumen de c lculos, ya que la estimaci¢n se hace sobre
los m s de 4 millones 760 mil hogares encuestados en el censo de
julio de 1993. Otra desventaja es que no existe garant¡a, a
priori, de que algunos de los valores estimados se ubiquen en un
rango fuera de los m rgenes observados en la ENAPROM.
El procedimiento ii, por su parte, tiene como ventaja que requiere
de una cantidad de c lculos much¡simo menor (sobre las 187
provincias del pa¡s), adem s que los programas estad¡sticos
disponibles incorporan la restricci¢n deseable de que los valores
estimados de p y P se ubiquen dentro del rango establecido (0,1).
Tiene el peque¤o inconveniente, m s bien de car cter conceptual,
de que involucra usar estimaciones hechas sobre la base de una
variable dicot¢mica (que asume el valor 1 si el hogar est bajo la
l¡nea de pobreza, 0 si no lo est ) para predecir el valor de una
variable continua (la proporci¢n de hogares o de poblaci¢n bajo la
l¡nea de pobreza). Ello requiere tener alguna presunci¢n respecto
de la forma de la distribuci¢n probabil¡stica de p. Este £ltimo
inconveniente, sin embargo, puede superarse en buena medida
experimentando con diferentes funciones de distribuci¢n para p, de
modo de minimizar el riesgo de sesgo debido a la elecci¢n de una
muy espec¡fica o poco flexible.
ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿
³ Bibliograf¡a ³
ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ
ù Instituto Nacional de Estad¡stica e Inform tica (INEI) (1993a),
C‚dula Censal, Censos nacionales de 1993: IX de poblaci¢n y IV
de vivienda. Lima, Per£.
ù (1993b), Cuestionario ENAPROM-1993, Encuesta nacional de
prop¢sitos m£ltiples, Lima.
ù (1994), Mapa de necesidades b sicas insatisfechas, Lima.
ù Kaztman, R. (1989), "La heterogeneidad de la pobreza: el caso de
Montevideo", Revista de la CEPAL, N§ 37, abril, pp. 141-152.
ù Sauma, P. (1993), La distribuci¢n del ingreso en el Paraguay,
Facultad de Ciencias Econ¢micas, Administrativas y Contables,
Universidad Nacional de Asunci¢n, Proyecto BID ATP/SF-2156-PR.
|