INEI - 3.4 JERARQUIZACION DE LAS PROVINCIAS DEL PERU SEGUN GRADO DE POBREZA: ASPECTOS METODOLOGICOS JORGE BRAVO

    ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿
    ³ 3.4. JERARQUIZACION DE LAS PROVINCIAS DEL PERU SEGUN GRADO DE ³
    ³             POBREZA: ASPECTOS METODOLOGICOS (1)               ³
    ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ
                             Jorge Bravo
            Centro Latinoamericano de Demograf¡a (CELADE)
                           Santiago, Chile


1.  Antecedentes y objetivo

    Este documento se elabora como un aporte del Convenio BID/CELADE a
    los programas de inversi¢n social que el Banco  Interamericano  de
    Desarrollo  (BID)  apoya  en  el  Per£. El documento persigue, m s
    particularmente,  presentar   una  propuesta   metodol¢gica   para
    integrar  informaci¢n  sociodemogr fica  de censos y encuestas del
    Per£, con el prop¢sito de obtener indicadores de pobreza  a  nivel
    de  provincias  que  sirvan  a  una  m s eficiente  asignaci¢n  de
    recursos en las pol¡ticas y los programas sociales.

    Uno de los principios que gu¡an el dise¤o y la ejecuci¢n de dichas
    pol¡ticas  y  programas, sobre todo aquellos que tienen un alcance
    no universal o focalizado, es la priorizaci¢n de la asignaci¢n  de
    recursos.  Esta  priorizaci¢n se establece, de modo importante, en
    funci¢n del grado de necesidad o de carencias  que  afecta  a  los
    diferentes  grupos que componen la poblaci¢n; es decir, en funci¢n
    de su grado de pobreza. Una  de  las  dimensiones  importantes  de
    dicha  priorizaci¢n es la geogr fica o pol¡tico-administrativa, en
    atenci¢n a la funcionalidad que ella representa para la  ejecuci¢n
    de  programas.  Quedan  comprendidos en tal caso, por ejemplo, los
    programas o fondos de inversi¢n social  que  funcionan  en  muchos
    pa¡ses de la regi¢n, y algunos proyectos de emergencia, como el de
    alivio y reducci¢n de la pobreza en el Per£, iniciado el a¤o 1994.
    En  general,  la  jerarquizaci¢n   de   las   unidades   pol¡tico-
    administrativas es relevante en todo programa orientado a  aliviar
    las condiciones de pobreza mas cr¡ticas.

    Sin embargo, al intentar operacionalizar dicho principio y obtener
    indicadores   sint‚ticos   apropiados,   se   encuentran   algunas
    dificultades  pr cticas.  Por  un  lado,  los  datos que tienen un
    adecuado nivel de desagregaci¢n  son  generalmente  insuficientes.
    Estos  datos  son, t¡picamente, indicadores de necesidades b sicas
    insatisfechas provenientes del censo. Si bien  se  encuentra  all¡
    una  cantidad  de  informaci¢n  relevante  a  niveles  geogr ficos
    suficientemente   desagregados,   no   resulta  f cil  obtener  un
    indicador  sint‚tico  de  aceptaci¢n generalizada por parte de los
    analistas o los tomadores de decisiones. En particular,  el  censo
    de  1993,  as¡  como la gran mayor¡a de los censos de la regi¢n de
    Am‚rica Latina y el Caribe, no recogen informaci¢n de ingresos, lo
    que  impide  una  estimaci¢n  directa  de la proporci¢n de hogares
    debajo de la l¡nea de pobreza, que es  un  indicador  s¡ntesis  de
    relativamente  amplia aceptaci¢n y utilizaci¢n. Por otro lado, las
    encuestas  nacionales  de hogares y de caracter¡sticas socioecon¢-
    micas contienen informaci¢n suficientemente detallada de  ingresos
    para  hacer las estimaciones requeridas, pero su representatividad
    alcanza   s¢lo   a   grandes   regiones,    reas   urbanas  o  aun
    metropolitanas.

    En una primera mirada, pues, y en ausencia de  otras  estad¡sticas
    completas  y  confiables al nivel requerido, el problema pareciera
    ser insalvable. Sin embargo, tal como sugiere este  documento,  es
    posible  obtener  estimaciones  indirectas  de la distribuci¢n del
    ingreso de los hogares mediante la combinaci¢n de ambas fuentes de
    informaci¢n (censo y encuestas) y del uso de m‚todos  estad¡sticos
    apropiados. Un antecedente de que dicha combinaci¢n es no tan s¢lo
    factible  sino  tambi‚n  £til  desde  el  punto  de  vista  de las
    pol¡ticas sociales, lo  constituye  el  cruce  de  informaci¢n  de
    ingresos  y  de  necesidades b sicas insatisfechas, expuesto en el
    extensamente aplicado desarrollo de Rub‚n Kaztman (1989)  para  la
    caracterizaci¢n de la pobreza.

    Partiendo de la posibilidad de combinar los tipos  de  informaci¢n
    antedichos,  estas  notas  exponen brevemente una posible forma de
    integrar las fuentes de informaci¢n (l‚ase el Censo de 1993  y  la
    Encuesta  nacional  de prop¢sitos m£ltiples, ENAPROM) para obtener
    ciertos  indicadores  del  nivel  de  vida   en   departamentos  y
    provincias.  Es  importante  anotar  que  la ENAPROM cubr¡a, hasta
    1994, s¢lo el  rea  metropolitana  de  Lima  y  Callao  y  las  24
    ciudades  capitales  del  resto  de  los departamentos del pa¡s. A
    partir de 1995, la encuesta de hogares del Per£  ha  extendido  su
    cobertura  a  la totalidad del pa¡s, con representatividad a nivel
    nacional,  rea urbana y rural.  A  partir  de  1995 la encuesta se
    denomina Encuesta nacional de hogares (ENAHO).

    La  idea  b sica  del  m‚todo  aqu¡  propuesto  es   realizar  una
    estimaci¢n  indirecta  del  nivel  de  vida  en   cada  provincia,
    expresado  a  trav‚s  del  porcentaje  de  pobreza, en dos etapas:
    i) Establecer una relaci¢n estad¡stica entre el nivel  de  ingreso
    de  los  hogares y un conjunto de caracter¡sticas de las personas,
    de  la  vivienda  y  del  tipo  de  localidad donde ellas habitan;
    ii) Usar el modelo desarrollado  para  estimar  el  porcentaje  de
    pobreza  a  nivel  departamental y provincial sobre la base de las
    caracter¡sticas ya se¤aladas. Dicho indicador puede servir para el
    objetivo deseado de jerarquizaci¢n de distritos.

2.  Metodolog¡a

2.1 Factibilidad de combinar fuentes

    Esta  secci¢n   examina  brevemente  la  posibilidad  pr ctica  de 
    combinar la informaci¢n sobre los hogares y sus miembros del Censo
    de 1993 y la ENAPROM. Tal como sugiere el cuadro 1, hay  una  gran
    cantidad  de variables que fueron recogidas tanto en el Censo como
    en la ENAPROM. Existen varias  excepciones,  como  la  informaci¢n
    sobre  los materiales de paredes, techo y piso, que fue recopilada
    en  el  Censo  pero  no  en la ENAPROM, as¡ como algunas variables
    espec¡ficas que fueron captadas en la ENAPROM pero no en el  Censo
    (p.ej.,  preguntas  sobre  combustible  para  cocinar,  por qu‚ no
    asiste a la escuela, actividades secundarias , y otras). Con todo,
    el conjunto de variables  comunes  es  bastante  amplio  para  los
    prop¢sitos  presentes.  Adem s, la gran mayor¡a de estas variables
    tienen un formato similar  y  c¢digos  compatibles.  Lo  anterior,
    sumado  al  hecho de que los cuestionarios son bastante coherentes
    entre s¡ y que ambas encuestas se llevan bajo  la  responsabilidad
    de  una  sola  instituci¢n, el Instituto Nacional de Estad¡stica e
    Inform tica (INEI), hace  presumir  que  la  informaci¢n  recogida
    debiera ser suficientemente comparable.

2.2 Modelo estad¡stico

    Ya  se  se¤al¢ que un antecedente £til para lo que se plantea aqu¡
    son los m‚todos que usan informaci¢n de  encuestas  en  cruces  de
    necesidades  b sicas  insatisfechas  con  l¡neas  de  pobreza.  La
    propuesta presente persigue extender ese recurso a la  vinculaci¢n
    entre   censo  y  encuesta,  de  modo  de  poder  jerarquizar  las
    provincias seg£n indicadores del nivel de vida.

                           Cuadro 1

    INFORMACION SOBRE HOGARES EN PERU, A¥O 1993, SEGUN FUENTES  
ÂÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÂÄÄÄÄÄÄÄÄÄÄÂÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÂÄÄÄÄÄÄÄÄÄÄÄÄ¿
³                           ³          ³    C¢digos    ³            ³
³   M¢dulo/tema/pregunta    ³   Censo  ³  compatibles? ³  ENAPROM   ³
ÁÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÁÄÄÄÄÄÄÄÄÄÄÁÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÁÄÄÄÄÄÄÄÄÄÄÄÄÙ
Localizaci¢n                      û            si             û
Vivienda
     tipo (particular)            û            si             û
     propiedad/uso                û            si             û
     material de paredes          û                           -
     material de techo            û                           -
     material del piso            û                           -
     abastecimiento de agua       û            si             û
     ba¤os                        û            si             û
     alumbrado el‚ctrico          û            si             û
     combustible para cocina      -                           û
     n£m. de habitaciones         û            si             û
     n£m. de dormitorios          û            si             û
     cocina                       û                           -
     producci¢n de ingresos
        en el hogar               û                           -
     equipamiento                 û            si             û
Personas
   Educaci¢n
     n£m. de personas             û            si             û
     parentesco                   û            si             û
     permanencia                  -                           û
     sexo                         û            si             û
     edad                         û            si             û
     estado civil                 û            si             û
     religi¢n                     û                           -
     idioma materno               û                           -
     alfabetismo                  û            si             û
     asiste                       û            no             û
     £ltimo grado                 û            no             û
     por qu‚ no asiste            -                           û
   Ocupaci¢n y empleo
     profesi¢n u oficio           û                           -
     actividad semana pasada      û            si             û
     ocupaci¢n semana pasada      û            si             û
     rama de actividad            û            si             û
     categor¡a                    û            si             û
     n£m. de trabajadores
     tipo, lugar, horas           -                           û
     actividad principal
        y secundaria              -                           û
Salud                             -                           û
Migraci¢n                         -                           û
Gastos del hogar                  -                           û
Transferencias realizadas         -                           û
Transferencias financieras        -                           û
Ingresos                          -                           û

ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ 
Fuente: INEI (1993) Cédula Censal; INEI (1993b) Cuestionario ENAPROM-93


    Para efectos del modelo aqu¡ propuesto, se  parte  de  la  premisa
    general de que existe una relaci¢n entre el nivel de ingreso de un
    hogar (Y) y el n£mero de miembros econ¢micamente activos (n),  sus
    caracter¡sticas  individuales   (i),  las  caracter¡sticas  de  la
    vivienda  (v)  y  la  zona  de  residencia (z) dentro del pa¡s. Se
    propone, como primer paso, la estimaci¢n de un modelo de regresi¢n
    de  la  variable  dependiente  Y   respecto   de   las   variables
    independientes  n,  i,  v,  z,  sobre  la  base de los datos de la
    ENAHO1995, y ajustar el modelo a nivel provincial con base  en las
    variables  independientes  del  Censo  de  1993  (INEI,  1994). Un
    procedimiento an logo se llev¢ a cabo para efectos  de  estratifi-
    caci¢n  en una encuesta de hogares en Paraguay (Sauma, 1993, anexo
    3), con el objeto de imputar el nivel relativo de ingreso de  1982
    a  partir  de  la  informaci¢n  censal  de  ese  a¤o y la relaci¢n
    estad¡stica  entre  ingreso  de 1990 y variables no ingreso de ese
    mismo a¤o.

    La  lista  preliminar  de  variables independientes debe incluir a
    todas aquellas que sean comunes, ya sea exacta o  aproximadamente,
    a la ENAHO y al Censo. Una posible especificaci¢n de las variables
    es la siguiente:

    n - n£mero de miembros econ¢micamente activos (EA)
    
    i - edad promedio de los EA en el hogar
      - nivel educativo promedio de los EA en el hogar
      - tipo de ocupaci¢n de los EA en el hogar
      - rama de actividad de los EA en el hogar
    
    v - tipo de vivienda
      - abastecimiento de agua
      - tipo de servicios sanitarios
      - disponibilidad de electricidad
      - hacinamiento
      - disponibilidad de veh¡culos
      - equipamiento del hogar
    
    z - zona de residencia ( rea metropolitana, 
        ciudades grandes, ciudades medianas y peque¤as,  reas rurales)

    N¢tese que algunas de  estas  variables  deben  ser  calculadas  o
    codificadas previamente a la realizaci¢n de regresiones propuestas
    en  la  secci¢n  siguiente. Por ejemplo, el tipo de ocupaci¢n y la
    rama de actividad deber n agruparse en  unas  pocas  categor¡as  y
    definir un ¡ndice (p.ej., un promedio ponderado) de composici¢n de
    ocupaciones  y  rama  de  actividad.  La  forma m s simple de este
    procedimiento ser¡a tomar, respecto de la ocupaci¢n, la proporci¢n
    de  los  miembros  EA en ocupaciones pertenecientes  a  los grupos
    principales, 0 a 5, de la clasificaci¢n del  Censo  de  1993,  que
    incluye  a los miembros de las fuerzas armadas, miembros del poder
    ejecutivo, profesionales, t‚cnicos, jefes y empleados de  oficina,
    y  a  trabajadores  calificados. Este grupo est  m s estrechamente
    asociado  al  sector  ®moderno¯  del  mercado  laboral  y,  es  de
    presumir,  podr¡a  determinar  una relaci¢n distinta entre ingreso
    del hogar y las variables de vivienda, individuales y  de zona  de
    residencia, ya mencionadas.

    Consideraciones y definiciones  an logas  deber n  realizarse  con
    relaci¢n a todas las dem s variables  categoriales.  Entre  ‚stas,
    cabe destacar la variable z, referida a la zona de residencia.

    Si se define la variable dependiente como el ingreso per c pita en
    lugar del ingreso total del hogar, parece razonable  redefinir  la
    variable  n como el cociente del n£mero de miembros econ¢micamente
    activos entre el n£mero total de personas en el hogar.

    Como  un  paso  previo  a  cualquier  an lisis  estad¡stico, ser¡a
    altamente conveniente  una  evaluaci¢n  de  la  variable  ingreso,
    especialmente   en   lo   relativo   a   posibles   problemas   de
    subdeclaraci¢n. Un procedimiento com£nmente utilizado en  an lisis
    de  pobreza  es  tomar  como  referencia las cuentas de ingresos y
    gastos de las cuentas nacionales y realizar ajustes  diferenciados
    seg£n tipo de ingreso.

2.3 Ajuste y estimaci¢n

    Recu‚rdese que el objetivo final del trabajo es obtener una medida
    de la proporci¢n (P) de los hogares de cada distrito que se ubican
    por  debajo  de  la  l¡nea de pobreza. El primer paso propuesto es
    ajustar a los datos de la ENAHO 1995 un modelo general a nivel  de
    hogar, del tipo:

          Y  = Y(n , i , v , e )   (1)
           h      h   h   h   h 

    donde h denota el hogar de referencia y  h el t‚rmino de error del
    ingreso del hogar, o bien uno del tipo:

    p  = p(h , i , u , m )  (2)
     h      h   h   h   h

    donde ph denota la probabilidad de que el hogar h se sit£e bajo la
    l¡nea de pobreza y uh el t‚rmino de error de esta ecuaci¢n. Deber 
    considerarse  atentamente  la  especificaci¢n, ajuste y validaci¢n
    del modelo de regresi¢n. Habr  que ensayar con  diferentes  formas
    funcionales  en  las variables independientes, as¡ como detectar y
    minimizar posibles problemas de  multicolinearidad,  especialmente
    en el conjunto de variables v.

    Una vez determinado el modelo  de  regresi¢n  final,  existen  dos
    posibilidades  para  estimar  P:  i)  se  usan  los   coeficientes
    estimados de la ecuaci¢n (1) y la informaci¢n del censo correspon-
    diente a las variables independientes de cada hogar, y se hace una
    estimaci¢n de su nivel de ingreso o de su ingreso per c pita. Para
    cada provincia, se calcula el porcentaje de pobreza sobre la  base
    de  los  valores  estimados  de  Yh ; ii) se usan los coeficientes
    estimados  de  la  ecuaci¢n  (2)  y  la  informaci¢n   del   censo
    correspondiente a las variables independientes de cada  provincia,
    y  se  calcula  directamente  el  valor  ajustado  de  P  para  la
    provincia.  Cada  una  de  estas   variantes   tiene   ventajas  y
    desventajas (v‚ase  el ap‚ndice); eventualmente, podr¡an implemen-
    tarse ambas para evaluar  la  consistencia  de  los  ordenamientos
    resultantes.

    Finalmente, ser¡a deseable realizar alg£n an lisis de consistencia
    de  los  resultados  globales  de  la  ENAHO  y de su sensibilidad
    respecto de la especificaci¢n del modelo estad¡stico, que  permita
    evaluar la robustez de la jerarquizaci¢n resultante.

3.  Comentarios y sugerencias

    Como puede deducirse de las secciones anteriores,  la  combinaci¢n
    de  informaci¢n  de la Encuesta nacional de hogares y del Censo es
    factible y  -mediante  un  trabajo  estad¡stico  cuidadoso-  puede
    resultar  de  mucha  utilidad  para  basar  una  jerarquizaci¢n de
    departamentos  y  provincias  seg£n  nivel  de  vida. Que la ENAHO
    recoja una cantidad apreciable de informaci¢n del mismo car cter y
    en un formato similar al Censo y  que  tenga  representatividad  a
    nivel  nacional,  urbano  y rural, son factores que permiten tener
    optimismo   en  cuanto  a  la  utilidad  y  confiabilidad  de  los
    resultados.

    Un  primer  acercamiento  a  la jerarquizaci¢n podr¡a realizarse a
    nivel departamental y provincial sobre la base de los  indicadores
    censales  recientemente publicados (INEI, 1994). Como primer punto
    de comparaci¢n y de posterior verificaci¢n de consistencia, parece
    conveniente obtener un  primer  conjunto  de  ordenamientos  uni o
    multivariados,  con   la   informaci¢n   censal   solamente.   Los
    componentes principales de la matriz {n i v z} o mediante an lisis
    de  discriminantes  podr¡an  ser  particularmente  £tiles  a  este
    efecto.  La  preparaci¢n  de  un  archivo  de  las  variables   ya
    mencionadas  a  nivel   de   hogar   ser ,   en   cualquier  caso,
    indispensable  para  la  segunda  etapa  propuesta, por lo que ese
    an lisis   preliminar  complementar    las  fases  siguientes  del
    trabajo.

    Ap‚ndice

    Tal como se se¤ala en la p gina 7, en el contexto presente existen
    dos formas de obtener una estimaci¢n de la proporci¢n (P)  de  los
    hogares  de cada provincia que se ubican por debajo de la l¡nea de
    pobreza:  i)  realizar  un  ajuste  (mediante  la  ecuaci¢n 1) del
    ingreso de cada hogar en el distrito y  usar  la  distribuci¢n  de
    hogares  seg£n nivel de ingreso para calcular P, o ii) realizar un
    ajuste (mediante la ecuaci¢n 2) de la probabilidad ph  de  que  el
    hogar  h  se  sit£e  bajo  la l¡nea de pobreza y utilizar el valor
    ajustado de p para cada provincia como la estimaci¢n de P.

    El  procedimiento  i  tiene  como  ventaja  que  su interpretaci¢n
    conceptual  es  bastante  directa  y  entrega  adicionalmente  una
    distribuci¢n  de  los  hogares  seg£n  ingreso,  la  que  se puede
    utilizar para hacer diferentes cortes, adem s del de la  l¡nea  de
    pobreza aqu¡ privilegiado. Tiene como desventaja un  requerimiento
    de un gran volumen de c lculos, ya que la estimaci¢n se hace sobre
    los m s de 4 millones 760 mil hogares encuestados  en  el censo de
    julio  de  1993.  Otra  desventaja  es  que  no existe garant¡a, a
    priori, de que algunos de los valores estimados se ubiquen  en  un
    rango fuera de los m rgenes observados en la ENAPROM.

    El procedimiento ii, por su parte, tiene como ventaja que requiere
    de  una  cantidad  de  c lculos  much¡simo  menor  (sobre  las 187
    provincias  del  pa¡s),  adem s  que  los  programas  estad¡sticos
    disponibles incorporan la restricci¢n deseable de que los  valores
    estimados de p y P se ubiquen dentro del rango establecido  (0,1).
    Tiene  el  peque¤o inconveniente, m s bien de car cter conceptual,
    de que involucra usar estimaciones hechas sobre  la  base  de  una
    variable dicot¢mica (que asume el valor 1 si el hogar est  bajo la
    l¡nea de pobreza, 0 si no lo est ) para predecir el valor  de  una
    variable continua (la proporci¢n de hogares o de poblaci¢n bajo la
    l¡nea de pobreza). Ello requiere tener alguna presunci¢n  respecto
    de  la  forma  de la distribuci¢n probabil¡stica de p. Este £ltimo
    inconveniente,  sin  embargo,  puede  superarse  en  buena  medida
    experimentando con diferentes funciones de distribuci¢n para p, de
    modo de minimizar el riesgo de sesgo debido a la elecci¢n  de  una
    muy espec¡fica o poco flexible.


ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿
³  Bibliograf¡a  ³  
ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ  

    ù Instituto  Nacional de Estad¡stica e Inform tica (INEI) (1993a),
      C‚dula Censal, Censos nacionales de 1993: IX de poblaci¢n  y  IV
      de vivienda. Lima, Per£.
    
    ù        (1993b), Cuestionario ENAPROM-1993, Encuesta nacional  de
      prop¢sitos m£ltiples, Lima.
    
    ù (1994), Mapa de necesidades b sicas insatisfechas, Lima.

    ù Kaztman, R. (1989), "La heterogeneidad de la pobreza: el caso de
      Montevideo", Revista de la CEPAL, N§ 37, abril, pp. 141-152.
    
    ù Sauma,  P.  (1993),  La distribuci¢n del ingreso en el Paraguay,
      Facultad de Ciencias Econ¢micas,  Administrativas  y  Contables,
      Universidad Nacional de Asunci¢n, Proyecto BID ATP/SF-2156-PR.