ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿                          
    ³                         CAPITULO II                            ³             
    ³     METODOLOGIA E INSTRUMENTOS DE MEDICION DE LA POBREZA       ³
    ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ


    2.1 METODOLOGIA DE MEDICION DE LA POBREZA

    2.1.1 ELEMENTOS DE MUESTREO

          Lic. F tima Medina Merino*

    El conocimiento de la realidad social, especialmente aquel  basado
    en informaci¢n de tipo estad¡stico, requiere de cierta rigurosidad
    muestral, a fin que los datos que se obtengan, sea por censo o por
    encuesta, reflejen lo m s certeramente  posible la realidad que se
    est   estudiando. La  informaci¢n  as¡  obtenida,  ser   de   gran
    utilidad al  momento de  dise¤ar y  ejecutar planes y programas de
    acci¢n  destinados  a  actuar  sobre  tal  realidad.  Es por  ello
    importante,  manejar   con  claridad  los  conceptos  b sicos  que
    subyacen al  trabajo muestral y  ser  pues objetivo de la presente
    ponencia, hacer algunas precisiones al respecto.

    I.   TIPOS DE DATOS

      A continuaci¢n se  presenta un  listado del tipo  de informaci¢n
      que puede  ser sujeta de  muestreo en  base a  las variables que
      est n disponibles en el INEI.  Cabe se¤alar que estas no son las
      £nicas ni  tampoco  son limitantes  para la  existencia de otras
      que expliquen la realidad.

      1.Informaci¢n geogr fica y geol¢gica de las diferentes  regiones
        del pa¡s.

      2.Informaci¢n relacionada con el tiempo. 
 
       . Datos  sobre  poblaci¢n,   reas  seg£n  diferentes  tipos  de
         utilizaci¢n   industrial,  n£mero   de  m‚dicos,  profesores,
         abogados, ingenieros y obreros.
       . Datos sobre Necesidades
       . Facilidades   de    consumo,    situaciones   de   desempleo,
         analfabetismo, tasa de crecimiento  que por otro lado son los
         que contribuyen a las necesidades que deben satisfacer.

      3. Informaci¢n  de  las   tendencias  y   relaciones  entre  las
         diferentes caracter¡sticas.

      4. Datos que se obtienen en  base  a  experimentos  estad¡sticos
         controlados, bien dise¤adas.
 
      5. Informaci¢n sobre Poblaci¢n.

       . Total poblacional (n£mero de personas)
       . Su distribuci¢n por  rea, sexo y edad.
       . Otras caracter¡sticas socio-econ¢micas, tasa de  crecimiento,
         migraci¢n, etc.
       . Naturaleza y tendencia de la poblaci¢n.  
     
      6. Informaci¢n sobre mano de obra.

       . N£mero de personas con alguna actividad econ¢mica.
       . N£mero  de  horas  que  trabajan  y  el  n£mero  promedio  de
         desocupados por horas hombre de trabajo.
       . Distribuci¢n  de la  fuerza  laboral  por  ramas de actividad
         econ¢mica.
       . Clasificaci¢n por los econ¢micamente activos.
       . Personas desempleadas para saber qu‚ tipo de trabajo buscan y
         durante  cu nto  tiempo  lo  buscan, qu‚ tipo de capacitaci¢n
         tienen.
     
      7. Informaci¢n sobre Agricultura.

       . Proporci¢n de tierra dedicada a la agricultura
       . Areas bajo diferentes cultivos.
       . Producci¢n de alimentos: cereales, frutales, etc.
       . N£mero de ganado y calidad.
       . N£mero de superficies de las propiedades agr¡colas y tipos de
         tendencia.

    II.  DETERMINACION DEL TAMA¥O DE LA MUESTRA

      Seguidamente se definir n  los conceptos  que se deben  tener en
      cuenta al momento  de determinar el tama¤o de la muestra y en la
      etapa del an lisis de los datos.

       . El tama¤o del error de la muestra que se desea.
       . El nivel de confianza, por ejemplo, el nivel de confianza del
         95%.

      Esta especificaci¢n  depender  de  la intercompensaci¢n entre el
      valor de la informaci¢n  m s exacta y el costo por el incremento
      en el tama¤o  de la muestra. Para un nivel de confianza dado, un
      error muestral m s  peque¤o tendr  un "costo" en  t‚rminos de un
      tama¤o de la muestra  m s grande. Similarmente, para un error de
      la muestra dado, un  nivel  de  confianza  m s  alto  tendr   un
      "costo" en  t‚rminos  de  un  tama¤o muestral m s  grande. Estas
      afirmaciones se volver n m s tangibles en el contexto de algunos
      ejemplos.
     
      Usando  la  f¢rmula  general  para la  estimaci¢n del  intervalo
      (recuerde que s y sx   son las mismas)

                                        zå
             xñ error muestral,   o  xñ ÄÄ
                                        ûn
                                  


             Sabemos que:

                                    zå
             Error de la muestra =  ÄÄ
                                    ûn          

      Dividiendo toda la  expresi¢n entre  el error  de la  muestra  y
      multiplicando por ûn


                        zå
             ûn=ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
                 (error muestral)
 

      Y elevando al  cuadrado ambos lados  de la ecuaci¢n, se  obtiene
      una expresi¢n para el tama¤o de la muestra

                        zýåý
              n=ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
                  (error muestral)


      Por consiguiente, si se conoce el nivel de confianza  requerido,
      y  por  consiguiente z, y si  tambi‚n se   conoce el error de la
      muestra  permitido, entonces  el  tama¤o de la muestra necesario
      queda especificado por la f¢rmula.

      Suponiendo que  existe la necesidad  de estar un 95% seguros  de
      que el  error muestral al  estimar la  media de la  poblaci¢n no
      exceda de 0.3. En  este caso, el error muestral = 0.3, y, puesto
      que el nivel de confianza es del 95%, Z = 2. 
                   
      Cambio del nivel de confianza. 

      Si  el nivel  de confianza  fuera  cambiado  del  95% al 90%, el
      tama¤o de la muestra  podr¡a ser reducido porque no se tiene que
      estar tan  seguros de  la estimaci¢n  resultante. El  t‚rmino  z
      ser¡a entonces de 5/3 y e l tama¤o de la muestra ser¡a.

                 (zå)ý               (5/3)ý(1.49)ý
         n= ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ = ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ = 65.5
               error muestral           (0.3)ý


      Forma de cambiar el error permitido. Si el error permitido fuera
      aumentado, el tama¤o  de la muestra  tambi‚n disminuir¡a, aun si
      se mantuviera  un nivel  de confianza del 95%. En el ejemplo, si
      el error permitido fuese  incrementado a 0.5, entonces el tama¤o
      de la muestra ser¡a.

                (zå)ý               4(1.49)ý
         n= ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ = ÄÄÄÄÄÄÄÄÄ = 35.5
             (error muestral)ý       (0.5)ý

      El tama¤o de la poblaci¢n. 

      Deber¡a  notarse que el  c lculo del  tama¤o  de  la muestra  es
      completamente independiente del tama¤o de la poblaci¢n. Una mala
      concepci¢n com£n  es que una "buena" muestra  deber¡a  tener  un
      porcentaje  relativamente  alto  con  respecto  a la  estructura
      muestral  incluida. En  realidad, el  tama¤o de la muestra  ser 
      determinado  de  la misma manera, independientemente  de  si  el
      tama¤o de la poblaci¢n es de 1000 ¢ de 1ï000,000.

    III. DETERMINACION DE LA DESVIACION ESTANDAR DE LA POBLACION.

      El  procedimiento  que  se  acaba  de  mostrar  supone   que  la
      desviaci¢n  est ndar  de  la poblaci¢n  es conocida. En la mayor
      parte de  las situaciones  pr cticas, no  es conocida y debe ser
      estimada usando uno de los varios enfoques disponibles.

      Un m‚todo es usar una desviaci¢n est ndar de la muestra obtenida
      de una  encuesta  anterior  comparable o de una encuesta piloto.
      Otro enfoque es estimar subjetivamente. Suponiendo  que la tarea
      es estimar el ingreso de una comunidad, podr¡a ser posible decir
      que el 95% de  las personas  tendr n un  ingreso entre $ 4,000 y
      $ 20,000. Suponiendo  tambi‚n  una  distribuci¢n  normal,  habr 
      cuatro desviaciones est ndar poblacionales entre las dos cifras,
      considerando  que  una  desviaci¢n  est ndar  poblacional  ser¡a
      igual a $ 4,000.

      Otro  enfoque es tomar  una situaci¢n del  tipo del "peor de los
      casos". En  el  ejemplo,  la  varianza  poblacional  m s  grande
      ocurrir¡a si la mitad de la poblaci¢n respondiera con un +2 y la
      otra mitad con un -2. La varianza de la poblaci¢n ser¡a entonces
      de 4,  y  el  tama¤o  de  la  muestra  recomendado, a  nivel  de
      confianza  del 95% y  a un error permitido de 0.3, ser¡a de 178.
      Note que  el  tama¤o  de la muestra  ser¡a  m s  grande  que  lo
      deseado, y por  lo tanto la exactitud deseada se ver¡a excedida.
      La l¢gica indica que es  admisible cometer errores  cuando se ha
      optado por ser demasiado exacto.

      Proporciones.

      Cuando se deben estimar  proporciones (la proporci¢n de personas
      con sentimientos negativos  acerca de un  cambio en la  hora  de
      inicio  de  los  conciertos  de la  sinfon¡a, por  ejemplo),  el
      procedimiento es usar una proporci¢n  de la muestra para estimar
      una proporci¢n de la poblaci¢n desconocida, p. Debido a que esta
      estimaci¢n  se   basa  en   una   muestra,  tiene  una  varianza
      poblacional, tal como sigue:


                             ã(1-ã)
                      åýp= ÄÄÄÄÄÄÄÄÄÄ
                               n

                             
       donde :

             ã   =    La proporci¢n de la poblaci¢n.
             p   =    La proporci¢n de la muestra                                     (correspondiente a X), usada para                               estimar la proporci¢n de la poblaci¢n                      
    desconocida.
                      (correspondiente a X), usada para
                      estimar la proporci¢n de la poblaci¢n
                      desconocida.
             åýp =    La varianza de la poblaci¢n de p.

      La f¢rmula para el tama¤o de la muestra es entonces

                        zýã(1-ã)
              n = ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
                    (error muestral)

      El peor de los casos, en donde la varianza de la poblaci¢n  est 
      en su m ximo, ocurre cuando la proporci¢n poblacional es igual a
      50:

 
                              ã(1-ã) = 0.25
                                  ã  = 0.50


      Debido a  que  la  proporci¢n  poblacional  es  desconocida,  un
      procedimiento com£n consiste en suponer el peor de los casos. La
      f¢rmula para el tama¤o de la muestra se simplifica entonces a:

                             zý(0.25)
                    n = ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
                         (error muestral)ý


      De este modo, si la proporci¢n de la poblaci¢n debe ser estimada
      dentro de un error, de 0.05 (0 5 puntos porcentuales) a nivel de
      confianza del 95%, el tama¤o necesario de la muestra es
                       
                       2ý(0.25)
                  n = ÄÄÄÄÄÄÄÄÄÄ = 400
                        (0.05)ý

      Puesto que z = 2, corresponde a un nivel de confianza del 95%, y
      el error muestral permitido es igual a 0.05.

      Preguntas varias.

      Generalmente, un incremento de  encuesta o un  experimento no se
      basar   s¢lo en una  pregunta. Algunas veces, cientos  de  ellas
      pueden estar involucradas. Normalmente  no valdr   la pena pasar
      por  todo  este  proceso  en  todas  las  preguntas. Un  enfoque
      razonable ser¡a tomar  unas cuantas preguntas representativas  y
      determinar al  tama¤o de la muestra  a partir de ellas. Deber¡an
      incluirse las m s cruciales con la varianza esperada m s alta.

      En general,

      Tama¤o de la muestra n=zýsý/(error muestral)
      donde

         z = 2 para un nivel de confianza del 95%.
         z = 5/3 para un nivel de confianza del 90%.
         s = La desviaci¢n est ndar de la poblaci¢n.
      y
      error muestral = el error de la muestra permitido.

      Para las proporciones

      Tama¤o de la muestra =n=zý(.25)/(error muestral)

    IV.  MUESTREO ESTRATIFICADO

      En  el  muestreo   estratificado,  la  poblaci¢n  se  divide  en
      subgrupos o estratos y se toma una muestra de cada uno de ellos.
      El muestreo estratificado vale la pena cuando uno o ambos de los
      siguientes aspectos son verdad:

      1. La desviaci¢n est ndar de la poblaci¢n difiere por estratos.
 
      2. El costo de la entrevista difiere por estratos.

         Suponga que se quiere estimar el consumo de electricidad para
         calentar  albercas,  la  poblaci¢n  de  las  albercas  podr¡a
         estratificarse en albercas comerciales  en hoteles y clubes y
         las  albercas  en casa  individuales. Esta £ltima puede tener
         una  variaci¢n  m s  peque¤a  y, por tanto, requerir¡a de una
         muestra  m s  peque¤a. Sin  embargo, si  los propietarios  de
         albercas de casas resultaran  menos costosos de  entrevistar,
         esto permitir¡a que m s n£mero de ellos fueran entrevistados,
         que  si  los  dos  grupos  involucraran  el  mismo  costo  de
         entrevista.

         ¨C¢mo  se determina la mejor  aplicaci¢n  del  presupuesto de
         muestreo  a  diversos  estratos? Este  problema  cl sico  del
         muestreo  fue  solucionado  en  1935  por  Jerzy  Neyman.  Su
         soluci¢n est  representada por la siguiente f¢rmula:

                                ãiåi/ûci
                         n = ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
                               äi(ãiåi/ûci)

         donde:
             n    =    El tama¤o total de la muestra.
             ãI   =    La proporci¢n de la poblaci¢n en el estrato i.                                     
             TI   =    La desviaci¢n est ndar de la poblaci¢n en el
                       en el estrato i.
             Ci   =    El costo de una entrevista en el estrato i.
             äi   =    La suma a lo largo de todos los estratos.                               
             Ni   =    El tama¤o de la muestra para el estrato i.                               
             N    =    El tama¤o total de la poblaci¢n
     
         La f¢rmula muestra c¢mo aplicar el tama¤o de la muestra a los
         diversos estratos; sin  embargo, ¨c¢mo se determina el tama¤o
         de la muestra en primer lugar? Un enfoque consiste en suponer
         que hay un  l¡mite de presupuesto. El tama¤o de la muestra es
         sencillamente  ajustado  hacia  arriba hasta  que alcanza  el
         l¡mite  presupuestal. El  presupuesto  deber¡a  ser calculado
         como:                                                         

                           Presupuesto = äcini


         El segundo  enfoque consiste  en determinar el error muestral
         y decidir si  es excesivo  o no. De  ser as¡, el tama¤o de la
         muestra se ir¡a incrementando. La  f¢rmula del error muestral
         es:

                       Error muestral = zåx
                                          

         Como se ilustr¢  en el  £ltimo  cap¡tulo, la estimaci¢n de la
         media  de la  poblaci¢n en  el  muestreo estratificado  es un
         promedio ponderado de las medias de la muestra encontradas en
         cada muestra de estrato:


         Estimaci¢n de la media de la poblaci¢n  

                             =äiãiXi

         donde
                 ÄÄ
                 Xi    =    La media de la muestra para el estrato i.


    V.   DISE¥O DE ETAPAS MULTIPLES

      Si se  usan  otros  dise¤os  muestrales, la  l¢gica  usada  para
      generar  el tama¤o  ¢ptimo de  la muestra a£n  se mantendr ; sin
      embargo, la f¢rmula puede complicarse. Por ejemplo, en un dise¤o
      por  reas el primer  paso podr¡a ser  seleccionar comunidades al
      azar. De este modo el procedimiento podr¡a ser escoger porciones
      de censos, luego manzanas, y finalmente familias. En tal dise¤o,
      la expresi¢n  para determinar el  error est ndar de  X se vuelve
      sumamente compleja. La soluci¢n consiste en repetir la totalidad
      del plan de  muestreo y obtener dos, tres  o cuatro estimaciones
      independientes  de X. Estas  diferentes estimaciones  pueden ser
      usadas para estimar el error est ndar de X.

    VI.  MUESTREO SECUENCIAL                                             

      El concepto de  muestreo secuencial es  £til porque recuerda  al
      investigador que la meta de la investigaci¢n de mercado consiste
      en proporcionar informaci¢n de ayuda para la toma de decisiones.
      La calidad de la informaci¢n debe ser evaluada en el contexto de
      la toma de decisiones. Con demasiada  frecuencia, la informaci¢n
      tiende a ser  evaluada en  forma  absoluta (es  intelectualmente
      c¢modo  tener "raz¢n"). En  lugar de ello, debe  ser juzgada con
      respecto a su uso.

    VII. COEFICIENTE DE CORRELACION INTRACLASE

      Suponiendo que se dispone de  N familias  cada uno de M miembros
      cada miembro es  observable con respecto a alguna caracter¡stica
      de inter‚s.

      El experimento aleatorio  consiste en  elegir una  familia luego
      tomar dos miembros de la familia. Sea la misma probabilidad para
      todo par  de miembros. Sean las  variables aleatorias U  Y W que
      toman  valores  asociados  al primer y  segundo miembro  del par
      elegido.

      Es claro que U Y W tienen  la misma distribuci¢n de probabilidad
      por lo que: E(U)=E(W) , V(U)=V(W)
      El Coeficiente de correlaci¢n de U Y W :
 
                               COV(U,W)
                     P(U,W) = ÄÄÄÄÄÄÄÄÄÄÄÄ
                                 V(U)

      esto  es  lo  que  se  llama  el  Coeficiente   de   correlaci¢n
      intraclase o intrafamilia

      RESUMEN

      En los p rrafos anteriores  se han introducido algunos conceptos
      £tiles y los  ha aplicado al problema de determinar el tama¤o de
      la muestra. Una caracter¡stica  poblacional, como la  actitud de
      los poseedores de boletos para la temporada de la sinfon¡a, debe
      ser estimada por  la muestra. Un estad¡stico  muestral, como  la
      actitud promedio de una muestra de poseedores de boletos para la
      temporada, se usa para estimar la caracter¡stica poblacional. El
      estad¡stico muestral tendr   una varianza (no ser  la misma cada
      vez que  se extraiga una muestra), y ‚sta  ser  una medida de su
      confiabilidad.  Esta  estimaci¢n,  basada  en   el   estad¡stico
      muestral, tiene  un  intervalo asociado  con ella que refleja su
      varianza y el nivel  de confianza del investigador. El tama¤o de
      la muestra queda determinado  por el nivel de confianza deseado,
      el  error  de la  estimaci¢n  permitido  y  la  varianza  de  la
      poblaci¢n, tal como se desprende de la siguiente f¢rmula:

                                (zå)ý
                      n> ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
                          (error muestral)ý          

      En el muestreo  estratificado, el tama¤o  de la muestra de  cada
      estrato depender  de la  varianza y del  costo de  la entrevista
      dentro de cada estrato.


       * Licenciada  en Estad¡stica. Directora  del Centro de Estudios
         Estad¡sticos.  Docente  Universitaria,  Universidad  Nacional
         Mayor de San Marcos.