|
ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ ³ CAPITULO II ³ ³ METODOLOGIA E INSTRUMENTOS DE MEDICION DE LA POBREZA ³ ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ 2.1 METODOLOGIA DE MEDICION DE LA POBREZA 2.1.1 ELEMENTOS DE MUESTREO Lic. F tima Medina Merino* El conocimiento de la realidad social, especialmente aquel basado en informaci¢n de tipo estad¡stico, requiere de cierta rigurosidad muestral, a fin que los datos que se obtengan, sea por censo o por encuesta, reflejen lo m s certeramente posible la realidad que se est estudiando. La informaci¢n as¡ obtenida, ser de gran utilidad al momento de dise¤ar y ejecutar planes y programas de acci¢n destinados a actuar sobre tal realidad. Es por ello importante, manejar con claridad los conceptos b sicos que subyacen al trabajo muestral y ser pues objetivo de la presente ponencia, hacer algunas precisiones al respecto. I. TIPOS DE DATOS A continuaci¢n se presenta un listado del tipo de informaci¢n que puede ser sujeta de muestreo en base a las variables que est n disponibles en el INEI. Cabe se¤alar que estas no son las £nicas ni tampoco son limitantes para la existencia de otras que expliquen la realidad. 1.Informaci¢n geogr fica y geol¢gica de las diferentes regiones del pa¡s. 2.Informaci¢n relacionada con el tiempo. . Datos sobre poblaci¢n, reas seg£n diferentes tipos de utilizaci¢n industrial, n£mero de m‚dicos, profesores, abogados, ingenieros y obreros. . Datos sobre Necesidades . Facilidades de consumo, situaciones de desempleo, analfabetismo, tasa de crecimiento que por otro lado son los que contribuyen a las necesidades que deben satisfacer. 3. Informaci¢n de las tendencias y relaciones entre las diferentes caracter¡sticas. 4. Datos que se obtienen en base a experimentos estad¡sticos controlados, bien dise¤adas. 5. Informaci¢n sobre Poblaci¢n. . Total poblacional (n£mero de personas) . Su distribuci¢n por rea, sexo y edad. . Otras caracter¡sticas socio-econ¢micas, tasa de crecimiento, migraci¢n, etc. . Naturaleza y tendencia de la poblaci¢n. 6. Informaci¢n sobre mano de obra. . N£mero de personas con alguna actividad econ¢mica. . N£mero de horas que trabajan y el n£mero promedio de desocupados por horas hombre de trabajo. . Distribuci¢n de la fuerza laboral por ramas de actividad econ¢mica. . Clasificaci¢n por los econ¢micamente activos. . Personas desempleadas para saber qu‚ tipo de trabajo buscan y durante cu nto tiempo lo buscan, qu‚ tipo de capacitaci¢n tienen. 7. Informaci¢n sobre Agricultura. . Proporci¢n de tierra dedicada a la agricultura . Areas bajo diferentes cultivos. . Producci¢n de alimentos: cereales, frutales, etc. . N£mero de ganado y calidad. . N£mero de superficies de las propiedades agr¡colas y tipos de tendencia. II. DETERMINACION DEL TAMA¥O DE LA MUESTRA Seguidamente se definir n los conceptos que se deben tener en cuenta al momento de determinar el tama¤o de la muestra y en la etapa del an lisis de los datos. . El tama¤o del error de la muestra que se desea. . El nivel de confianza, por ejemplo, el nivel de confianza del 95%. Esta especificaci¢n depender de la intercompensaci¢n entre el valor de la informaci¢n m s exacta y el costo por el incremento en el tama¤o de la muestra. Para un nivel de confianza dado, un error muestral m s peque¤o tendr un "costo" en t‚rminos de un tama¤o de la muestra m s grande. Similarmente, para un error de la muestra dado, un nivel de confianza m s alto tendr un "costo" en t‚rminos de un tama¤o muestral m s grande. Estas afirmaciones se volver n m s tangibles en el contexto de algunos ejemplos. Usando la f¢rmula general para la estimaci¢n del intervalo (recuerde que s y sx son las mismas) zå xñ error muestral, o xñ ÄÄ ûn Sabemos que: zå Error de la muestra = ÄÄ ûn Dividiendo toda la expresi¢n entre el error de la muestra y multiplicando por ûn zå ûn=ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ (error muestral) Y elevando al cuadrado ambos lados de la ecuaci¢n, se obtiene una expresi¢n para el tama¤o de la muestra zýåý n=ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ (error muestral) Por consiguiente, si se conoce el nivel de confianza requerido, y por consiguiente z, y si tambi‚n se conoce el error de la muestra permitido, entonces el tama¤o de la muestra necesario queda especificado por la f¢rmula. Suponiendo que existe la necesidad de estar un 95% seguros de que el error muestral al estimar la media de la poblaci¢n no exceda de 0.3. En este caso, el error muestral = 0.3, y, puesto que el nivel de confianza es del 95%, Z = 2. Cambio del nivel de confianza. Si el nivel de confianza fuera cambiado del 95% al 90%, el tama¤o de la muestra podr¡a ser reducido porque no se tiene que estar tan seguros de la estimaci¢n resultante. El t‚rmino z ser¡a entonces de 5/3 y e l tama¤o de la muestra ser¡a. (zå)ý (5/3)ý(1.49)ý n= ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ = ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ = 65.5 error muestral (0.3)ý Forma de cambiar el error permitido. Si el error permitido fuera aumentado, el tama¤o de la muestra tambi‚n disminuir¡a, aun si se mantuviera un nivel de confianza del 95%. En el ejemplo, si el error permitido fuese incrementado a 0.5, entonces el tama¤o de la muestra ser¡a. (zå)ý 4(1.49)ý n= ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ = ÄÄÄÄÄÄÄÄÄ = 35.5 (error muestral)ý (0.5)ý El tama¤o de la poblaci¢n. Deber¡a notarse que el c lculo del tama¤o de la muestra es completamente independiente del tama¤o de la poblaci¢n. Una mala concepci¢n com£n es que una "buena" muestra deber¡a tener un porcentaje relativamente alto con respecto a la estructura muestral incluida. En realidad, el tama¤o de la muestra ser determinado de la misma manera, independientemente de si el tama¤o de la poblaci¢n es de 1000 ¢ de 1ï000,000. III. DETERMINACION DE LA DESVIACION ESTANDAR DE LA POBLACION. El procedimiento que se acaba de mostrar supone que la desviaci¢n est ndar de la poblaci¢n es conocida. En la mayor parte de las situaciones pr cticas, no es conocida y debe ser estimada usando uno de los varios enfoques disponibles. Un m‚todo es usar una desviaci¢n est ndar de la muestra obtenida de una encuesta anterior comparable o de una encuesta piloto. Otro enfoque es estimar subjetivamente. Suponiendo que la tarea es estimar el ingreso de una comunidad, podr¡a ser posible decir que el 95% de las personas tendr n un ingreso entre $ 4,000 y $ 20,000. Suponiendo tambi‚n una distribuci¢n normal, habr cuatro desviaciones est ndar poblacionales entre las dos cifras, considerando que una desviaci¢n est ndar poblacional ser¡a igual a $ 4,000. Otro enfoque es tomar una situaci¢n del tipo del "peor de los casos". En el ejemplo, la varianza poblacional m s grande ocurrir¡a si la mitad de la poblaci¢n respondiera con un +2 y la otra mitad con un -2. La varianza de la poblaci¢n ser¡a entonces de 4, y el tama¤o de la muestra recomendado, a nivel de confianza del 95% y a un error permitido de 0.3, ser¡a de 178. Note que el tama¤o de la muestra ser¡a m s grande que lo deseado, y por lo tanto la exactitud deseada se ver¡a excedida. La l¢gica indica que es admisible cometer errores cuando se ha optado por ser demasiado exacto. Proporciones. Cuando se deben estimar proporciones (la proporci¢n de personas con sentimientos negativos acerca de un cambio en la hora de inicio de los conciertos de la sinfon¡a, por ejemplo), el procedimiento es usar una proporci¢n de la muestra para estimar una proporci¢n de la poblaci¢n desconocida, p. Debido a que esta estimaci¢n se basa en una muestra, tiene una varianza poblacional, tal como sigue: ã(1-ã) åýp= ÄÄÄÄÄÄÄÄÄÄ n donde : ã = La proporci¢n de la poblaci¢n. p = La proporci¢n de la muestra (correspondiente a X), usada para estimar la proporci¢n de la poblaci¢n desconocida. (correspondiente a X), usada para estimar la proporci¢n de la poblaci¢n desconocida. åýp = La varianza de la poblaci¢n de p. La f¢rmula para el tama¤o de la muestra es entonces zýã(1-ã) n = ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ (error muestral) El peor de los casos, en donde la varianza de la poblaci¢n est en su m ximo, ocurre cuando la proporci¢n poblacional es igual a 50: ã(1-ã) = 0.25 ã = 0.50 Debido a que la proporci¢n poblacional es desconocida, un procedimiento com£n consiste en suponer el peor de los casos. La f¢rmula para el tama¤o de la muestra se simplifica entonces a: zý(0.25) n = ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ (error muestral)ý De este modo, si la proporci¢n de la poblaci¢n debe ser estimada dentro de un error, de 0.05 (0 5 puntos porcentuales) a nivel de confianza del 95%, el tama¤o necesario de la muestra es 2ý(0.25) n = ÄÄÄÄÄÄÄÄÄÄ = 400 (0.05)ý Puesto que z = 2, corresponde a un nivel de confianza del 95%, y el error muestral permitido es igual a 0.05. Preguntas varias. Generalmente, un incremento de encuesta o un experimento no se basar s¢lo en una pregunta. Algunas veces, cientos de ellas pueden estar involucradas. Normalmente no valdr la pena pasar por todo este proceso en todas las preguntas. Un enfoque razonable ser¡a tomar unas cuantas preguntas representativas y determinar al tama¤o de la muestra a partir de ellas. Deber¡an incluirse las m s cruciales con la varianza esperada m s alta. En general, Tama¤o de la muestra n=zýsý/(error muestral) donde z = 2 para un nivel de confianza del 95%. z = 5/3 para un nivel de confianza del 90%. s = La desviaci¢n est ndar de la poblaci¢n. y error muestral = el error de la muestra permitido. Para las proporciones Tama¤o de la muestra =n=zý(.25)/(error muestral) IV. MUESTREO ESTRATIFICADO En el muestreo estratificado, la poblaci¢n se divide en subgrupos o estratos y se toma una muestra de cada uno de ellos. El muestreo estratificado vale la pena cuando uno o ambos de los siguientes aspectos son verdad: 1. La desviaci¢n est ndar de la poblaci¢n difiere por estratos. 2. El costo de la entrevista difiere por estratos. Suponga que se quiere estimar el consumo de electricidad para calentar albercas, la poblaci¢n de las albercas podr¡a estratificarse en albercas comerciales en hoteles y clubes y las albercas en casa individuales. Esta £ltima puede tener una variaci¢n m s peque¤a y, por tanto, requerir¡a de una muestra m s peque¤a. Sin embargo, si los propietarios de albercas de casas resultaran menos costosos de entrevistar, esto permitir¡a que m s n£mero de ellos fueran entrevistados, que si los dos grupos involucraran el mismo costo de entrevista. ¨C¢mo se determina la mejor aplicaci¢n del presupuesto de muestreo a diversos estratos? Este problema cl sico del muestreo fue solucionado en 1935 por Jerzy Neyman. Su soluci¢n est representada por la siguiente f¢rmula: ãiåi/ûci n = ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ äi(ãiåi/ûci) donde: n = El tama¤o total de la muestra. ãI = La proporci¢n de la poblaci¢n en el estrato i. TI = La desviaci¢n est ndar de la poblaci¢n en el en el estrato i. Ci = El costo de una entrevista en el estrato i. äi = La suma a lo largo de todos los estratos. Ni = El tama¤o de la muestra para el estrato i. N = El tama¤o total de la poblaci¢n La f¢rmula muestra c¢mo aplicar el tama¤o de la muestra a los diversos estratos; sin embargo, ¨c¢mo se determina el tama¤o de la muestra en primer lugar? Un enfoque consiste en suponer que hay un l¡mite de presupuesto. El tama¤o de la muestra es sencillamente ajustado hacia arriba hasta que alcanza el l¡mite presupuestal. El presupuesto deber¡a ser calculado como: Presupuesto = äcini El segundo enfoque consiste en determinar el error muestral y decidir si es excesivo o no. De ser as¡, el tama¤o de la muestra se ir¡a incrementando. La f¢rmula del error muestral es: Error muestral = zåx Como se ilustr¢ en el £ltimo cap¡tulo, la estimaci¢n de la media de la poblaci¢n en el muestreo estratificado es un promedio ponderado de las medias de la muestra encontradas en cada muestra de estrato: Estimaci¢n de la media de la poblaci¢n =äiãiXi donde ÄÄ Xi = La media de la muestra para el estrato i. V. DISE¥O DE ETAPAS MULTIPLES Si se usan otros dise¤os muestrales, la l¢gica usada para generar el tama¤o ¢ptimo de la muestra a£n se mantendr ; sin embargo, la f¢rmula puede complicarse. Por ejemplo, en un dise¤o por reas el primer paso podr¡a ser seleccionar comunidades al azar. De este modo el procedimiento podr¡a ser escoger porciones de censos, luego manzanas, y finalmente familias. En tal dise¤o, la expresi¢n para determinar el error est ndar de X se vuelve sumamente compleja. La soluci¢n consiste en repetir la totalidad del plan de muestreo y obtener dos, tres o cuatro estimaciones independientes de X. Estas diferentes estimaciones pueden ser usadas para estimar el error est ndar de X. VI. MUESTREO SECUENCIAL El concepto de muestreo secuencial es £til porque recuerda al investigador que la meta de la investigaci¢n de mercado consiste en proporcionar informaci¢n de ayuda para la toma de decisiones. La calidad de la informaci¢n debe ser evaluada en el contexto de la toma de decisiones. Con demasiada frecuencia, la informaci¢n tiende a ser evaluada en forma absoluta (es intelectualmente c¢modo tener "raz¢n"). En lugar de ello, debe ser juzgada con respecto a su uso. VII. COEFICIENTE DE CORRELACION INTRACLASE Suponiendo que se dispone de N familias cada uno de M miembros cada miembro es observable con respecto a alguna caracter¡stica de inter‚s. El experimento aleatorio consiste en elegir una familia luego tomar dos miembros de la familia. Sea la misma probabilidad para todo par de miembros. Sean las variables aleatorias U Y W que toman valores asociados al primer y segundo miembro del par elegido. Es claro que U Y W tienen la misma distribuci¢n de probabilidad por lo que: E(U)=E(W) , V(U)=V(W) El Coeficiente de correlaci¢n de U Y W : COV(U,W) P(U,W) = ÄÄÄÄÄÄÄÄÄÄÄÄ V(U) esto es lo que se llama el Coeficiente de correlaci¢n intraclase o intrafamilia RESUMEN En los p rrafos anteriores se han introducido algunos conceptos £tiles y los ha aplicado al problema de determinar el tama¤o de la muestra. Una caracter¡stica poblacional, como la actitud de los poseedores de boletos para la temporada de la sinfon¡a, debe ser estimada por la muestra. Un estad¡stico muestral, como la actitud promedio de una muestra de poseedores de boletos para la temporada, se usa para estimar la caracter¡stica poblacional. El estad¡stico muestral tendr una varianza (no ser la misma cada vez que se extraiga una muestra), y ‚sta ser una medida de su confiabilidad. Esta estimaci¢n, basada en el estad¡stico muestral, tiene un intervalo asociado con ella que refleja su varianza y el nivel de confianza del investigador. El tama¤o de la muestra queda determinado por el nivel de confianza deseado, el error de la estimaci¢n permitido y la varianza de la poblaci¢n, tal como se desprende de la siguiente f¢rmula: (zå)ý n> ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ (error muestral)ý En el muestreo estratificado, el tama¤o de la muestra de cada estrato depender de la varianza y del costo de la entrevista dentro de cada estrato. * Licenciada en Estad¡stica. Directora del Centro de Estudios Estad¡sticos. Docente Universitaria, Universidad Nacional Mayor de San Marcos. |