|
ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿
³ CAPITULO II ³
³ METODOLOGIA E INSTRUMENTOS DE MEDICION DE LA POBREZA ³
ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ
2.1 METODOLOGIA DE MEDICION DE LA POBREZA
2.1.1 ELEMENTOS DE MUESTREO
Lic. F tima Medina Merino*
El conocimiento de la realidad social, especialmente aquel basado
en informaci¢n de tipo estad¡stico, requiere de cierta rigurosidad
muestral, a fin que los datos que se obtengan, sea por censo o por
encuesta, reflejen lo m s certeramente posible la realidad que se
est estudiando. La informaci¢n as¡ obtenida, ser de gran
utilidad al momento de dise¤ar y ejecutar planes y programas de
acci¢n destinados a actuar sobre tal realidad. Es por ello
importante, manejar con claridad los conceptos b sicos que
subyacen al trabajo muestral y ser pues objetivo de la presente
ponencia, hacer algunas precisiones al respecto.
I. TIPOS DE DATOS
A continuaci¢n se presenta un listado del tipo de informaci¢n
que puede ser sujeta de muestreo en base a las variables que
est n disponibles en el INEI. Cabe se¤alar que estas no son las
£nicas ni tampoco son limitantes para la existencia de otras
que expliquen la realidad.
1.Informaci¢n geogr fica y geol¢gica de las diferentes regiones
del pa¡s.
2.Informaci¢n relacionada con el tiempo.
. Datos sobre poblaci¢n, reas seg£n diferentes tipos de
utilizaci¢n industrial, n£mero de m‚dicos, profesores,
abogados, ingenieros y obreros.
. Datos sobre Necesidades
. Facilidades de consumo, situaciones de desempleo,
analfabetismo, tasa de crecimiento que por otro lado son los
que contribuyen a las necesidades que deben satisfacer.
3. Informaci¢n de las tendencias y relaciones entre las
diferentes caracter¡sticas.
4. Datos que se obtienen en base a experimentos estad¡sticos
controlados, bien dise¤adas.
5. Informaci¢n sobre Poblaci¢n.
. Total poblacional (n£mero de personas)
. Su distribuci¢n por rea, sexo y edad.
. Otras caracter¡sticas socio-econ¢micas, tasa de crecimiento,
migraci¢n, etc.
. Naturaleza y tendencia de la poblaci¢n.
6. Informaci¢n sobre mano de obra.
. N£mero de personas con alguna actividad econ¢mica.
. N£mero de horas que trabajan y el n£mero promedio de
desocupados por horas hombre de trabajo.
. Distribuci¢n de la fuerza laboral por ramas de actividad
econ¢mica.
. Clasificaci¢n por los econ¢micamente activos.
. Personas desempleadas para saber qu‚ tipo de trabajo buscan y
durante cu nto tiempo lo buscan, qu‚ tipo de capacitaci¢n
tienen.
7. Informaci¢n sobre Agricultura.
. Proporci¢n de tierra dedicada a la agricultura
. Areas bajo diferentes cultivos.
. Producci¢n de alimentos: cereales, frutales, etc.
. N£mero de ganado y calidad.
. N£mero de superficies de las propiedades agr¡colas y tipos de
tendencia.
II. DETERMINACION DEL TAMA¥O DE LA MUESTRA
Seguidamente se definir n los conceptos que se deben tener en
cuenta al momento de determinar el tama¤o de la muestra y en la
etapa del an lisis de los datos.
. El tama¤o del error de la muestra que se desea.
. El nivel de confianza, por ejemplo, el nivel de confianza del
95%.
Esta especificaci¢n depender de la intercompensaci¢n entre el
valor de la informaci¢n m s exacta y el costo por el incremento
en el tama¤o de la muestra. Para un nivel de confianza dado, un
error muestral m s peque¤o tendr un "costo" en t‚rminos de un
tama¤o de la muestra m s grande. Similarmente, para un error de
la muestra dado, un nivel de confianza m s alto tendr un
"costo" en t‚rminos de un tama¤o muestral m s grande. Estas
afirmaciones se volver n m s tangibles en el contexto de algunos
ejemplos.
Usando la f¢rmula general para la estimaci¢n del intervalo
(recuerde que s y sx son las mismas)
zå
xñ error muestral, o xñ ÄÄ
ûn
Sabemos que:
zå
Error de la muestra = ÄÄ
ûn
Dividiendo toda la expresi¢n entre el error de la muestra y
multiplicando por ûn
zå
ûn=ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
(error muestral)
Y elevando al cuadrado ambos lados de la ecuaci¢n, se obtiene
una expresi¢n para el tama¤o de la muestra
zýåý
n=ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
(error muestral)
Por consiguiente, si se conoce el nivel de confianza requerido,
y por consiguiente z, y si tambi‚n se conoce el error de la
muestra permitido, entonces el tama¤o de la muestra necesario
queda especificado por la f¢rmula.
Suponiendo que existe la necesidad de estar un 95% seguros de
que el error muestral al estimar la media de la poblaci¢n no
exceda de 0.3. En este caso, el error muestral = 0.3, y, puesto
que el nivel de confianza es del 95%, Z = 2.
Cambio del nivel de confianza.
Si el nivel de confianza fuera cambiado del 95% al 90%, el
tama¤o de la muestra podr¡a ser reducido porque no se tiene que
estar tan seguros de la estimaci¢n resultante. El t‚rmino z
ser¡a entonces de 5/3 y e l tama¤o de la muestra ser¡a.
(zå)ý (5/3)ý(1.49)ý
n= ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ = ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ = 65.5
error muestral (0.3)ý
Forma de cambiar el error permitido. Si el error permitido fuera
aumentado, el tama¤o de la muestra tambi‚n disminuir¡a, aun si
se mantuviera un nivel de confianza del 95%. En el ejemplo, si
el error permitido fuese incrementado a 0.5, entonces el tama¤o
de la muestra ser¡a.
(zå)ý 4(1.49)ý
n= ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ = ÄÄÄÄÄÄÄÄÄ = 35.5
(error muestral)ý (0.5)ý
El tama¤o de la poblaci¢n.
Deber¡a notarse que el c lculo del tama¤o de la muestra es
completamente independiente del tama¤o de la poblaci¢n. Una mala
concepci¢n com£n es que una "buena" muestra deber¡a tener un
porcentaje relativamente alto con respecto a la estructura
muestral incluida. En realidad, el tama¤o de la muestra ser
determinado de la misma manera, independientemente de si el
tama¤o de la poblaci¢n es de 1000 ¢ de 1ï000,000.
III. DETERMINACION DE LA DESVIACION ESTANDAR DE LA POBLACION.
El procedimiento que se acaba de mostrar supone que la
desviaci¢n est ndar de la poblaci¢n es conocida. En la mayor
parte de las situaciones pr cticas, no es conocida y debe ser
estimada usando uno de los varios enfoques disponibles.
Un m‚todo es usar una desviaci¢n est ndar de la muestra obtenida
de una encuesta anterior comparable o de una encuesta piloto.
Otro enfoque es estimar subjetivamente. Suponiendo que la tarea
es estimar el ingreso de una comunidad, podr¡a ser posible decir
que el 95% de las personas tendr n un ingreso entre $ 4,000 y
$ 20,000. Suponiendo tambi‚n una distribuci¢n normal, habr
cuatro desviaciones est ndar poblacionales entre las dos cifras,
considerando que una desviaci¢n est ndar poblacional ser¡a
igual a $ 4,000.
Otro enfoque es tomar una situaci¢n del tipo del "peor de los
casos". En el ejemplo, la varianza poblacional m s grande
ocurrir¡a si la mitad de la poblaci¢n respondiera con un +2 y la
otra mitad con un -2. La varianza de la poblaci¢n ser¡a entonces
de 4, y el tama¤o de la muestra recomendado, a nivel de
confianza del 95% y a un error permitido de 0.3, ser¡a de 178.
Note que el tama¤o de la muestra ser¡a m s grande que lo
deseado, y por lo tanto la exactitud deseada se ver¡a excedida.
La l¢gica indica que es admisible cometer errores cuando se ha
optado por ser demasiado exacto.
Proporciones.
Cuando se deben estimar proporciones (la proporci¢n de personas
con sentimientos negativos acerca de un cambio en la hora de
inicio de los conciertos de la sinfon¡a, por ejemplo), el
procedimiento es usar una proporci¢n de la muestra para estimar
una proporci¢n de la poblaci¢n desconocida, p. Debido a que esta
estimaci¢n se basa en una muestra, tiene una varianza
poblacional, tal como sigue:
ã(1-ã)
åýp= ÄÄÄÄÄÄÄÄÄÄ
n
donde :
ã = La proporci¢n de la poblaci¢n.
p = La proporci¢n de la muestra (correspondiente a X), usada para estimar la proporci¢n de la poblaci¢n
desconocida.
(correspondiente a X), usada para
estimar la proporci¢n de la poblaci¢n
desconocida.
åýp = La varianza de la poblaci¢n de p.
La f¢rmula para el tama¤o de la muestra es entonces
zýã(1-ã)
n = ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
(error muestral)
El peor de los casos, en donde la varianza de la poblaci¢n est
en su m ximo, ocurre cuando la proporci¢n poblacional es igual a
50:
ã(1-ã) = 0.25
ã = 0.50
Debido a que la proporci¢n poblacional es desconocida, un
procedimiento com£n consiste en suponer el peor de los casos. La
f¢rmula para el tama¤o de la muestra se simplifica entonces a:
zý(0.25)
n = ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
(error muestral)ý
De este modo, si la proporci¢n de la poblaci¢n debe ser estimada
dentro de un error, de 0.05 (0 5 puntos porcentuales) a nivel de
confianza del 95%, el tama¤o necesario de la muestra es
2ý(0.25)
n = ÄÄÄÄÄÄÄÄÄÄ = 400
(0.05)ý
Puesto que z = 2, corresponde a un nivel de confianza del 95%, y
el error muestral permitido es igual a 0.05.
Preguntas varias.
Generalmente, un incremento de encuesta o un experimento no se
basar s¢lo en una pregunta. Algunas veces, cientos de ellas
pueden estar involucradas. Normalmente no valdr la pena pasar
por todo este proceso en todas las preguntas. Un enfoque
razonable ser¡a tomar unas cuantas preguntas representativas y
determinar al tama¤o de la muestra a partir de ellas. Deber¡an
incluirse las m s cruciales con la varianza esperada m s alta.
En general,
Tama¤o de la muestra n=zýsý/(error muestral)
donde
z = 2 para un nivel de confianza del 95%.
z = 5/3 para un nivel de confianza del 90%.
s = La desviaci¢n est ndar de la poblaci¢n.
y
error muestral = el error de la muestra permitido.
Para las proporciones
Tama¤o de la muestra =n=zý(.25)/(error muestral)
IV. MUESTREO ESTRATIFICADO
En el muestreo estratificado, la poblaci¢n se divide en
subgrupos o estratos y se toma una muestra de cada uno de ellos.
El muestreo estratificado vale la pena cuando uno o ambos de los
siguientes aspectos son verdad:
1. La desviaci¢n est ndar de la poblaci¢n difiere por estratos.
2. El costo de la entrevista difiere por estratos.
Suponga que se quiere estimar el consumo de electricidad para
calentar albercas, la poblaci¢n de las albercas podr¡a
estratificarse en albercas comerciales en hoteles y clubes y
las albercas en casa individuales. Esta £ltima puede tener
una variaci¢n m s peque¤a y, por tanto, requerir¡a de una
muestra m s peque¤a. Sin embargo, si los propietarios de
albercas de casas resultaran menos costosos de entrevistar,
esto permitir¡a que m s n£mero de ellos fueran entrevistados,
que si los dos grupos involucraran el mismo costo de
entrevista.
¨C¢mo se determina la mejor aplicaci¢n del presupuesto de
muestreo a diversos estratos? Este problema cl sico del
muestreo fue solucionado en 1935 por Jerzy Neyman. Su
soluci¢n est representada por la siguiente f¢rmula:
ãiåi/ûci
n = ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
äi(ãiåi/ûci)
donde:
n = El tama¤o total de la muestra.
ãI = La proporci¢n de la poblaci¢n en el estrato i.
TI = La desviaci¢n est ndar de la poblaci¢n en el
en el estrato i.
Ci = El costo de una entrevista en el estrato i.
äi = La suma a lo largo de todos los estratos.
Ni = El tama¤o de la muestra para el estrato i.
N = El tama¤o total de la poblaci¢n
La f¢rmula muestra c¢mo aplicar el tama¤o de la muestra a los
diversos estratos; sin embargo, ¨c¢mo se determina el tama¤o
de la muestra en primer lugar? Un enfoque consiste en suponer
que hay un l¡mite de presupuesto. El tama¤o de la muestra es
sencillamente ajustado hacia arriba hasta que alcanza el
l¡mite presupuestal. El presupuesto deber¡a ser calculado
como:
Presupuesto = äcini
El segundo enfoque consiste en determinar el error muestral
y decidir si es excesivo o no. De ser as¡, el tama¤o de la
muestra se ir¡a incrementando. La f¢rmula del error muestral
es:
Error muestral = zåx
Como se ilustr¢ en el £ltimo cap¡tulo, la estimaci¢n de la
media de la poblaci¢n en el muestreo estratificado es un
promedio ponderado de las medias de la muestra encontradas en
cada muestra de estrato:
Estimaci¢n de la media de la poblaci¢n
=äiãiXi
donde
ÄÄ
Xi = La media de la muestra para el estrato i.
V. DISE¥O DE ETAPAS MULTIPLES
Si se usan otros dise¤os muestrales, la l¢gica usada para
generar el tama¤o ¢ptimo de la muestra a£n se mantendr ; sin
embargo, la f¢rmula puede complicarse. Por ejemplo, en un dise¤o
por reas el primer paso podr¡a ser seleccionar comunidades al
azar. De este modo el procedimiento podr¡a ser escoger porciones
de censos, luego manzanas, y finalmente familias. En tal dise¤o,
la expresi¢n para determinar el error est ndar de X se vuelve
sumamente compleja. La soluci¢n consiste en repetir la totalidad
del plan de muestreo y obtener dos, tres o cuatro estimaciones
independientes de X. Estas diferentes estimaciones pueden ser
usadas para estimar el error est ndar de X.
VI. MUESTREO SECUENCIAL
El concepto de muestreo secuencial es £til porque recuerda al
investigador que la meta de la investigaci¢n de mercado consiste
en proporcionar informaci¢n de ayuda para la toma de decisiones.
La calidad de la informaci¢n debe ser evaluada en el contexto de
la toma de decisiones. Con demasiada frecuencia, la informaci¢n
tiende a ser evaluada en forma absoluta (es intelectualmente
c¢modo tener "raz¢n"). En lugar de ello, debe ser juzgada con
respecto a su uso.
VII. COEFICIENTE DE CORRELACION INTRACLASE
Suponiendo que se dispone de N familias cada uno de M miembros
cada miembro es observable con respecto a alguna caracter¡stica
de inter‚s.
El experimento aleatorio consiste en elegir una familia luego
tomar dos miembros de la familia. Sea la misma probabilidad para
todo par de miembros. Sean las variables aleatorias U Y W que
toman valores asociados al primer y segundo miembro del par
elegido.
Es claro que U Y W tienen la misma distribuci¢n de probabilidad
por lo que: E(U)=E(W) , V(U)=V(W)
El Coeficiente de correlaci¢n de U Y W :
COV(U,W)
P(U,W) = ÄÄÄÄÄÄÄÄÄÄÄÄ
V(U)
esto es lo que se llama el Coeficiente de correlaci¢n
intraclase o intrafamilia
RESUMEN
En los p rrafos anteriores se han introducido algunos conceptos
£tiles y los ha aplicado al problema de determinar el tama¤o de
la muestra. Una caracter¡stica poblacional, como la actitud de
los poseedores de boletos para la temporada de la sinfon¡a, debe
ser estimada por la muestra. Un estad¡stico muestral, como la
actitud promedio de una muestra de poseedores de boletos para la
temporada, se usa para estimar la caracter¡stica poblacional. El
estad¡stico muestral tendr una varianza (no ser la misma cada
vez que se extraiga una muestra), y ‚sta ser una medida de su
confiabilidad. Esta estimaci¢n, basada en el estad¡stico
muestral, tiene un intervalo asociado con ella que refleja su
varianza y el nivel de confianza del investigador. El tama¤o de
la muestra queda determinado por el nivel de confianza deseado,
el error de la estimaci¢n permitido y la varianza de la
poblaci¢n, tal como se desprende de la siguiente f¢rmula:
(zå)ý
n> ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
(error muestral)ý
En el muestreo estratificado, el tama¤o de la muestra de cada
estrato depender de la varianza y del costo de la entrevista
dentro de cada estrato.
* Licenciada en Estad¡stica. Directora del Centro de Estudios
Estad¡sticos. Docente Universitaria, Universidad Nacional
Mayor de San Marcos.
|