miércoles, 24 de febrero de 2010

La Guerra de los 100 Años del Muestreo Probabilistico Parte II

"La enseñanza de métodos de muestreo para la agricultura:
El uso de métodos probabilísticos de muestreo
Queremos en primer lugar, para mayor claridad, especificar el tipo de encuestas agropecuarias a que nos referiremos. Tomaremos esta descripción de un resumen de nuestro libro publicado por la FAO titulado Multiple Frame Agricultural Surveys - Current Surveys Based on Area and List Sampling Methods, Vol. I (1996) –publicado en seis idiomas–. Se trata del diseño general de un Programa de Encuestas sobre la Estructura y Producción Agrícola, es decir, el diseño general de una encuesta agrícola periódica (anual o estacional), basada en métodos probabilísticos de muestro y estimación, cuyo propósito es obtener un gran número de datos básicos oportunos y fiables sobre el sector agrícola. Se supone que se requieren estimaciones para la mayoría de las siguientes variables: superficies agrícolas (preparadas, sembradas y cosechadas), rindes (previstos y obtenidos), producción agrícola, inventarios de ganado, reservas de cereales, sistemas de cultivo, costos de la producción, gastos en las explotaciones y características sociales y económicas de las explotaciones agrícolas.
Los métodos descritos de muestreo con múltiples marcos de selección combinan una muestra probabilística de áreas llamadas segmentos, seleccionadas a partir de un marco de áreas, con una breve lista complementaria de explotaciones agrícolas especiales que se enumeran totalmente durante la recolección de datos sobre el terreno.
Las estimaciones con múltiples marcos de muestreo combinan las estimaciones derivadas del muestreo de áreas con las estimaciones obtenidas de la lista de explotaciones agrícolas especiales.
El marco de áreas de la encuesta: El diseño de una muestra de áreas consiste en una muestra probabilística estratificada de segmentos, con un procedimiento de selección replicada. El marco de la muestra de áreas considera que el territorio se divide en varios estratos según el uso de la tierra, definidos por la proporción de tierra cultivada, el predominio de ciertos cultivos u otras características referentes
al uso de la tierra. Los estratos y los segmentos de la muestra deben tener límites físicos reconocibles y permanentes (caminos, sendas, ríos, etc.), que puedan ubicarse tanto sobre el terreno como en los materiales cartográficos utilizados para su identificación (imágenes de satélites, mosaicos de fotografías aéreas y mapas). Se utilizan muestras replicadas para evitar el cansancio de los informantes.
El marco de lista (de explotaciones agrícolas) complementario de la encuesta: La lista complementaria de explotaciones especiales asegura la inclusión de las explotaciones que contribuyen de manera significativa a la estimación de algunas variables importantes de la encuesta. Esta lista de explotaciones especiales puede consistir, por ejemplo, en las explotaciones con la mayor superficie total, las que
dedican mayor superficie a un cultivo determinado, las que tienen mayor número de cabezas de ganado y aves de corral, las de mayores ingresos, las de mayor número de trabajadores agrícolas, las correspondientes a una producción localizada y las que se concentran en tipos muy especializados de producción: estas categorías podrían no contar con una representación adecuada en la muestra de áreas de la encuesta, por lo tanto la precisión de las estimaciones respecto a ciertas variables podría resultar significativamente afectada. La adición de una breve lista de explotaciones agrícolas especiales a un diseño con marco de áreas presenta relativamente pocas dificultades técnicas. Procedimientos de recolección de datos de la encuesta: El componente de muestreo de áreas considerado requiere una recolección anual (o estacional) de datos sobre el terreno, realizada por encuestadores que completan un cuestionario para cada tramo incluido en cada segmento de la muestra. Un tramo es la parte de una explotación (o de tierras no agrícolas) incluidas en el segmento. Los encuestadores recogen los datos para cada tramo mediante entrevistas personales con el productor u otra persona responsable que pueda dar información sobre el tramo. La recolección de datos, junto a la cumplimentación de un cuestionario, requieren a menudo la identificación y medida de tierras agrícolas. Para cada segmento de la muestra, el encuestador usa una fotografía aérea ampliada (o una foto satelital o un mapa o plano a escala) en donde consten los límites del segmento. El encuestador comprueba los cultivos y otros usos del terreno en cada campo (un campo es un trozo de terreno en una parcela –una fracción de terreno totalmente rodeada por otra tierra, agua, caminos, bosques, etc., que no forman parte de la explotación – que está separado del resto de la parcela por límites fácilmente reconocibles, como senderos, vallados, etc., en el cual se cultiva una variedad específica de cultivo y tiene una fecha de siembra, o una combinación de cultivos), información que también le facilita el productor de la explotación. Estas superficies agrícolas dentificadas en cada segmento de la muestra pueden ser medidas más tarde en la oficina mediante un instrumento de medida operado con computadora.
Existen dos tipos básicos de diseños de muestreo en función de la unidad muestral de la última etapa y de las reglas para asignar sus probabilidades de selección, a saber: diseños de muestreo de áreas (donde las unidades finales de muestreo son segmentos, es decir áreas de terreno) y diseños de muestreo de lista (donde las unidades finales de selección son generalmente explotaciones agropecuarias), también llamados encuestas por muestreo con marco de áreas y encuestas por muestreo con marco de lista.

Las encuestas agrícolas con múltiples marcos son las encuestas por muestreo probabilístico que combinan más de un diseño de muestreo para obtener las estimaciones de la encuesta, combinando diseños con marcos de áreas con diseños con marcos de lista. Una encuesta agrícola con múltiples marcos incluye generalmente una muestra de áreas y muestras de listas.

Comparación entre diseños alternativos de encuestas agrícolas

La elección de un diseño estadístico apropiado para una encuesta sobre la estructura y producción agrícola requiere considerar comparativamente las ventajas, las desventajas y los requisitos de los diseños de encuesta con múltiples marcos, los diseños con marco de áreas y los diseños con marco de lista.
Diseños con múltiples marcos frente a diseños con marco de lista únicamente
A continuación se indican algunas de las ventajas, desventajas y requisitos de estos diseños con múltiples marcos para los programas de encuestas sobre la estructura y producción agrícola en comparación con los diseños basados en un marco de lista:

Ventajas:

• Errores de cobertura relacionados con la cobertura completa. El marco de áreas da una cobertura completa de la población de unidades de información (explotaciones o tramos). Por consiguiente, las estimaciones probabilísticas basadas en la muestra de áreas no están sesgadas por errores de cobertura. Esto no puede lograrse con una encuesta por muestreo de lista ya que, en la práctica, no puede establecerse una lista completa de explotaciones, válida en
las fechas del período de recolección de datos.

• Errores de cobertura relacionados con el uso repetido del marco. Si ha de realizarse una encuesta agrícola anual o estacional, conviene saber que un marco de áreas es generalmente mucho más duradero que un marco formado por una lista de las explotaciones. Los cambios en el aprovechamiento de la tierra o en el número y situación de las explotaciones pueden reducir la precisión de las estimaciones basadas en la muestra de áreas, pero no introducen sesgos.

• Precisión de las estimaciones. Un diseño de muestra de áreas, conduce a estimaciones más precisas de las superficies agrícolas (variable clave estudiada en todas las encuestas agrícolas) que una muestra de lista. En efecto, por definición, en el muestreo de áreas las probabilidades de selección y los factores de expansión de la muestra son proporcionales a las superficies agrícolas.

• Errores no muestrales y medición objetiva de superficies. El diseño de muestreo de áreas permite utilizar un procedimiento más adecuado y exacto para las mediciones objetivas de superficies agrícolas, lo que es una ventaja importante para llegar a estimaciones exactas de superficie. En los diseños de muestreo de lista, la medición de superficies suele hacerse únicamente en una submuestra
de explotaciones durante la compilación de datos. Este procedimiento es en general lento y de aplicación engorrosa, y no es práctico cuando se trata de explotaciones formadas por parcelas muy separadas unas de otras.

• Base para encuestas sobre el rendimiento de cultivos con mediciones
de cortes. En los países en desarrollo, los productores son a menudo incapaces de facilitar estimaciones fiables de las cosechas y de la producción, y existe el problema de las unidades locales de medida que con frecuencia varían de una aldea a otra o incluso de un productor a otro.

• Tamaño de la muestra. Al comparar el tamaño de la muestra de un diseño con múltiples marcos con un diseño con marco de lista puede ser necesaria una muestra de lista más grande, a causa de las varianzas entre conglomerados y dentro de conglomerados. Las probabilidades de selección de las Unidades Primarias de Muestreo (UPM) y de las etapas iniciales del diseño de muestreo de lista a menudo no pueden establecerse debidamente para que el diseño
de muestreo sea eficiente.


• Cambios en el sistema de explotaciones. La construcción del marco de áreas es independiente de las explotaciones agrícolas. Por ello, el muestreo de áreas es una solución adecuada para, por ejemplo, los países o regiones donde el sistema de explotaciones y otra infraestructura agrícola han sufrido cambios profundos y estarán en situación inestable todavía durante bastante tiempo, y para los cuales el conocimiento de la producción agrícola es más importante que obtener resultados por categorías de explotaciones (por ejemplo, los países de Europa central y oriental).

• Costos de la recolección de datos. Las encuestas por muestreo de áreas son rentables considerando el costo por explotación, ya que cada segmento contiene un grupo o conglomerado de tramos (unidades de información). Si las unidades de una muestra de lista no 10 son conglomerados de explotaciones, las explotaciones que han de ser enumeradas por un encuestador podrían estar separadas por una distancia considerable, con el consiguiente aumento de los
costos de la encuesta.

Desventajas y requisitos

• Requisitos cartográficos. La construcción de un marco de áreas requiere un material cartográfico sobre el cual podrá procederse a una identificación y medición exacta de las áreas. Tal variedad de materiales e instrumentos cartográficos no se requiere para las encuestas con marco de lista.

• Falta de límites físicos permanentes. Para un diseño de muestreo de áreas con segmentos dotados de límites físicos reconocibles o con segmentos cuadrados o rectangulares, la falta de límites permanentes en los mapas, imágenes de satélites y fotografías aéreas constituye un problema grave. En zonas tropicales como África occidental, por ejemplo, a causa de las condiciones climáticas y de los
sistemas de agricultura migratoria, los límites cambian con frecuencia o quedan cubiertos por la maleza y no son visibles en los materiales cartográficos.

• Proximidad a la explotación del productor o del informante. Puede no ser viable ni incluso posible utilizar una muestra de áreas en algunos países por lo escabroso del terreno, la falta de fondos o a causa de ciertos hábitos sociales de la población rural. En varios países, o amplias regiones de países, los productores viven en aldeas, a menudo a cierta distancia de su explotación. En este caso,
una encuesta basada en una muestra de áreas es difícil de realizar. Si se usa un diseño de muestreo de áreas, se puede modificar la estratificación para respetar las aldeas, y de tal manera que el área del segmento no se tenga en cuenta salvo para definir a los productores que residan dentro del segmento (procedimiento de
estimación de segmento abierto).

• Costos de selección de la muestra. Al principio del programa de encuestas, los costos son más elevados para la selección de una muestra de segmentos con límites físicos reconocibles que para una muestra de lista. Sin embargo, dado que para un programa periódico de encuestas sobre la estructura y producción agrícola es preciso actualizar frecuentemente el marco de lista de las explotaciones, con objeto de controlar una cobertura adecuada y obtener
estimaciones fiables, resulta fácil justificar los recursos necesarios para una muestra de áreas alternativa.

• Personal técnico. La ejecución de un programa de encuestas agrícolas
sustentable basado en métodos de muestreo de áreas requiere un personal de oficina altamente calificado que esté dispuesto a soportar el tedio y a poner en los detalles la atención exacta indispensable para la construcción y el mantenimiento del marco de áreas. Se precisan estadísticos muy capacitados para el análisis de
datos, para la interpretación de los resultados y los correspondientes ajustes necesarios y para el perfeccionamiento de los procedimientos de la encuesta. El marco y la muestra no serán más duraderos que el personal. Cuando es posible construir un marco de lista exacto (un marco de lista es a menudo incompleto, o sesgado o envejecido), la ventaja de un diseño con marco de lista sobre un diseño con marco de áreas se debe en general a sencillez de ejecución y a que los métodos de estimación son más sencillos, ya que suele existir una correspondencia uno-a-uno entre las unidades de muestreo y las unidades de información.
En general, en la mayoría de los países ricos, desarrollados, se han hecho grandes esfuerzos para introducir métodos probabilísticos de muestreo. En los Estados Unidos, por ejemplo, el país pionero en este campo, ya en los años 60 se introdujeron masivamente los métodos probabilísticos de muestreo (en sustitución de los procedimientos no probabilísticos) para las estadísticas básicas de manera de ofrecer datos más confiables en su programa de estimaciones agropecuarias
nacionales."

No hay comentarios:

Publicar un comentario