Inferencia

Utilizamos una muestra (o múltiples muestras) para recopilar datos cuando resulta relativamente efectivo desde un punto de vista económico o cuando no es posible acceder a toda la población. En este caso, las características de la población se infieren sobre la base de los datos obtenidos en la muestra. En otras palabras, lo que aprendemos sobre la base de la muestra se usa como medio para describir la población.

Para los reformadores de la educación, la inferencia es un área fundamental de la disciplina de la estadística, ya que, como se decía antes, normalmente los profesionales favorecen el uso del muestreo antes que del censo para describir y analizar realidades sociales complejas. De hecho, buena parte de la información sobre educación que usted utiliza como autoridad responsable se obtiene mediante la técnica del muestreo, incluyendo prácticamente la totalidad de la investigación sobre educación llevada a cabo por una variedad de científicos sociales, incluidos sociólogos, economistas, politólogos, educadores, psicólogos, etc.

El mayor desafío del muestreo consiste en lograr un grado razonable de “confianza” (o probabilidad) en que las inferencias realizadas acerca de la población sobre la base de la muestra sean adecuadas. Para tener “confianza” en que una inferencia realizada sobre la base de una muestra representa adecuadamente a la población, la muestra se debe seleccionar y luego interpretar siguiendo determinados procedimientos estadísticos estrictos que aseguren un grado de mínimo de certeza. En otras palabras, se deben recopilar y analizar los datos de la muestra utilizando métodos que permitan inferir con precisión (o con una probabilidad mínima de error) las características de la población sobre la base de esa muestra.

La precisión de la inferencia depende, entre otros factores, del tamaño de la muestra. Esta relación, sin embargo, no es obvia, es decir, la mejor muestra no es la que contiene un mayor número de observaciones. A medida que la muestra aumenta de tamaño, el costo de recopilar y analizar la información también aumenta. Hasta cierto punto, podríamos ganar en precisión, pero pagar demasiado caro por ella. Además, después de determinado punto, el costo de cada observación se eleva vertiginosamente con respecto a lo que se gana en precisión, que se vuelve poco o nada. Lo que hacen los estadísticos es determinar el ‘grado de precisión’ que desean para obtener para sus inferencias (esto es, determinar la probabilidad de error que están dispuestos a tolerar) y luego emplear procedimientos técnicos para calcular el tamaño de la muestra que necesitan para lograr dicho objetivo. Se puede lograr un grado de precisión razonablemente alto mediante muestras relativamente pequeñas. Consideremos, por ejemplo, que el tamaño de las encuestas de opinión de Estados Unidos utilizadas para predecir el resultado de las elecciones presidenciales nacionales con una exactitud razonable es de poco más de 1.000 observaciones, para una población en edad de votar cercana a los 200 millones de personas!

Es importante mantener una permanente actitud de escepticismo frente a la información estadística recibida. Como consumidor de información estadística, usted al menos necesita estar al tanto de la importancia que el método de selección de una muestra tiene sobre el valor de la información. Es necesario preguntarse, a lo menos, si dicha información fue producida sobre la base de una muestra adecuada (normalmente se tratará de una ‘muestra aleatoria,’ es decir, una muestra en la cual todos los objetos de una población tienen una idéntica probabilidad de ser seleccionados como parte de la muestra) que es de hecho representativa de la población de interés.

Por ejemplo, en 1936, en los Estados Unidos, una publicación de amplia circulación predijo que el demócrata Franklin Delano Roosevelt sería derrotado en la elección presidencial por su oponente republicano. Roosevelt ganó la elección por un amplísimo margen. El error en la predicción de la publicación fue resultado del simple hecho de que la encuesta de opinión se había llevado a cabo por teléfono. En aquellos tiempos, sólo las personas de dinero poseían un teléfono en sus hogares, por lo que la muestra no era representativa del conjunto de los electores y en cambio estaba “sesgada” a favor del candidato republicano.

Por razones de tiempo y espacio, a pesar de la enorme influencia que los métodos de inferencia y muestreo utilizados tienen sobre el valor de la información obtenida, estos temas no son tratados con suficiente profundidad en esta guía. Para aquellos que tengan un interés en estudiar en mayor detalle estos importantes temas, Phillips (1996, capítulos 7 y 8) provee una muy accesible introducción a la inferencia estadística.