Medidas de Dispersión

Las medidas de tendencia central no son suficientes para describir una distribución o conjunto de datos. Una buena descripción de una distribución requiere, además de un valor ‘promedio’ de las observaciones (es decir, una medida de tendencia central), alguna medida de la dispersión o variabilidad de los valores observados. Esta información es proporcionada por indicadores que se conocen como ‘medidas de dispersión’ (también ‘medidas de variabilidad’). Los más comunes, que constituyen el contenido de esta sección, son la desviación estándar y la varianza.

Para describir la forma real de una distribución, se debe tener, evidentemente, alguna medida de la dispersión o variabilidad de los datos; es decir, información acerca de cuán ‘dispersa’ es la distribución. Por ejemplo, para describir el perfil de una colina que usted está observando a través de la ventana, no será suficiente la altura de la colina, sino que también necesitará observar su forma, es decir, si es más bien plana o empinada, si es más bien simétrica o no, si tiene una o varias cumbres y dónde, etc. Desde este punto de vista, una distribución no es diferente a una colina.

La manera más fácil de explicar el concepto de dispersión o variabilidad es con un ejemplo. En la Figura 17 (arriba) se muestran dos distribuciones normales que representan las calificaciones de exámenes internacionales de matemática correspondientes a muestras representativas de estudiantes de octavo año de dos países ficticios: País A y País B. Dado que ambas distribuciones son normales, la media de las calificaciones de las pruebas de los estudiantes de ambos países es la misma (observe que también la mediana y la moda son las mismas). Pero, naturalmente, las distribuciones de las calificaciones de las pruebas son diferentes. La distribución es más ‘dispersa’ en el País A que en el País B. Esto nos entrega información valiosa. Nos indica que en el octavo año existen diferencias considerables en la distribución del aprendizaje matemático entre los Países A y B. Según los datos, y suponiendo que el examen efectivamente mide nivel de aprendizaje en forma adecuada, la distribución del aprendizaje de matemática es más ‘equitativo’ en el País A.

La figura 17-b (abajo) provee otro buen ejemplo de la importancia de las medidas de dispersión cuando queremos describir distribuciones. Observe que el ejemplo es difiere del anterior en que las medidas de tendencia central (media, mediana y moda) son ahora distintas en las dos distribuciones (curvas I y II) de la figura, y mayores en valor en todos los casos para la distribución II. La distribución I muestra una situación en la que la mayoría de los estudiantes de un país se concentran alrededor del valor X, cuando se la compara con la distribución II, donde la dispersión del nivel de conocimientos entre los estudiantes del país es mucho mayor.

Finalmente, observe que, en la Figura 17-b, el país I presenta una menor dispersión y por lo tanto un mayor grado de equidad relativa en la distribución del nivel de conocimientos. Pero, al mismo tiempo, en el país I al menos la mitad de los estudiantes tiene un nivel de conocimientos inferiores a X, mientras que en el país II la gran mayoría de los estudiantes (más del 80%) tienen un nivel de conocimientos superiores a X. En términos técnicos, esto significa que el grado de equidad absoluta de la distribución de conocimientos en el país II es superior a la del país I, si consideramos X como un estándar mínimo en el nivel de conocimientos deseado. Esta información es importante para la toma de decisiones de política educativa.

Como ya se mencionó, los descriptores o indicadores de dispersión o variabilidad más comunes son la desviación estándar y la varianza. A continuación explicaremos estos dos importantísimos indicadores, los cuales se usan en forma generalizada en investigación en ciencias sociales, incluida la investigación sobre educación.