Variables discretas y continuas

La manera lógica de organizar datos es crear categorías y luego asignar las observaciones a una categoría. Pero nuestra capacidad de categorizar está limitada por la naturaleza de las variables que usamos. Además, no todas las variables se pueden categorizar con la misma facilidad. En términos estadísticos, las variables que interesa medir pueden ser (a) discretas o (b) continuas.

Las variables discretas son aquellas cuyas observaciones se agrupan ‘inherentemente’ o ‘naturalmente’ en categorías, porque dichas variable por su naturaleza sólo pueden tomar ciertos valores muy específicos. El “género” de un sujeto es un buen ejemplo de una variable discreta: los seres humanos pueden ser mujeres u hombres, se ajustan a una u otra categoría y no hay continuidad ni puntos intermedios entre ellas. Los países o regiones del mundo también son buenos ejemplos de variables discretas. Otro ejemplo son las calificaciones o educación de los maestros. Podemos crear las siguientes categorías para describir esta última variable: (a) educación primaria completa, (b) educación secundaria completa, (c) educación superior incompleta, (d) educación superior completa y (e) educación de postgrado.

Sin embargo, existe otra clase de variables, conocidas como variables “continuas”, que no son tan fáciles de categorizar como las variables discretas. A diferencia de las variables discretas, las variables continuas, como su nombre lo indica, sólo se pueden agrupar en forma arbitraria en categorías, porque por su naturaleza pueden tomar cualquier valor a lo largo de un continuo (o de una escala numérica continua). La estatura de los habitantes de un país es un ejemplo de variable continua, así como el ingreso de las familias en dicho país. Un buen ejemplo en el área de la educación son las “calificaciones de pruebas”, que sólo se pueden agrupar arbitrariamente creando ‘intervalos’ artificiales, como por ejemplo 1-20, 21-40, etc. Note que los intervalos también podrían ser 1-10, 11-20, 21-30, etc, o cualquier otro intervalo que se prefiera, ya que la variable no se ajusta naturalmente a categorías predeterminadas como en el caso de las variables discretas.

La distinción entre variables discretas y continuas es de gran aplicabilidad en la estadística. Pero su importancia sólo queda clara después de comprender el concepto estadístico fundamental de ‘distribución’ o ‘distribución de frecuencias’. (Los estadísticos por lo general usan la primera versión, la más corta, para referirse a la distribución de frecuencias.)