Google ClassroomGoogle Classroom
GeoGebraGeoGebra Classroom

Diagrama de caja y bigotes (I)

El diagrama de Caja-Bigotes (boxplots o box and whiskers) es una representación visual que describe varias características importantes al mismo tiempo, tales como la dispersión y simetría. Esto hace que se tenga una visión completa de los datos y la posibilidad de comparar varias variables Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los datos, sobre un rectángulo, alineado horizontal o verticalmente.
Image
Una gráfica de este tipo consiste en una caja rectangular, donde los lados más largos muestran el recorrido intercuartílico. Este rectángulo está marcado por un segmento vertical que indica donde se posiciona la mediana y por lo tanto su relación con los cuartiles primero y tercero. (recordemos que el segundo cuartil coincide con la mediana). Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y máximo de la variable. Las lineas que sobresalen de la caja se llaman bigotes. Estos bigotes tienen un límite de prolongación, de modo que cualquier dato o caso que no se encuentre dentro de este rango es marcado e identificado individualmente. Este límite puede ser 1,5 veces el RIC (Rango Inter Cuartílico) Nos permite tener en cuenta diferentes aspectos como:
  • Cuáles son los valores clave, tales como: el promedio, el percentil 25, mediana...
  • Si hay valores atípicos y cuáles son sus valores.
  • Si los datos son asimétricos.
  • Cómo se agrupan los datos.
  • Si los datos están sesgados y si es así, en qué dirección.
Image
En este applet puedes probar a introducir datos y comprobar como se diseña el diagrama para una variable. Puedes introducir hasta 100 valores

Sugerencias

- Prueba diferentes datos y observa lo cambios - Intenta que aparezaca un dato anómalo - Usa datos muy parecidos y después muy distintos, ¿Qué observas?

Mediana versus media

En este se ha añadido la media para que se pueda comparar y ver cuál es el más adecuado en cada caso.

Propuesta:

- ¿Cuándo la mediana y la media son parecidas? - ¿Qué tipo de datos o distribución tiene que darse para que sean diferentes? - ¿Cuándo es mejor una que otra y por qué?