Tabla de Contenidos
ToggleLa joya oculta de Matplotlib: Gráficos de burbujas empacadas en Python
Un mundo visual lleno de datos
Cuando pensamos en visualizar datos, lo primero que nos viene a la mente son gráficos de barras, líneas, o quizás un infográfico colorido. Sin embargo, en el vasto océano de bibliotecas de Python dedicadas a la visualización de datos, Matplotlib se destaca no solo por su versatilidad, sino también por las joyas ocultas que ofrece. Una de estas gemas son los gráficos de burbujas empacadas, que han pasado desapercibidos para muchos, pero que tienen el potencial de transformar complejas relaciones de datos en visualizaciones atractivas y significativas.
¿Qué son los gráficos de burbujas empacadas?
Los gráficos de burbujas empacadas son una herramienta visual que representa datos en forma de círculos. Cada burbuja representa un punto de datos, y su tamaño y color permiten visualizar dos variables al mismo tiempo. Por ejemplo, se pueden usar gráficos de burbujas empacadas para ilustrar la participación de las mujeres en los Juegos Olímpicos, donde cada burbuja representa a un deporte y su tamaño indica el número de atletas.
Anna Gordun Peiro, escritora en Towards Data Science, destaca ejemplos fascinantes de estos gráficos, como la representación de las exportaciones de granos de Ucrania, donde el color indica el grupo de ingresos del país y el tamaño de la burbuja refleja la cantidad de grano exportado. También menciona la ilustración de trabajadores esenciales y de primera línea, donde el color define el grupo de trabajadores y el tamaño corresponde al número de empleados por sector industrial.
¿Una joya escondida en Matplotlib?
La creatividad de Gordun se desata al descubrir un ejemplo en la sección de documentación miscelánea de Matplotlib. “¿Es esta una gema oculta en la documentación de Matplotlib?”, pregunta. Con un brillo de curiosidad científica, se lanza a desentrañar cómo crear gráficos de burbujas empacadas utilizando código Python.
El código detrás del arte
Para aquellos interesados en los detalles técnicos, el proceso es sorprendentemente accesible. Aquí hay un resumen simplificado de los pasos necesarios para crear una burbuja empacada:
- Insertar datos: El primer paso es ingresar los datos que queremos visualizar. Por ejemplo, los datos de participación del mercado de navegadores.
- Crear el gráfico: Utilizar la clase
BubbleChart
dentro de Matplotlib, definiendo el tamaño de las burbujas y los colores que representen nuestras variables de interés. - Colapsar burbujas: Asegurarse de que las burbujas se toquen sin superponerse, optimizando así el espacio visual.
- Personalizar el gráfico: Aquí es donde entra la creatividad; agregar títulos, leyendas y subtítulos para que el gráfico sea comprensible y atractivo.
Desarrollando visualizaciones más atractivas
Gordun no se detiene en la línea base. Con un conjunto de datos históricos sobre los Juegos Olímpicos que muestra la participación de mujeres a lo largo de los años, transforma la visualización en un relato visual impactante.
Con sus habilidades de análisis exploratorio de datos, identifica las proporciones de hombres y mujeres en cada deporte. A través de diferentes paletas de colores y tamaños de burbujas, hace visible la repugnante desigualdad de género en años pasados y el avance hacia la equidad. Con burbujas verdes representando una división equitativa 50/50 entre hombres y mujeres, los gráficos cuentan una historia de progreso que resuena profundamente con el espíritu olímpico.
Comparación entre años
En una autoflagelación en el análisis de datos, Gordun crea un gráfico comparativo que muestra la evolución de la participación femenina en los Juegos Olímpicos de 1996 frente a los de 2020. Este paralelo destaca sorprendentemente la disminución del número de burbujas verdes en 1996 y el aumento en 2020. El gráfico no solo sirve como una poderosa herramienta visual, sino como un recordatorio de los cambios sociales de las últimas dos décadas.
La búsqueda de la interactividad
A medida que Matplotlib se revela como una alternativa robusta a herramientas más conocidas como Tableau, Gordun sugiere que el siguiente paso debería involucrar interactividad. Imagina un gráfico de burbujas empacadas que permita al usuario interactuar, profundizando en los datos al pasar el cursor sobre una burbuja o deslizando un año en un control deslizante para ver cómo la historia se despliega ante sus ojos. Esto no solo enriquecería la experiencia del usuario, sino que también fomentaría una comprensión más profunda de los datos.
Reflexiones finales: El futuro de la visualización
Gordun concluye su tutorial con una nota optimista, anticipando que los Juegos Olímpicos de París 2024 serán el primer evento donde, al menos en términos de participación atlética, se verá un equilibrio entre hombres y mujeres. Este punto de vista refuerza el valor de gráficos de burbujas empacadas: “Visualizar y comparar conjuntos de datos puede ser complejo”, dice Gordun, “pero estos gráficos captan la atención de la audiencia, no solo por su atractivo visual, sino también por su facilidad de comprensión.”
A través de su trabajo, Anna Gordun nos recuerda que los datos no son simplemente números en una hoja de cálculo; son historias esperando ser contadas, y con herramientas como Matplotlib, estas historias pueden brillar con toda su fuerza. Happy coding!
Fuente de la imagen: Anna Gordun Peiro