Sabina en la nube

Pienso que el aprendizaje basado en proyectos puede ser una buena manera de aprender nuevos lenguajes de programación. La inmensa cantidad de datos de todo tipo que tenemos al alcance de un simple clic y la versatilidad de los lenguajes actuales permite obtener información útil, valiosa o simplemente interesante mediante un script relativamente sencillo. Una vez esbozado en pseudocódigo, tan solo hace falta encontrar la forma concreta (y más elegante) de implementar sus distintas partes en el lenguaje en cuestión —una tarea relativamente trivial con sitios web tan socorridos como Stack Overflow.

En mi caso, tras haber cursado el magnífico MOOC An Introduction to Interactive Programming in Python, mi último proyecto personal para el aprendizaje de Python ha surgido de la curiosidad por saber cuáles son las palabras que Joaquín Sabina ha usado más frecuentemente al escribir sus canciones. Gracias al trabajo de Andreas Mueller ha sido posible generar la nube de palabras en Python, en lugar de tener que usar aplicaciones web como Word Cloud Generator o WordItOut.

El script —que por ahora está disponible solo aquí— obtiene automáticamente las letras de las canciones de Sabina de la página web cancioneros, no tiene en cuenta preposiciones ni adjetivos demostrativos, entre otras palabras, y ha sido desarrollado mediante la distribución Python 2.7 de Anaconda sobre Xubuntu 14.04.

Para obtener una visualización más llamativa, he superpuesto la nube de palabras sobre la conocida foto de portada del disco 19 días y 500 noches. El resultado ha quedado bastante bien, don’t you think?

sabina_final

Anuncios
Esta entrada fue publicada en Python resources. Guarda el enlace permanente.