XlSeries es una librería en python para scrapear series de tiempo (secuencias de datos ordenadas cronológicamente) de archivos excel.
Si alguna vez trabajaste con muchos datos de este tipo sabés lo trabajoso que es armar una base descargando excels, unificando el formato en el que se presentan los datos, copiando y pegando celdas. ¿Y si un tiempo después querés actualizarla? Mejor ni hablar...
En este workshop, aprenderás a trabajar con xlseries para programar la extracción de este tipo de datos, tomarás contacto con pandas (la librería de análisis de datos más usada en python), aprenderás a armar una base de datos actualizable de series de tiempo y escribiremos un crawler para descargar todos los archivos excel que haya en un sitio web.
Requisitos: Se presume un conocimiento de python básico y/o las ganas de adquirirlo :)
Sugerencias: Si todavía no tenés python instalado en tu computadora pasá por
http://continuum.io/downloads y descargate Anaconda, una distribución de python que viene con muchas librerías ya instaladas. Después pasá por
https://github.com/abenassi/xlseries-condatos2015 y andá descargando el respositorio del taller y preparando el entorno de trabajo.