Loading…
CONDATOS has ended
View analytic
Thursday, September 10 • 10:30 - 11:30
XlSeries: extrayendo series de tiempo de archivos excel

Sign up or log in to save this to your schedule and see who's attending!

XlSeries es una librería en python para scrapear series de tiempo (secuencias de datos ordenadas cronológicamente) de archivos excel. 
Si alguna vez trabajaste con muchos datos de este tipo sabés lo trabajoso que es armar una base descargando excels, unificando el formato en el que se presentan los datos, copiando y pegando celdas. ¿Y si un tiempo después querés actualizarla? Mejor ni hablar...
En este workshop, aprenderás a trabajar con xlseries para programar la extracción de este tipo de datos, tomarás contacto con pandas (la librería de análisis de datos más usada en python), aprenderás a armar una base de datos actualizable de series de tiempo y escribiremos un crawler para descargar todos los archivos excel que haya en un sitio web.
Requisitos: Se presume un conocimiento de python básico y/o las ganas de adquirirlo :)
Sugerencias: Si todavía no tenés python instalado en tu computadora pasá por http://continuum.io/downloads y descargate Anaconda, una distribución de python que viene con muchas librerías ya instaladas. Después pasá por https://github.com/abenassi/xlseries-condatos2015 y andá descargando el respositorio del taller y preparando el entorno de trabajo.

Panelistas
avatar for Agustín Benassi

Agustín Benassi

Open Data Policy Coordinator, Government of Argentina



Thursday September 10, 2015 10:30 - 11:30
Sala Blanca