Loading…
CONDATOS has ended
Thursday, September 10 • 10:30 - 11:30
XlSeries: extrayendo series de tiempo de archivos excel

Sign up or log in to save this to your schedule and see who's attending!

XlSeries es una librería en python para scrapear series de tiempo (secuencias de datos ordenadas cronológicamente) de archivos excel. 
Si alguna vez trabajaste con muchos datos de este tipo sabés lo trabajoso que es armar una base descargando excels, unificando el formato en el que se presentan los datos, copiando y pegando celdas. ¿Y si un tiempo después querés actualizarla? Mejor ni hablar...
En este workshop, aprenderás a trabajar con xlseries para programar la extracción de este tipo de datos, tomarás contacto con pandas (la librería de análisis de datos más usada en python), aprenderás a armar una base de datos actualizable de series de tiempo y escribiremos un crawler para descargar todos los archivos excel que haya en un sitio web.
Requisitos: Se presume un conocimiento de python básico y/o las ganas de adquirirlo :)
Sugerencias: Si todavía no tenés python instalado en tu computadora pasá por http://continuum.io/downloads y descargate Anaconda, una distribución de python que viene con muchas librerías ya instaladas. Después pasá por https://github.com/abenassi/xlseries-condatos2015 y andá descargando el respositorio del taller y preparando el entorno de trabajo.

Panelistas
avatar for Agustín Benassi

Agustín Benassi

Director de Datos Públicos, Secretaría de Modernización de la Nación Argentina
Licenciado en Economía por la Universidad de Buenos Aires (UBA), programador y activista de los datos abiertos. Trabajó en investigación de economía del transporte en UBA y CIPPEC. Desde 2016 es parte de la iniciativa de datos abiertos del gobierno nacional de Argentina donde... Read More →



Thursday September 10, 2015 10:30 - 11:30
Sala Blanca