Saltar al contenido

Detalles

Dask es la extensión natural de Pandas a un entorno multi-núcleo. En estas dos charlas, conoceremos la librería, sus aplicaciones naturales al procesamiento de datos y algunos trucos.

Roberto Panai - Teamcore
"Procesamiento de datos distribuido con pandas y dask"
Un enfoque práctico para dataframes distribuidos y fuera-de-núcleo en Python

Sergio Lucero - Quant
Leyendo el Padrón 2020 del SERVEL
Cómo obtener, limpiar y anonimizar 14.6 millones de datos electorales usando Pandas, Fitz y Dask.

Los miembros también están interesados en