Skip to content

Details

PyData es una comunidad diversa de personas interesadas en el uso y desarrollo de herramientas de análisis de datos con el objetivo de compartir ideas y aprender. Nos reunimos para discutir las mejores prácticas, nuevos enfoques y tecnologías emergentes para la gestión de datos, procesamiento, análisis y visualización. Utilizamos muchos lenguajes de programación, incluyendo (pero no limitado a) Python, Julia y R.

### AGENDA
6:15pm - Apertura de puertas y networking
6:20pm - Breve presentación de PyData Granada
Noticias e información sobre la comunidad.
6:30pm - La explosiva pareja del análisis Big Data: PySpark en Databricks.

Todos conocemos las maravillas que pueden hacer los modelos de Machine Learning e Inteligencia Artificial por nosotros pero para poder entrenar estos gigantes de la tecnología es necesario el empleo de datos limpios para que las predicciones sean precisas. Cuantos más datos usemos, mejor será nuestro modelo pero ¿cómo preparar datos masivos de forma ágil, sostenible y sobre todo, mantenible?

Spark es un framework Open Source que nos permite realizar transformación y limpieza de datos masiva mediante la computación paralela en cluster de computadores. PySpark es su API para Python con la que podremos preparar nuestros pipelines de forma sencilla.

Databricks es un servicio cloud que nos ofrece la gestión de nuestros clusters en el cloud así como la automatización de nuestros pipelines una vez estén preparados para ejecutarse. Junto con PySpark hacen una pareja de herramientas indispensable en el mundo del Big Data y de la Inteligencia Artificial.

En este workshop totalmente hands-on veremos:

  1. Paseo e introducción a Databricks
  • Levantar un cluster
  • Ejecutar notebooks
  1. Introducción a Spark en Python
  • Cómo funciona Spark y su ejecución en paralelo
  • Cómo crear un pipeline Big Data
  • Optimización de queries y ejecución
  1. Pipeline a producción
  • Tracking y mantenimiento
  1. Introducción al Streaming de datos

IMPORTANTE >> Para el correcto desarrollo del taller, las personas participantes han de traer sus portátiles.

8:00pm - Picoteo y networking (patrocinado por Zenzorrito y Cívica)

¿Te gustaría hablar en este meetup o en uno futuro? Envíanos tu propuesta a través de nuestras redes sociales.

Agradecimientos

Events in Granada
Big Data
Data Science using Python
Data Visualization
Python
Open Source

Sponsors

Sponsor logo
NumFOCUS
Promoting accessible and reproducible computing in science & technology
Sponsor logo
Python España
Soporte económico y organizativo a nivel nacional
Sponsor logo
Oficina de Software libre de la UGR
Soporte logístico y organizativo
Sponsor logo
Cámara de Comercio de Granada
Proporciona el espacio del 1er meetup
Sponsor logo
aimpulsa
Difusión
Sponsor logo
Zenzorrito
Nos apoya patrocinando el networking (2o MeetUp)
Sponsor logo
Cívica
Nos apoya patrocinando el networking (2º MeetUp)
Sponsor logo
Novatec
Localización y networking del 3er MeetUp
Sponsor logo
ELCA
Patrocina el 4º MeetUp
Sponsor logo
Revvity
Patrocinan el 5º MeetUp
Sponsor logo
Unit4
Patrocinan el 6º meetup
Sponsor logo
Fundación PTS Granada
Proporciona el espacio del 6º y 8º MeetUp
Sponsor logo
Certinia
Patrocina el 7º meetup

Members are also interested in