Introducción a PySpark


Details
Buenos días a todos!
Retomamos actividades con la comunidad Python Bucaramanga para este año 2022 y para nuestro primer evento, estaremos hablando de PySpark.
Veremos una panorámica general de Spark y su aplicación para manipulación de big data mediante los lenguajes de Python y SQL. Se explicará la arquitectura computacional de Spark y algunos ejemplo utilizando Google Colab.
Ponentes:
María Valentina Ariza Gómez: Valentina es ingeniera de datos en Dataknow, le gusta mucho todo lo relacionado con ETL, ELT, y análisis de datos. Le gusta mucho el cine, leer y admirar atardeceres.
Laura López Bedoya: Laura López es ingeniera de telecomunicaciones y científica de datos. Le gusta responder preguntas con ayuda de los datos, NLP y crear visualizaciones. Apasionada por la fotografía y armar rompecabezas 3D.
Redes (Linkedin, Twitter, Instagram, Medium)
@valearizag
@lauralpezb
¡Nos vemos pronto!

Introducción a PySpark