What we're about

Bienvenue au Toulouse Data Engineering meetup !

Ce meetup est un lieu de rencontre entre data engineer toulousains dans le but d’échanger autour de cette discipline.

Nos centres d'intérêt sont multiples:
- Data Warehouse: BigQuery - Redshift - Snowflake
- ETL pipeline: Airflow - Stitch - Fivetran
- Data Modeling : DBT
- Data Visualisation: Metabase - Periscope Data - Tableau
- Event sourcing: Snowplow - Kafka
- Distributed Computing: Spark

Nous apprécions également les retours d’expériences sur des problématiques de data telles que:
- Comment choisir l’architecture data en fonction de la taille de la boite?
- Comment mettre en place des tests unitaires sur de la data?
- Comment rendre les pipelines ETL robustes?

N'hésitez pas à nous partager vos envies, idées de présentation ou tout retour sur le meetup.

À bientôt !

Upcoming events (2)

Airflow @SchoolMouv: Build, Schedule and Monitor pipeline at scale

Bonjour, Pour ce meetup, je vais vous donner mon retour d'expérience sur l'utilisation d'Airflow à SchoolMouv. Airflow est un outil qui permet de créer, d'orchestrer et de monitorer des pipelines et à SchoolMouv il est utilisé notamment pour gérer tous nos pipelines d'ETL et asservir notre outil de marketing automation: Braze. N'hésites pas à aller jeter un oeil sur la doc: https://airflow.apache.org

Discussion: Comment choisir la bonne architecture data?

Bonjour, Cette présentation est une discussion ouverte à propos du choix des outils data en fonction de la taille de l'organisation. Sera discuter: - le besoin d'un datawarehouse et quel datawarehouse: BQ - Redshift - Snwoflake - Faut-il coder ses pipelines ETL ou utiliser des outils comme: Stitch - Fivetran - Faut-il créer son propre système d'events ou utiliser des outils comme Segment - Amplitude - Quelles outils de visualisation choisir: Metabase - Looker - Tableau?

Past events (1)

Photos (2)