OpenLineage Meetup @ Google
Hosted By
Michael R. i Jens P.

Szczegóły
Data engineers and pipeline managers know that producing data lineage – end-to-end pipeline metadata instrumented at runtime or parsed at design time – is a heavy lift without a shared standard for lineage metadata. It requires duplication of effort across pipeline tooling, and deployment of new tools can break existing lineage workflows. Getting useful lineage can seem like a sisyphean task.
Enter OpenLineage, an increasingly adopted open standard for lineage metadata collection. It defines a generic model of run, job, and dataset entities identified using consistent naming strategies. The core lineage model is extensible by defining specific facets to enrich those entities.
Agenda:
- Mary Idamkina: OpenLineage in GCP Dataplex
- Paweł Leszczynski: Updates on the Spark Integration
- Jakub Dardziński: "Extracting lineage from PythonOperator - how come this is possible?"
- Paweł Leszczynski: "How to become spark-openlineage contributor in 5 steps"
Środki bezpieczeństwa zapobiegające rozprzestrzenianiu się COVID-19
Wymagane szczepienie COVID-19
Wydarzenie odbędzie się w pomieszczeniu
Gospodarz tego wydarzenia wprowadza środki bezpieczeństwa podczas tego wydarzenia. Meetup nie odpowiada z ich zapewnienie i nie będzie niezależnie egzekwować ich przestrzegania.

Warsaw OpenLineage Meetup Group
Zobacz więcej wydarzeń
To wydarzenie hybrydowe.
Wydarzenie online
Wydarzenie już się odbyło
Sponsorzy
OpenLineage Meetup @ Google