Skip to content

Talks #7: Lego i Airflow

Photo of Krzysztof Jędrzejewski
Hosted By
Krzysztof J. and Bartosz L.
Talks #7: Lego i Airflow

Details

Agenda:
📌 Piotr Rybak: Trzy lata rozwoju klasyfikatora klocków Lego 🇵🇱
📌 Jacek Bera: Love is in the Air...flow. A few words about orchestrating data pipelines 🇵🇱
🎲 Quiz z nagrodami
📬 Ogłoszenia uczestników (w trakcie zapisów do quizu)
🍕 Przekąski i networking

🌍Miejsce: Centrum Wykładowe PP, ul. Piotrowo 2, Sala Wykładowa nr 8

—————————————————————————————

Piotr Rybak: Trzy lata rozwoju klasyfikatora klocków Lego 🇵🇱

Abstract:
W każdym projekcie uczenia maszynowego nadchodzi ten moment kiedy skuteczność modelu się wypłaszcza i nic nie może jej już poprawić. Puszczasz jeszcze kilka treningów, przeprowadzasz parę eksperymentów, ale powoli kończą Ci się pomysły i zaczynasz tracić nadzieję, że jakakolwiek poprawa jest w ogóle możliwa. Zdrowy rozsądek podpowiada, że to najwyższa pora, żeby zająć się kolejnym projektem. Czy zastanawiałeś się kiedyś, co by się stało, gdybyś jednak kontynuował pracę nad tym modelem?
W tej prezentacji opowiem o tym jak od trzech lat buduję klasyfikator klocków Lego. O tym jak już dawno temu uznałem, że nie da się go zrobić lepiej, ale mimo to nadal go rozwijam i ciąglę znajduję kolejne różne sztuczki żeby go usprawnić. Opowiem zarówno o początkach projektu, ale przedewszystkim o strategiach jak rozwijać model, kiedy wydaje się, że nic już nie jest w stanie go poprawić.

Bio:
Piotr Rybak zajmuje się uczeniem maszynowym od ponad 10 lat. Przez większość kariery skupiał się na budownie rozwiązań z zakresu rozumieniu języka naturalnego. Zdobywał doświadczenie zarówno w środowisku akademickim, jak i w start-upach oraz większych firmach. Obecnie doradza firmom z zakresu AI oraz rozwija swój własny projekt dotyczący rozpoznawania klocków Lego. Jest aktywnym członkiem polskiej społeczności NLP, współtworząc projekty takie jak benchmark KLEJ oraz modele HerBERT, plT5 czy Silver Retriever. W wolnym czasie jest wielkim fanem klocków Lego, gier planszowych oraz boulderingu.

—————————————————————————————

Jacek Bera: Love is in the Air...flow. A few words about orchestrating data pipelines 🇵🇱

Abstract:
W tej prezentacji przyjrzymy się Apache Airflow, potężnemu narzędziu do automatyzacji i orkiestracji potoków danych. Jest to standard w świecie Data Engineering, ale mało rozpoznawalny poza nim. Omówimy jego kluczowe funkcje, takie jak DAGi, planowanie zadań oraz monitorowanie w czasie rzeczywistym, pokazując, jak upraszcza złożone procesy przetwarzania danych. Na praktycznych przykładach zobaczymy, jak Airflow może usprawnić zadania Data Engineer'a i uczynić procesy bardziej efektywnymi.

Bio:
Jacek Bera, Staff Data Engineer @Fandom, wcześniej w Egnyte, Valtech. Miłośnik danych z ponad 7-letnim doświadczeniem w Big Data, w tym Python, Scala, py/Spark, SQL, Airflow i Hadoop. Prywatnie tata trójki dzieci, majsterkowicz i bardzo okazjonalny saksofonista.

Photo of Poznański Horyzont Danych group
Poznański Horyzont Danych
See more events