137. spotkanie Data Community Kraków
Szczegóły
Zapraszamy na 137. spotkanie krakowskiej grupy Data Community, w miejscu, które Wam się spodobało - HEVRE!
KIEDY
21 stycznia (środa) - 18:00 - 21:00
GDZIE
Pub HEVRE - Meiselsa 18, Kraków
AGENDA
18:00 – 18:15 Rozpoczęcie spotkania, sprawy organizacyjne
18:15 – 19:15 Algorytmy ML - klasyczne podejście - Maciej Kępa
19:15 – 19:25 Przerwa
19:25 - 20:35 Optymalna konfiguracja Microsoft SQL Server na AMD EPYC - Andrzej Kukuła
20:25 – 21:00 Networking i zakończenie spotkania
ABSTRAKTY
Algorytmy ML - klasyczne podejście - sesja wprowadza w świat klasycznych algorytmów uczenia maszynowego i pokazuje, kiedy naprawdę warto po nie sięgać - nawet w erze zdominowanej przez GenAI. Skupimy się na praktycznym zrozumieniu różnic między regresją, klasyfikacją i klasteryzacją oraz na świadomym doborze algorytmu do problemu biznesowego i dostępnych danych. Omówimy najczęściej stosowane podejścia: regresję liniową i logistyczną, drzewa decyzyjne oraz gradient boosting, wraz z ich mocnymi i słabymi stronami, typowymi zastosowaniami i realnymi ograniczeniami.
Część praktyczna obejmie demo podstawowych algorytmów w Databricks, pokazujące trenowanie modeli, ich porównywanie oraz interpretację wyników w codziennej pracy.
Z sesji wyniesiesz:
• Zrozumienie różnic między klasyfikacją, regresją i klasteryzacją oraz kiedy stosować każde z tych podejść.
• Wiedzę, jak działają kluczowe klasyczne algorytmy ML i do jakich problemów pasują najlepiej.
• Świadomość zalet i wad poszczególnych algorytmów – od modeli liniowych po zespoły drzew.
• Umiejętność świadomego doboru algorytmu do danych i celu biznesowego.
• Praktyczny przykład trenowania i porównywania modeli w Databricks, gotowy do samodzielnego odtworzenia.
Optymalna konfiguracja Microsoft SQL Server na AMD EPYC
Na sesji przedstawię wybrane zagadnienia techniczne dotyczące nowoczesnych procesorów AMD EPYC czwartej i piątej generacji, a także szczegóły dotyczące działania SQL Server na takich platformach. Spróbujemy dobrać najlepsze komponenty sprzętowe, by zapewnić maksymalną wydajność SQL Server. Przejdziemy przez główne ustawienia całego stosu hardware'owego i software'owego. Zobaczymy, jak to wszystko przekłada się na wydajność SQL Server w praktyce. Zapraszam każdego, kto chce się dowiedzieć, jak "wycisnąć" wszystko ze sprzętu i SQL Servera. Będzie dużo niskopoziomowych smaczków.
BIO
Maciej Kępa - Data Architect @ Datumo
Inżynier danych oraz lider techniczny w Datumo. Swoją karierę zadedykował obszarom AI/ML, urządzeniom brzegowym oraz IoT. Zawodowo związany z projektowaniem oraz wdrażaniem rozwiązań opartych głównie na chmurze Azure. Zwolennik sztucznej inteligencji zorientowanej na dane (Data-centric AI). Prywatnie miłośnik zwierząt, gier komputerowych oraz majsterkowania
Andrzej Kukuła - Pracuję w Google Cloud z produktami Big Data, głównie BigQuery i Cloud Pub/Sub. Pracuję z największymi klientami i architekturami danych na świecie.
Przed dołączeniem do Google przez wiele lat zajmowałem się Microsoft SQL Server, zwłaszcza w obszarze optymalizacji wydajności, ale także migracji, aktualizacji i wysokiej dostępności (HA). Zajmowałem się projektowaniem i wdrażaniem architektur sprzętowych pod SQL Server, baz operacyjnych i hurtowni danych. Prowadziłem szkolenia i wykonywałem różne inne prace konsultacyjne.
SQL Server jest nadal moim "konikiem".
