Od veľkých dát k veľkej efektivite s DuckDB


Details
Python Meetup bude prebiehať offline (v Bratislave) aj online (link na pripojenie pošleme na email deň vopred). Pre online ako aj offline účasť je potrebné registrovať sa cez nasledujúci odkaz (Google Forms):
👉 https://forms.gle/pjK4uxfBQ37qyTSi7 👈
***
➡ Popis meetupu:
V časoch dnes už dávno minulých bolo "Big Data" najväčším buzzwordom v celom technickom sektore. V týchto dňoch sa už hajpujú iné termíny a slovné spojenia, a v dátovom svete si pomaly začíname uvedomovať, že až na výnimky zamestnancov veľkých technologických gigantov sa s "Big Data" obyčajný smrteľník skôr nestretne. My ostatní máme skôr "medium-sized data", ktoré by sa možno mohli dať spracovať a analyzovať aj bez použitia obrovských databázových systémov – pri troche šťastia a solídnejšom hardvéri dokonca aj lokálne.
Na tomto stretnutí s live ukážkami sa pokúsime o nemožné: počas jednej hodiny predstaviť DuckDB – open-source databázový systém navrhnutý pre rýchlu a efektívnu analýzu dát – od úplných základov až po riešenie teoretických, ako aj prudko reálnych a praktických problémov, ako napríklad:
· Integrácia s Pythonom ako aj s Jupyter Notebook
· Analýza rozsiahlych datasetov (aj väčších ako dostupná RAM)
· Agregácia dát z rôznych súborov a súborových formátov
· Pokročilé analytické funkcie (napr. WINDOW functions)
· Porovnanie s inými databázovými systémami
· Napojenie na Python ekosystém
Následne sa pozrieme ako sa dá DuckDB použiť v kombinácií spolu s Apache Iceberg ako lacný “data lake” pomocou knižnice PyIceberg.
➡ O rečníkovi:
Gregor Karetka aktuálne finišuje magisterské štúdium na VUT FIT v Brne a v Slido pôsobí ako Data Engineer, ak náhodou nie je treba pomôcť s niečím iným. Jeho cesta k programovaniu viedla cez elektroniku a robotické súťaže ako napríklad FLL (First Lego League) a následne RoboCup Junior, ktorých sa zúčastňoval už od základnej školy. Na nich sa s kamarátmi (https://www.compotes.net) učil stavať robotov za malé peniaze, ktoré ale robili veľa muziky, čo je vlastnosť ktorá mu zostala až dodnes. Okrem programovania sa vo voľnom čase venuje dronom.
➡ Pre koho je meetup určený? Meetup je určený pre všetkých Pythonistov.
Jazyk: Meetup bude prebiehať v slovenskom jazyku.
Miesto: Lab.cafe, Nám. SNP 25 v Bratislave alebo online (link na pripojenie pošleme na email deň vopred).
V tomto príjemnom priestore budeme mať možnosť nielen zapojiť sa do workshopu, ale pri káve, limonáde či remeselnom pive posedieť, porozprávať sa a užiť si atmosféru komunity.
Čas: Začíname 28.11. 2023 (Utorok) o 18.00.
Cena: Účasť na meetupe je bezplatná, avšak je potrebná registrácia cez Google Forms (pre offline ako aj pre online účasť, link sa nachádza vyššie).
***
Ak máte ohľadom meetupu otázky, kontaktujte nás mailom: info@pycon.sk

Od veľkých dát k veľkej efektivite s DuckDB