Past Meetup

[Data Science] #3 - Google Analytics+R oraz Presto jako analityczna baza danych

This Meetup is past

124 people went

Location image of event venue

Details

Google Analytics + R

Michał Bryś, Allegro

Internet jest jednym z miejsc, gdzie zebranie danych do analizy jest niezwykle proste. W szybki sposób można dowiedzieć się, jak zachowują się użytkownicy serwisu www, skąd pochodzą i jaka jest ich droga do decyzji o zakupie.

Jednak aby nie zgubić się w gąszczu danych należy mieć pewność, że zbieramy je poprawnie i stawiamy przed nimi właściwe pytania.

Na spotkaniu opowiem jaki potencjał drzemie w narzędziu Google Analytics, jakich danych może dostarczyć oraz jak wyciągnąć z nich wartościowe wnioski. Nie tylko korzystając z interfejsu webowego Google Analytics, ale eksportując dane na zewnątrz za pomocą Core Reporting API.

Zaprezentuję również praktyczne przykłady wizualizacji danych oraz uczenia maszynowego na podstawie danych z Google Analytics w R.

Presto jako analityczna baza danych

Wojciech Biela, Łukasz Osipiuk, Teradata

Praca z rozproszonymi danymi w celach analitycznych jest wyzwaniem podejmowanym od kilku lat przez różne grupy, open source i closed source. W tej prezentacji skupimy się na przybliżeniu Presto DB, jest to rozproszony silnik zapytań SQL umożliwiający odpytywanie jednym zapytaniem różnych heterogenicznych źródeł danych. W szczególności umożliwia efektywne i interaktywne odpytywanie o dane przechowywane w HDFS (Hive/Hadoop). Jest to projekt open source rozwijany na licencji Apache 2.0, którego inicjatorem jest zespół inżynierów z Facebook. Podczas tej prezentacji Wojciech Biela oraz Łukasz Osipiuk z Teradata Labs zaprezentują Presto od różnych stron, omówione zostanie wykorzystanie Presto do analityki na dużych danych oraz jego architektura, wydajność, sposób działania i punkty rozszerzeń.

Bio prelegentów:
Wojciech Biela - jest szefem polskiego zespołu Teradata Center for Hadoop (części Teradata Labs), który zajmuje się rozwojem bazy danych Presto oraz jej integracją z rozwiązaniami Teradata. Do Teradata trafił w ramach przejęcia firmy Hadapt Inc w roku 2014, której polski oddział tworzył od roku 2011. Wcześniej zajmował się budową i prowadzeniem zespołów oraz projektów w różnych branżach, od dużego e-commerce po systemy POS. Jest absolwentem Politechniki Wrocławskiej.
Łukasz Osipiuk - jest doświadczonym inżynierem w Teradata Labs (Teradata Center for Hadoop) i zajmuje się rozwojem Presto oraz jego integracją z Teradata. Łukasz tworzył trzon zespołu firmy Hadapt przed jej przejęciem przez Teradata w 2014. Wcześniej Łukasz pracował w GG Network. Jest absolwentem MIM UW.