Wprowadzenie do Big Data i Apache Hadoop
Details
Jesteś analitykiem lub programistą? Zastanawiasz się nad dalszym rozwojem w kierunku Big Data? Zrób pierwszy krok w kierunku poznania technologii Big Data i weź udział w jednodniowych warsztatach z jednym z wykładowców nowego kierunku studiów podyplomowych Politechniki Warszawskiej Big Data - przetwarzanie i analiza dużych zbiorów danych! (http://datascience.ii.pw.edu.pl/bigdata.html)
Program warsztatu oferuje szybki przegląd podstawowych technologii z ekosystemu Apache Hadoop. Oprócz prezentacji, dla uczestników jest przygotowany warsztat, gdzie w praktyce będą mieli okazję samodzielnie eksplorować zbiory danych.
Podczas warsztatów:
zdobędziesz podstawową wiedzę, dotyczącą problemów skali Big Data,zrozumiesz algorytm MapReduce,poznasz narzędzia analityczne Pig i Hive,poznasz zalety i wady omawianych technologii.
Od uczestników wymagana jest podstawowa wiedza z SQLa, basha, Pythona (lub innego języka skryptowego) oraz Javy. Uczestnicy w trakcie zajęć korzystają z własnego sprzętu (wymagany komputer z min. 6GB RAM i procesorem Intel i5 lub nowszym/podobnym).
Warsztat poprowadzi Jakub Nowacki - Absolwent Politechniki Gdańskiej oraz Uniwersytetu Bristolskiego, gdzie obronił doktorat z matematyki stosowanej. Na co dzień łączy umiejętności analityczne i programistyczne. Najbardziej interesuje się rozproszonym przetwarzaniem i analizą dużych zbiorów danych. Zaczynał przygodę z programowaniem w językach C i C++, jednak obecnie najlepiej czuje się w świecie Javy i Pythona.
Program warsztatów
- Wprowadzenie do Big Data.
 1.1. Czym jest Big Data, BigTable, MapReduce.
 1.2. Pojęcia real time, batch w kontekście procesowania danych.
 1.3. Ekosystem Hadoop.
- Wprowadzenie do MapReduce i Hadoop.
 2.1. Architektura.
 2.2.HDFS and YARN.
 2.3. Map Reduce Framework.
 2.4. Map Reduce Streaming.
 2.5. Warsztat.
 2.5.1. HDFS.
 2.5.2. Map Reduce.
- Wprowadzenie do Pig.
 3.1. Architektura.
 3.2. Tryby pracy.
 3.3. Typy danych, słowa kluczowe.
 3.4. Składnia.
 3.5. Warsztat Pig.
- Wprowadzenie do Hive.
 4.1. Architektura.
 4.2. Tryby pracy.
 4.3. Typy danych.
 4.4. Składnia.
 4.5. Formaty danych.
 4.6. Porównanie z Pig.
 4.7. Warsztat Hive.
- Monitorowanie i zarządzanie klastrem.
 5.1. CLI.
 5.2. Przegląd Apache Ambari.
Obowiązkowa rejestracja przez formularz na stronie: http://www.stacja.it/warsztaty/2016-07-09-wprowadzenie-do-big-data-i-apache-hadoop.html (http://www.stacja.it/warsztaty/2016-07-09-wprowadzenie-do-big-data-i-apache-hadoop.html)
W trosce o jakość warsztatów jesteśmy zmuszeni ograniczyć liczbę uczestników. Kwalifikacja odbywa się na podstawie odpowiedzi udzielonych w formularzu zgłoszeniowym oraz - w dalszym kroku - kolejności zgłoszeń. Potwierdzenie udziału w warsztatach wraz z instrukcją przygotowania środowiska otrzymasz najpóźniej na 7 dni przed planowaną datą wydarzenia.
Zapewniamy nielimitowany dostęp do pysznej kawy oraz pizzę. ☺
Zapraszamy!

