Wprowadzenie do Big Data i Apache Hadoop


Details
Jesteś analitykiem lub programistą? Zastanawiasz się nad dalszym rozwojem w kierunku Big Data? Zrób pierwszy krok w kierunku poznania technologii Big Data i weź udział w jednodniowych warsztatach z jednym z wykładowców nowego kierunku studiów podyplomowych Politechniki Warszawskiej Big Data - przetwarzanie i analiza dużych zbiorów danych! (http://datascience.ii.pw.edu.pl/bigdata.html)
Program warsztatu oferuje szybki przegląd podstawowych technologii z ekosystemu Apache Hadoop. Oprócz prezentacji, dla uczestników jest przygotowany warsztat, gdzie w praktyce będą mieli okazję samodzielnie eksplorować zbiory danych.
Podczas warsztatów:
zdobędziesz podstawową wiedzę, dotyczącą problemów skali Big Data,zrozumiesz algorytm MapReduce,poznasz narzędzia analityczne Pig i Hive,poznasz zalety i wady omawianych technologii.
Od uczestników wymagana jest podstawowa wiedza z SQLa, basha, Pythona (lub innego języka skryptowego) oraz Javy. Uczestnicy w trakcie zajęć korzystają z własnego sprzętu (wymagany komputer z min. 6GB RAM i procesorem Intel i5 lub nowszym/podobnym).
Warsztat poprowadzi Jakub Nowacki - Absolwent Politechniki Gdańskiej oraz Uniwersytetu Bristolskiego, gdzie obronił doktorat z matematyki stosowanej. Na co dzień łączy umiejętności analityczne i programistyczne. Najbardziej interesuje się rozproszonym przetwarzaniem i analizą dużych zbiorów danych. Zaczynał przygodę z programowaniem w językach C i C++, jednak obecnie najlepiej czuje się w świecie Javy i Pythona.
Program warsztatów
- Wprowadzenie do Big Data.
1.1. Czym jest Big Data, BigTable, MapReduce.
1.2. Pojęcia real time, batch w kontekście procesowania danych.
1.3. Ekosystem Hadoop. - Wprowadzenie do MapReduce i Hadoop.
2.1. Architektura.
2.2.HDFS and YARN.
2.3. Map Reduce Framework.
2.4. Map Reduce Streaming.
2.5. Warsztat.
2.5.1. HDFS.
2.5.2. Map Reduce. - Wprowadzenie do Pig.
3.1. Architektura.
3.2. Tryby pracy.
3.3. Typy danych, słowa kluczowe.
3.4. Składnia.
3.5. Warsztat Pig. - Wprowadzenie do Hive.
4.1. Architektura.
4.2. Tryby pracy.
4.3. Typy danych.
4.4. Składnia.
4.5. Formaty danych.
4.6. Porównanie z Pig.
4.7. Warsztat Hive. - Monitorowanie i zarządzanie klastrem.
5.1. CLI.
5.2. Przegląd Apache Ambari.
Obowiązkowa rejestracja przez formularz na stronie: http://www.stacja.it/warsztaty/2016-07-09-wprowadzenie-do-big-data-i-apache-hadoop.html (http://www.stacja.it/warsztaty/2016-07-09-wprowadzenie-do-big-data-i-apache-hadoop.html)
W trosce o jakość warsztatów jesteśmy zmuszeni ograniczyć liczbę uczestników. Kwalifikacja odbywa się na podstawie odpowiedzi udzielonych w formularzu zgłoszeniowym oraz - w dalszym kroku - kolejności zgłoszeń. Potwierdzenie udziału w warsztatach wraz z instrukcją przygotowania środowiska otrzymasz najpóźniej na 7 dni przed planowaną datą wydarzenia.
Zapewniamy nielimitowany dostęp do pysznej kawy oraz pizzę. ☺
Zapraszamy!

Wprowadzenie do Big Data i Apache Hadoop