Wprowadzenie do Big Data i Apache Hadoop

Name: Wprowadzenie do Big Data i Apache Hadoop
Start: 2016-07-09T09:00:00+02:00
End: 2016-07-09T17:00:00+02:00
Location: Sages

Hosted by Stacja I. and Agata K.

Stacja IT Warszawa

Details

Jesteś analitykiem lub programistą? Zastanawiasz się nad dalszym rozwojem w kierunku Big Data? Zrób pierwszy krok w kierunku poznania technologii Big Data i weź udział w jednodniowych warsztatach z jednym z wykładowców nowego kierunku studiów podyplomowych Politechniki Warszawskiej Big Data - przetwarzanie i analiza dużych zbiorów danych! (http://datascience.ii.pw.edu.pl/bigdata.html)

Program warsztatu oferuje szybki przegląd podstawowych technologii z ekosystemu Apache Hadoop. Oprócz prezentacji, dla uczestników jest przygotowany warsztat, gdzie w praktyce będą mieli okazję samodzielnie eksplorować zbiory danych.

Podczas warsztatów:

zdobędziesz podstawową wiedzę, dotyczącą problemów skali Big Data,zrozumiesz algorytm MapReduce,poznasz narzędzia analityczne Pig i Hive,poznasz zalety i wady omawianych technologii.

Od uczestników wymagana jest podstawowa wiedza z SQLa, basha, Pythona (lub innego języka skryptowego) oraz Javy. Uczestnicy w trakcie zajęć korzystają z własnego sprzętu (wymagany komputer z min. 6GB RAM i procesorem Intel i5 lub nowszym/podobnym).

Warsztat poprowadzi Jakub Nowacki - Absolwent Politechniki Gdańskiej oraz Uniwersytetu Bristolskiego, gdzie obronił doktorat z matematyki stosowanej. Na co dzień łączy umiejętności analityczne i programistyczne. Najbardziej interesuje się rozproszonym przetwarzaniem i analizą dużych zbiorów danych. Zaczynał przygodę z programowaniem w językach C i C++, jednak obecnie najlepiej czuje się w świecie Javy i Pythona.

Program warsztatów

Wprowadzenie do Big Data.
1.1. Czym jest Big Data, BigTable, MapReduce.
1.2. Pojęcia real time, batch w kontekście procesowania danych.
1.3. Ekosystem Hadoop.
Wprowadzenie do MapReduce i Hadoop.
2.1. Architektura.
2.2.HDFS and YARN.
2.3. Map Reduce Framework.
2.4. Map Reduce Streaming.
2.5. Warsztat.
2.5.1. HDFS.
2.5.2. Map Reduce.
Wprowadzenie do Pig.
3.1. Architektura.
3.2. Tryby pracy.
3.3. Typy danych, słowa kluczowe.
3.4. Składnia.
3.5. Warsztat Pig.
Wprowadzenie do Hive.
4.1. Architektura.
4.2. Tryby pracy.
4.3. Typy danych.
4.4. Składnia.
4.5. Formaty danych.
4.6. Porównanie z Pig.
4.7. Warsztat Hive.
Monitorowanie i zarządzanie klastrem.
5.1. CLI.
5.2. Przegląd Apache Ambari.

Obowiązkowa rejestracja przez formularz na stronie: http://www.stacja.it/warsztaty/2016-07-09-wprowadzenie-do-big-data-i-apache-hadoop.html (http://www.stacja.it/warsztaty/2016-07-09-wprowadzenie-do-big-data-i-apache-hadoop.html)

W trosce o jakość warsztatów jesteśmy zmuszeni ograniczyć liczbę uczestników. Kwalifikacja odbywa się na podstawie odpowiedzi udzielonych w formularzu zgłoszeniowym oraz - w dalszym kroku - kolejności zgłoszeń. Potwierdzenie udziału w warsztatach wraz z instrukcją przygotowania środowiska otrzymasz najpóźniej na 7 dni przed planowaną datą wydarzenia.

Zapewniamy nielimitowany dostęp do pysznej kawy oraz pizzę. ☺

Zapraszamy!

Stacja IT Warszawa

Wprowadzenie do Big Data i Apache Hadoop

Stacja IT Warszawa

Details

Related topics

You may also like