Skip to content

Details

Z wielką przyjemnością zapraszamy na najbliższe (i długo oczekiwane) spotkanie WCUG! Tym razem odbędzie się ono razem z Warszawską Grupą Użytkowników Hadoop.

Prelegenci: Piotr Kołaczkowski i Jacek Lewandowski

Zapowiedź:

Apache Spark to nowy, bardzo szybki system analizy dużej ilości danych, zbudowany w oparciu o leniwe kolekcje rozproszone (RDD - Resilient Distributed Datasets). Apache Cassandra to rozproszony system baz danych.

Na spotkaniu zaprezentujemy otwartoźródłowy projekt, który pozwala wygodnie łączyć oba te systemy. Pokażemy w jaki sposób przekształcić tabelę danych w Cassandrze do kolekcji RDD, a następnie wykonać podstawowe operacje na kolekcji takie jak filtrowanie, przekształcanie elementów, redukcja, złączenia, grupowanie i sortowanie. Przedstawimy też zapisywanie danych z wynikowej kolekcji do Cassandry.

Na koniec zaprezentujemy w jaki sposób baza danych Cassandra współpracuje z systemem przetwarzania danych w czasie rzeczywistym Spark-Streaming. Pokażemy w jaki sposób można gromadzić dane chwilowe oraz zagregowane, a także jak możemy złączać dane pochodzące ze strumieni z danymi zgromadzonymi w bazie danych.

Notka dodatkowa

Dzięki uprzejmości firmy DataStax na spotkaniu pojawi się także poczęstunek :) Prosimy o zadeklarowanie uczestnictwa na stronie spotkania (https://www.meetup.com/Warsaw-Cassandra-Users/events/206607732/), dzięki czemu będziemy mogli oszacować potrzebną liczbę pizz i napojów.

Serdecznie zapraszamy!

Members are also interested in