Big Data Analysen mit Spark & Cassandra


Details
"Big Data Analysen mit Spark & Cassandra"
Abstract:
Apache Cassandra ist eine hochverfügbare und massiv skalierbare NoSQL Datenbank. Wenn allerdings große Datenmengen effizient analysiert werden sollen, stößt Cassandra an seine Grenzen. Apache Spark ist ein Framework zur Verarbeitung von Daten, welches unter anderem mit MapReduce arbeitet und dabei bis zu 100x schneller ist als Hadoop. Zudem bietet es eine sehr flexible API und Integrationsmöglichkeiten in verteilte Datenspeicher wie beispielsweise HDFS und auch Cassandra.
Nach einer kurzen Einführung in Spark soll in diesem Talk die Integration mit Cassandra gezeigt werden. Anschließend werden dann einige Use Cases anhand einer Live Demo gezeigt.
Dieser Talk wird auf Deutsch gehalten.
http://photos2.meetupstatic.com/photos/event/8/d/0/5/600_436596101.jpeg
Speaker: Matthias Niehoff
Matthias arbeitet als IT-Consultant bei der codecentric AG in Karlsruhe. Dort beschäftigt er sich insbesondere mit Cassandra und der Enterprise Variante von DataStax. Außerdem interessiert er sich für Continuous Delivery und das Spring Framework sowie dessen Ökosystem.

Big Data Analysen mit Spark & Cassandra