Skip to content

SQL on Hadoop and Spark

Photo of Jens Albrecht
Hosted By
Jens A.
SQL on Hadoop and Spark

Details

Nachdem uns mehrere potenzielle Speaker für den Juli abgesagt haben, lade ich zu unserem zweiten Meetup nochmal an die TH Nürnberg ein. Gleich vorweg noch eine Bemerkung: Wer interessante Themen zu berichten hat oder einen potenziellen Speaker kennt, melde sich bitte!

Comment in English: If English-only guest are interested, I can also give the talk in English, even though the are in German.

Nun zum Inhalt: Daten in Hadoop zu sammel ist einfach. Aber wie kann leicht darauf zugegriffen werden? Seit vielen Jahren gibt es bereits Hive als Kern-Bestandteil der Hadoop-Distribution, das inzwischen einen erstaunlich großen Sprachumfang von SQL abdeckt. In den letzten Jahren hat sich das Spektrum der SQL Lösungen durch Cloudera Impala, Apache Drill und letztendlich Spark SQL deutlich erweitert. Der Vortrag gibt einen Überblick über diese Systeme und geht darüber hinaus auf die offene Systemarchitektur ein, die alle gemeinsam haben. Ein wichtiger Bestandteil sind offene Dateiformate wie Parquet oder Avro, die ebenfalls kurz vorgestellt werden.

Die Veranstaltung findet im HQ.007 in der Hohfederstr. 40 statt. Wir haben an der Fakultät einige Parkplätze, die Sie gern nutzen können:

  1. Im Innenhof zwischen den Fakultätsgebäuden (Einfahrt aus Deichslerstr)
  2. Auf dem Parkdeck südlich der Fakulätsgebäude - die Schranke wird ab 17.30 Uhr geöffnet (Einfahrt ebenfalls aus Deichslerstr.)

Dann hoffentlich bis 21.7., Jens Albrecht

Photo of Nürnberg Digital group
Nürnberg Digital
See more events
TH Nürnberg, Fakultät Informatik
Hohfederstr. 40 · Nürnberg