Apache Spark: un unico motore per il Big Data Processing

Name: Apache Spark: un unico motore per il Big Data Processing
Start: 2017-06-01T09:00:00+02:00
End: 2017-06-01T13:00:00+02:00
Location: Talent Garden Via Arcivescovo Calabiana 6, Milano

Hosted by Andrea

Big Data & Cloudera Ecosystem Milano

Details

Con la crescita dei volumi dei dati, l’approccio al calcolo distribuito ha posto da subito in evidenza il problema del modello di programmazione. Nel tempo sono nati molti sistemi, ciascuno di essi specializzato per supportare al meglio uno specifico workload: elaborazioni batch, query SQL interattive, navigazione di grafi, streaming sono solo alcuni degli aspetti che questi framework indirizzano e risolvono.

Nelle applicazioni del mondo reale è però sempre necessario far convivere molti workload differenti. In questo contesto un modello di programmazione unificato facilita lo sviluppo e la manutenzione delle applicazioni.

Spark è una risposta al problema di unificazione del modello e di garanzia di performance e velocità di elaborazione.

Argomenti
Introduzione ad Apache Spark
Il modello di programmazione
Fault Tolerance
Integrazione con i sistemi di storage
Librerie di alto livello (Spark SQL, Spark Streaming, MLib, GraphX)
Applicazioni e casi d’uso (Batch processing, Query interattive, Streaming)
SparkR e PySpark
Focus: Integrazione con Apache Kafka per lo streaming strutturato e l’end-to-end real-time
Nel corso di questo evento avrai la possibilità di:

Aggiornarti su una delle più significative innovazioni tecnologiche nel mondo Big Data
Confrontarti con i maggiori esperti delle tecnologie Hadoop
Conoscere il percorso formativo e di certificazione offerto da GCI – Brain Management e Cloudera
I posti disponibili per l’evento sono limitat

Big Data & Cloudera Ecosystem Milano

Apache Spark: un unico motore per il Big Data Processing

Big Data & Cloudera Ecosystem Milano

Details

Related topics

You may also like