Skip to content

Apache Spark: un unico motore per il Big Data Processing

A
Hosted By
Andrea
Apache Spark: un unico motore per il Big Data Processing

Details

Apache Spark: un unico motore per il Big Data Processing

Con la crescita dei volumi dei dati, l’approccio al calcolo distribuito ha posto da subito in evidenza il problema del modello di programmazione. Nel tempo sono nati molti sistemi, ciascuno di essi specializzato per supportare al meglio uno specifico workload: elaborazioni batch, query SQL interattive, navigazione di grafi, streaming sono solo alcuni degli aspetti che questi framework indirizzano e risolvono.

Nelle applicazioni del mondo reale è però sempre necessario far convivere molti workload differenti. In questo contesto un modello di programmazione unificato facilita lo sviluppo e la manutenzione delle applicazioni.

Spark è una risposta al problema di unificazione del modello e di garanzia di performance e velocità di elaborazione.

Argomenti
Introduzione ad Apache Spark
Il modello di programmazione
Fault Tolerance
Integrazione con i sistemi di storage
Librerie di alto livello (Spark SQL, Spark Streaming, MLib, GraphX)
Applicazioni e casi d’uso (Batch processing, Query interattive, Streaming)
SparkR e PySpark
Focus: Integrazione con Apache Kafka per lo streaming strutturato e l’end-to-end real-time
Nel corso di questo evento avrai la possibilità di:

Aggiornarti su una delle più significative innovazioni tecnologiche nel mondo Big Data
Confrontarti con i maggiori esperti delle tecnologie Hadoop
Conoscere il percorso formativo e di certificazione offerto da GCI – Brain Management e Cloudera
I posti disponibili per l’evento sono limitat

Photo of Big Data & Cloudera Ecosystem Milano group
Big Data & Cloudera Ecosystem Milano
See more events
Talent Garden Via Arcivescovo Calabiana 6, Milano
Via Arcivescovo Calabiana 6, Milano · Milano, MI