Skip to content

AWS DataLake & Apache Flink

Photo of Peppo Lorusso
Hosted By
Peppo L.
AWS DataLake & Apache Flink

Details

Ciao a tutti, il covid rallenta e noi acceleriamo con un nuovo evento per la community Big Data Torino. L'evento sarà tenuto nuovamente online, questa volta lo strumento utilizzato sarà Microsoft Teams.

Come sempre ospitiamo due talk:

  1. AWS Datalake - S3, Athena e QuickSight
    In questo talk vedremo come costruire un datalake in modalità "serverless" utilizzando i servizi managed di Amazon Web Services. Concluderemo con un'overview rapida di QuickSight per la rappresentazione dei nostri dati.

Speaker: Walter Dal Mut, Co-founder @ Corley

  1. Apache Flink - Stateful streaming done right
    Sicuramente avrete avuto modo di utilizzare tecnologie big data per lo streaming come lo Structured Streaming offerto da Apache Spark, i microbatch non fanno per voi? Gestire lo stato vi crea grattacapi? Ritenete operazionalizzare i job spark troppo complesso?
    Ecco perchè Apache Flink rappresenta una valida alternativa a Spark per l'implementazione di sistemi streaming.

In questo intervento verrà fatta una overview su:

  • Architettura di Flink
  • Modalità di deployment
  • Gestione dello stato:
    API
    Introspezione
    Prepopolamento tramite batch

Speaker: Andrea Fonti, Big Data Engineer @ AgileLab

Stay tuned!

Photo of Big Data & AI Torino group
Big Data & AI Torino
See more events