PyDataVE #13 - Parallelizzare l'elaborazione dei dati


Details
Carissimi, continuamo con i meetup PyData, incentrati come sempre sulla condivisione di best practice, metodologie, analisi, sistemi di machine learning, .., con i progetti open source del programma di NumFOCUS ma non solo !
Che ? Ricominciamo con un incontro in presenza ! L’evento sarà ospitato da Qintesi: per chi non potesse raggiungerci, si terrà anche online (il link verrà recapitato a chi si iscrive).
Attenzione: c’è un limite di 20 posti in Qintesi, quindi vi prego di controllare durante la registrazione se rientrate.
Cosa ? Parleremo di come parallelizzare l'elaborazione dei dati: sarà un evento basato su di uno studio condotto su molte librerie open source a confronto per comprendere i loro limiti in termini di risorse utilizzate, quantità di dati gestiti e tempistiche, ma anche tempo di implementazione, curva di apprendimento e best practice.
Chi ? Lo speaker sarà uno sviluppatore che ha condotto lo studio perché non ne può più che il suo capo continui a dire “non capisco perché non usi PySpark per queste cose”.
Dove ? In presenza ospitati da Qintesi e in streaming su YouTube.
E poi ? Ho pensato di condividere questo form Google con cui raccogliere preferenze, idee, e dove vi potete proporre come prossimi speaker !

PyDataVE #13 - Parallelizzare l'elaborazione dei dati