PyData Rome, 6th Meeting, 23rd September 2024


Details
PyData Roma - 6th Meetup! 🎉
New location unlocked! Get ready for another great night about python, data and science!
Welcome back from the holidays! Let's pick up where we left off and continue our mission to make Rome a fantastic place for software engineering and data science.
The presentations of this event are ready and listed below. You can be the next speaker. If you have a presentation, some interesting code, or an open problem you'd like to discuss with the community compile the form and let us know! (proposals can be in English or Italian, whatever makes you comfortable).
Location: Via Sandro Sandri 81, Rome - Italy
Date: September 23rd 2024
Schedule:
- 18:00 🚪 Door Opening
- 18:20 ELIS Innovation Hub, Marco Oreste Migliori (Technology Innovation Manager @ ELIS)
- 18.35 🧊 PyData: what it is and why it matters, Luigi Selmi (CNR-IIA, PyData Rome Organizer)
- 18:45 🎤 Talk 1 - Il GPS non funziona! Un modello può avvisarci prima che accada? by Vincenzo Ventriglia (ML Engineer @
Istituto Nazionale di Geofisica e Vulcanologia) - 19.15 🎤 Talk 2 - Dal Caos agli Insights: sfide e strategie per creare big data pipelines by Carmela Salandria & Pietro Di Giandomenico (Data Engineers @ Elis Innovation Hub)
- 19.45 🤝 Socializing
Here is a short description of the two presentations:
1. Il GPS non funziona! Un modello può avvisarci prima che accada?
Ti sarà successo di usare il GPS sul tuo smartphone e accorgerti che non funziona correttamente? I responsabili potrebbero essere il Sole e le Large-Scale Travelling Ionospheric Disturbances (LSTIDs), fluttuazioni ionosferiche che giocano un ruolo cruciale nella dinamica dello Space Weather.
Presenteremo un modello di previsione di LSTIDs che stiamo sviluppando all'Istituto Nazionale di Geofisica e Vulcanologia, che si basa su CatBoost e usa diversi driver fisici per fare predizioni. L'explainability è una caratteristica desiderabile in un modello, specialmente in contesti potenzialmente ad alto rischio come lo Space Weather. Noi useremo SHAP – un approccio mutuato dalla teoria dei giochi – per interpretare e spiegare l'output. Accenneremo infine al probabilistic forecasting e alla calibrazione del modello, seguendo il paradigma della conformal prediction.
2. Dal Caos agli Insights: sfide e strategie per creare big data pipelines
È possibile ridurre da due settimane a un solo giorno il tempo necessario per ottenere insights di valore?
Partendo da un caso d'uso reale sviluppato per un'azienda di trasporti, esploreremo come costruire una big data pipeline
capace di semplificare e automatizzare i processi decisionali aziendali.
Vi mostreremo l'importanza di PySpark nella gestione dei big data e come, adottando best practice, sia possibile trasformare dati grezzi
in informazioni utili per data analyst e data scientist. Approfondiremo come il calcolo distribuito e parallelo possa drasticamente
ridurre i tempi di elaborazione, e quando preferirlo rispetto a librerie più tradizionali come Pandas.
Inoltre, approfondiremo il tema della scalabilità, confrontando i benefici di una big data pipeline in cloud rispetto a soluzioni on-premises.
Sign Up!
Space is limited, so RSVP today to secure your spot!
Please note:
Remember to RSVP using your full name for security reasons.
If you can't attend, please let us know at least 2 days in advance so you can free spots for people on the waiting list. We look forward to seeing you there! 🙌

PyData Rome, 6th Meeting, 23rd September 2024