useR!2019 conference & tutorial: 'Statistical Data Cleaning using R'
Details
useR!2019 conference & tutorial: 'Statistical Data Cleaning using R'
23 Luglio 2019, R-Ladies Bari presenta:useR!2019 conference & tutorial: 'Statistical Data Cleaning using R'Conferenza USER!2019: cos'è, materiale, r-ladies-global TUTORIAL Statistical Data Cleaning using R: Per fidarsi del risultato di un'analisi statistica, bisogna essere in grado di fidarsi dei dati di input. In questo workshop dimostriamo come la qualità dei dati può essere sistematicamente definita e migliorata utilizzando R. Il workshop si concentra sulla convalida dei dati (controllo dei dati), individua gli errori e imputa valori mancanti o errati sotto restrizioni. Presentiamo brevi introduzioni ai principi principali, forniamo quiz e discussioni per il pubblico e forniamo brevi esercizi basati su R. Dimostreremo alcuni dei nostri pacchetti R, tra cui "validate" (per i controlli di qualità dei dati) "errorlocate" (per localizzazione degli errori), "simputation" per i metodi di imputaton e "lumberjack" (per tenere traccia delle modifiche nei dati). Sarà prestata particolare attenzione a come combinare le varie fasi dell'elaborazione dei dati e come analizzare e visualizzare i risultati. Questo tutorial è basato sul libro "Statistical Data Cleaning with Applications in R" (John Wiley & Sons, 2018).
Giovanna de Vincenzo, cofounder di R-Ladies Bari e data scientist in InfoCamere vi racconterà della sua esperienza allo useR!2019 a Tolosa, FR e vi mostrerà delle tecniche di statistical data cleaning. Vi ricordiamo di portare il PC con R e RStudio installato! I materiali saranno resi disponibili tramite https://github.com/giodev11/r-ladies-bari (al momento non c'è nulla).
INGRESSO GRATUITO, REGISTRAZIONE OBBLIGATORIA
LINK http://tiny.cc/ax7h9y
Agenda
18:00 - 18:15 Welcome r-ladies-bari
18:15 - 18:30 Presentazione r-ladies-bari
18:30 - 20:00 Workshop
20:00 - 20:15 Saluti e Networking
NEWS!NEWS!NEWS! L'evento si terrà presso IC406, incubatore di AurigaVi invieremo qualche giorno prima i pacchetti e il dataset da scaricare da Github. Ringraziamo anche gli altri nostri sponsor e partner:
Infocamere, IAML - Italian Association for Machine Learning, R-Ladies Global