Skip to content

pipelines, ML <- recap(eRum)

Photo of Ágnes Salánki
Hosted By
Ágnes S. and 4 others
pipelines, ML <- recap(eRum)

Details

Jön a nyári szünet!
De ne szaladjunk ennyire előre!

Májusban Budapesten tartották az eRum konferenciát, ahol sok hasznosat és érdekeset hallottunk, amit szeretnénk Veletek is megosztani. A Vakációt megelőző utolsó meetupunkon Steiner Johanna és Orbán Erika osztja majd meg a tapasztalatait a konferenciáról, és készülnek workshoppal is:

Steiner Johanna: DataMaid csomag - adatelemzés es adatelőkészítés
Kezdjük az elején! Minden adatelemzési, modellépítési feladat első, és talán legidőigényesebb része az adatminőség ellenőrzése, az adataink validálása, és tisztítása. A dataMaid csomag ehhez nyújt segítséget: a package-el lehetőség van egyéni igényekre igazított leíró statisztikákat és adatminőség ellenőrzéseket definiálni, amikkel az adatminőség problémák, hibák felismerhetők az adatbázisunkban. A csomag előnye, hogy a definiált tesztek, statisztikák eredményeit egy R-független, jól olvasható riportban összegzi, mely a futás paramétereit is rögzíti, ezzel biztosítva a reprodukálhatóságot. A workshop-on kipróbáljuk a dataMaid előre definiált riportját, illetve új, igényeinknek jobban megfelelő riportot is definiálunk majd. Az elemzéseinkhez a package saját adattábláját, az amerikai elnökök adatbázisát fogjuk használni
Előkészület: dataMaid, lubridate csomagok letöltése.

Orbán Erika: Interpretálható machine learning modellek készítése h2o és lime csomagokkal
A black box modelleket gyakran éri kritika az értelmezhetőséggel kapcsolatban. A modellek interpretálhatóságát május 25-e óta az EU Általános Adatvédelmi Rendelete (GDPR ) is elvárja. Ehhez kapcsolódóan két csomag használatával fogunk megismerkedni, ezek a h2o és a lime csomagok. A h2o csomag AutoML függvényének segítségével megtanulunk regressziós és klasszifikációs modelleket készíteni gyorsan és egyszerűen. Ezután megnézzük, hogy a lime csomag segítségével hogyan tudjuk értékelni és értelmezni a modellek eredményeit. Az esettanulmányokhoz az mlbench csomag adathalmazai közül a Boston Housing és Diabetes adatokat fogjuk használni.
Előkészület: h2o, lime és mlbench csomagok letöltése

Részletesebb információkkal majd még jelentkezünk.

Photo of R-Ladies Budapest group
R-Ladies Budapest
See more events