Tippek, trükkök, csomagok


Details
A következő találkozót hosszú idő után újra magyar nyelven tartjuk, és olyan R programozási tippeket, trükköket, fogásokat ismerhettek meg, amelyek a kezdő R felhasználótól a haladó R programozóig bárki számára hasznosak lehetnek. A korábbi hasonló R meetupoktól eltérően most nem az 5 perces lighning talk formát használjuk, hanem az előadók szabadon gazdálkodhatnak 10-10 perccel, amely során egy érdekes R csomagot vagy néhány trükköt mutatnak majd be.
Előzetes program:
• 18:00 ajtónyitás, pizza, networking
• 18:30 előadások (l. lentebb)
• 19:45 további networking, amely előforuldhat, hogy az Ibolya presszóban folytatódik
• Czeller Ildi (data scientist @ Emarsys): Hogyan szabhatjuk testre ggplot ábráinkat?
Matematikusként végeztem az eltén, azóta Bő 2 éve dolgozom az Emarsysnál data scientistként, ahol munkámhoz nagyrészt R-t használok.
A ggplot2 csomaggal készült ábrák alapbeállításai is nagyon jók, de céges vagy akadémiai publikáláshoz is hasznos lehet egyedi, egységes kinézetet adni ábráinknak. Erre fogok bemutatni egy módszert, amivel anélkül változtathatjuk az ábrák kinézetét, hogy az azokat legyártó R kódhoz egyesével hozzá kellene nyúlni.
• Divényi János (data scientist @ Emarsys): Plotly
Szeretnél interaktív grafikonokat készíteni tooltippel, zoommal, animációval? Mindezt ggplot-szintű egyszerűséggel? Plotly a barátod - egy méltatlanul alulhasznált csomag bemutatója.
• Gyurkó Dávid (BI/Big Data tanácsadó @ United Consult): Web API létrehozása R-ben
A Web API-ok lehetővé teszik a kommunikációt különböző platformok között. Az Expresshez hasonlóan (Node.js), R-ben is van lehetőség API végpontokat definiálni, ezzel lehetővé téve, hogy Java, Node.js, vagy bármely más RESTful service-en történő fejlesztésben könnyedén használhassunk R függvényeket. Előadásomban az R csomagok által nyújtott lehetőségeket fogom bemutatni.
• Kehl Dániel (adjunktus, PTE-KTK) és Abaligeti Gallusz (tanársegéd, PTE-KTK): Egyéniesített vizsgáztatási módszer alkalmazása a statisztika tárgy oktatásában
A PTE-KTK hallgatói a statisztika tárgyak számonkérése során teljesen egyedi (személyre szabott) teszteket töltenek ki, emellett lehetőség van egyedi feladatok gyakorlására is. A feladatokat R-ben generáljuk az exams csomag segítségével, majd Moodle rendszerbe feltöltve azon keresztül történik a számonkérés, kiértékelés.
• Milibák Eszter (data scientist): Napfoltok és neurális hálók - Idősoros előrejelzés az RNN csomag felhasználásával
2012-ben szereztem szociológus, majd 2016-ban survey statisztikus diplomát az ELTE-n. 2016 eleje óta dolgozom adatelemzőként egy multinacionális vállalatnál. Szakmai érdeklődésem középpontjában jelenleg a gépi tanulás módszerei állnak. Szabadidőmben szívesen foglalkozom filozófiával, természetgyógyászattal, önkéntes tevékenységekkel
Az idősoros adatok előrejelzésére a hagyományos módszerek (ARIMA stb. modellek) mellett az utóbbi években a neurális hálók segítségével is lehetőség nyílt. Az előadásban az R beépített "sunspots" adatsorát feldolgozva szeretnék gyakorlati példát mutatni a visszacsatolt (recurrent) neurális hálókat tartalmazó RNN csomag használatára.
• Nagy Zsombor (data scientist @ IBM): XGBoost
Az ELTE-n végeztem informatika szakon. 15 év magántanítás (analízis, valószínűségszámítás, statisztika, SQL, programozás, SPSS) után az előrejelzésekben rejlő „erő” beszippantott - érdeklődésem azóta is töretlen a gépi tanulás iránt. Predictive Analytics problémákkal foglalkozom az IBM-nél.
A bináris változók előrejelzése fontos és széles körben kutatott problémát jelent a Data Scientistek körében. Az XGBoost: adattípustól függetlenül (regresszió vagy osztályozás) ismert, hogy jobb megoldásokat kínál, mint más ML algoritmusok. Az algoritmus alapul veszi a kezdeti előrejelzésekben elkövetett hibákat és a következő modell építésénél ezen hibák csökkentésére törekszik. Előadásomban meg szeretném mutatni az XGBoost erejét a valós életből vett adatokon. Összehasonlítom az XGBoost előrejelzéseit a más Machine Learning algoritmusok által előállított mutatókkal.
• Pál Jenő (data scientist @ Emarsys): Saját R package repository-k könnyedén és egyszerűen
A drat package könnyűvé teszi, hogy CRAN-hoz hasonló módon repository-ba szervezzünkR package-eket. Ez különösen hasznos, ha például belső használatra akarunk csomagokat írni vagy valamiért (például méret korlátok miatt) nem lehetséges a CRAN-on való közzététel. Használata nagy segítséget jelent azoknak, akik eddig infrastrukturális problémák miatt nem vágtak bele R package-ek fejlesztésébe.
További előadások témái feltöltés alatt.
EN summary: this will be a Hungarian speaking event featuring several shorter talks on various R packages and useful tricks.

Sponsors
Tippek, trükkök, csomagok