OktóbeR
Details
Októberben ismét bátorítunk mindenkit, aki még nem foglalkozott R-rel, hogy kezdjen bele. Ehhez egy kezdő R oktatással indítunk, amit Pázmándi Eszter tart.
Természetesen azokra is gondoltunk, akik már gyakorlott R felhasználók, nekik a meetup második felében Tarnói Csegne fog exploratory data analysis workshopot tartani a 2019-es useR! konferencián tanultakról, Di Cook “Visualising High-Dimensional Data” című tutorialja alapján.
Pázmándi Eszter: R bevezető / ismétlés az alapokról
A workshopot mindazok számára ajánljuk, akik még nem ismerik, most ismerkednek az R programozási nyelvvel vagy szeretnék átismételni az alapokat.
Előismeretre nincs szükség, de ha van már tapasztalatod más programnyelvekben vagy foglalkozol adatelemzéssel, az mindenképp előnyt jelent.
A főbb témák, amelyeket érinteni tervezünk:
- mi az az R Studio és hogyan használjuk az R-t?
- R csomagok, objektumok, adatok beolvasása
- adatok rendezése és transzformálása
- adatvizualizáció
R és RStudio telepítési segédletet a következő linken találtok: https://github.com/rladies/meetup-presentations_budapest/blob/master/Meetup_2019_01_21/R_installation_guide_R_Ladies_Meetup_2019_January_HU.pdf
Kérünk titeket, hogy vagy otthon készítsétek elő a környezetet a számítógépeteken, vagy érkezzetek az előadások kezdete előtti sávban, hogy legyen idő megtenni a szükséges lépéseket - személyesen többen is tudunk majd segíteni a helyszínen.
------
Tarnói Csenge: Exploratory data analysis
Az exploratory data analysis, röviden EDA az adat megismerésére irányuló módszer, aminek fontos eleme a vizualizáció. Az EDA alapvető fontosságú első lépés, megalapozza az adattisztítást, az adattranszformációt és a hipotézis felállítását. Miért? Mert ahhoz, hogy az adatot megtisztítsuk, tudnunk kell hol „piszkos” és milyen problémák vannak vele, az adatok transzformálása előtt pedig érdemes megismerni, hogy milyen értékekből tudunk dolgozni. A folyamat másik célja mintázatok, összefüggések megfigyelése az adathalmazban, amik mentén az elemzés későbbi lépéseiben tovább haladhatunk.
Az anyag a 2019-es UseR! konferencián, Di Cook által tartott „Visualising High-Dimensional Data” című tutorial alapján állt össze. A workshopon röviden ismertetésre kerül az EDA története és fontosabb eszközei, ezután kódolás következik!
















