mutate(x)


Details
Menetrend:
18:00 -- 19:00 Adattranszformációs bevezető a tidyverse világba (kezdőknek)
19:00 -- 19:15 Szünet (gyors pizzázás, hogy bírjuk szusszal a végéig)
19:15 -- 20:15 Szűr, szabdal, olvaszt, átalakul: a data.table csomag (haladóknak)
20:15-től kötetlen program, jól megérdemelt pihenés
------------------------------------------------------------------------------
Adattranszformációs bevezető a tidyverse világba (kezdőknek)
A legutóbbi alkalommal remek ggplot2 ábrákat készítettünk, de még csak a PISA adatsor eredeti változóiból rajzoltunk. De mi történik akkor, ha némileg módosított értékekkel szeretnénk dolgozni?
A májusi alkalmunkon szintet lépünk és kipróbáljuk az alapvető adattranszformációs műveleteket, például megtanuljuk
• mit hívunk széles és hosszú adatszerkezetnek,
• hogyan transzformáljuk egyiket a másikba,
• mi is az az ún. pipe (%>%) operátor és miért szeretik annyira a fejlesztők,
• miért olyan hasznos, hogy a tidyverse csomagok adattípusai (többé-kevésbé) kompatibilisek egymással
Ajánlott előismeret: nincs.
Telepítési előkészület: a tidyverse csomaghalmaz.
Figyelem: a tidyverse több, egymással kompatibilis csomag összefoglaló neve. A komplett környezet egy kattintással telepíthető a megszokott módon, mintha csak egy tetszőleges package lenne. Mindenesetre ha a szokásosnál kicsit több szöveget láttok a konzolban ne ijedjetek meg, sok mindent telepítetek a háttérben. :)
Továbbra is a PISA adatsorral dolgozunk: : https://raw.githubusercontent.com/rladies/meetup-presentations_budapest/master/Meetup_2017_04_19/pisa_hun_small.csv ,
a kiinduló szkript vázát itt találjátok: https://github.com/rladies/meetup-presentations_budapest/blob/master/Meetup_2017_05_17/exercise.R .
Kérünk Benneteket, telepítsétek a környezetet és letöltött adatsorral és szkript vázlattal érkezzetek.
------------------------------------------------------------------------------
Szűr, szabdal, olvaszt, átalakul: a data.table csomag 3. rész (haladóknak)
A data.table mini-kuzus záróakkordjaként a következő témákat fogjuk érinteni:
• Set key, azaz kulcsok beállítása, amitől bizonyos műveletek még hatékonyabbak lesznek
• Rolling join
• Reshaping: melt és dcast
---------------------------------------------------------------------------------
Természetesen minden segédanyagot megtaláltok majd utólag a weben, mégis nagyon jó lenne, ha minél többen hoznátok notebookokat, hogy ott helyben ki is tudjátok próbálni a kódrészleteket.
Hogyan készüljetek a meetupra?
Három dologra lesz szükségetek a gépeteken:
• Magára az R interpreterre ( http://cran.rapporter.net/ )
• Egy okos-ügyes fejlesztőkörnyezetre, ami segíti a hatékony munkát, ez a mi esetünkben az RStudio lesz ( https://www.rstudio.com/products/rstudio/download/ )
• Azokra a speciális csomagokra, amit az adott alkalmon részletesebben megismerünk: az április meetup esetén ez a ggplot2 és a data.table lesz.
A részletes telepítési lépéseket Windows operációs rendszer fölött itt találjátok (https://github.com/rladies/meetup-presentations_budapest/blob/9dc7f8e35f0467e31a814be5fc1ec033bf593630/Meetup_2017_03_23/03_23_install_guide.pdf). Ebben a data.table telepítését mutatjuk be, de a tidyverse csomagé ugyanúgy működik.
Ha bármi gond adódna a telepítéssel/letöltéssel, kezdés előtt még nyugodtan kérdezzetek.

Sponsors
mutate(x)