mutate(x)

This is a past event

60 people went

Location image of event venue

Details

Menetrend:

18:00 -- 19:00 Adattranszformációs bevezető a tidyverse világba (kezdőknek)

19:00 -- 19:15 Szünet (gyors pizzázás, hogy bírjuk szusszal a végéig)

19:15 -- 20:15 Szűr, szabdal, olvaszt, átalakul: a data.table csomag (haladóknak)

20:15-től kötetlen program, jól megérdemelt pihenés

------------------------------------------------------------------------------

Adattranszformációs bevezető a tidyverse világba (kezdőknek)

A legutóbbi alkalommal remek ggplot2 ábrákat készítettünk, de még csak a PISA adatsor eredeti változóiból rajzoltunk. De mi történik akkor, ha némileg módosított értékekkel szeretnénk dolgozni?

A májusi alkalmunkon szintet lépünk és kipróbáljuk az alapvető adattranszformációs műveleteket, például megtanuljuk

• mit hívunk széles és hosszú adatszerkezetnek,

• hogyan transzformáljuk egyiket a másikba,

• mi is az az ún. pipe (%>%) operátor és miért szeretik annyira a fejlesztők,

• miért olyan hasznos, hogy a tidyverse csomagok adattípusai (többé-kevésbé) kompatibilisek egymással

Ajánlott előismeret: nincs.

Telepítési előkészület: a tidyverse csomaghalmaz.

Figyelem: a tidyverse több, egymással kompatibilis csomag összefoglaló neve. A komplett környezet egy kattintással telepíthető a megszokott módon, mintha csak egy tetszőleges package lenne. Mindenesetre ha a szokásosnál kicsit több szöveget láttok a konzolban ne ijedjetek meg, sok mindent telepítetek a háttérben. :)

Továbbra is a PISA adatsorral dolgozunk: : https://raw.githubusercontent.com/rladies/meetup-presentations_budapest/master/Meetup_2017_04_19/pisa_hun_small.csv ,

a kiinduló szkript vázát itt találjátok: https://github.com/rladies/meetup-presentations_budapest/blob/master/Meetup_2017_05_17/exercise.R .

Kérünk Benneteket, telepítsétek a környezetet és letöltött adatsorral és szkript vázlattal érkezzetek.

------------------------------------------------------------------------------

Szűr, szabdal, olvaszt, átalakul: a data.table csomag 3. rész (haladóknak)

A data.table mini-kuzus záróakkordjaként a következő témákat fogjuk érinteni:

• Set key, azaz kulcsok beállítása, amitől bizonyos műveletek még hatékonyabbak lesznek

• Rolling join

• Reshaping: melt és dcast

---------------------------------------------------------------------------------

Természetesen minden segédanyagot megtaláltok majd utólag a weben, mégis nagyon jó lenne, ha minél többen hoznátok notebookokat, hogy ott helyben ki is tudjátok próbálni a kódrészleteket.

Hogyan készüljetek a meetupra?

Három dologra lesz szükségetek a gépeteken:

• Magára az R interpreterre ( http://cran.rapporter.net/ )

• Egy okos-ügyes fejlesztőkörnyezetre, ami segíti a hatékony munkát, ez a mi esetünkben az RStudio lesz ( https://www.rstudio.com/products/rstudio/download/ )

• Azokra a speciális csomagokra, amit az adott alkalmon részletesebben megismerünk: az április meetup esetén ez a ggplot2 és a data.table lesz.

A részletes telepítési lépéseket Windows operációs rendszer fölött itt találjátok (https://github.com/rladies/meetup-presentations_budapest/blob/9dc7f8e35f0467e31a814be5fc1ec033bf593630/Meetup_2017_03_23/03_23_install_guide.pdf). Ebben a data.table telepítését mutatjuk be, de a tidyverse csomagé ugyanúgy működik.

Ha bármi gond adódna a telepítéssel/letöltéssel, kezdés előtt még nyugodtan kérdezzetek.