step_forward(x, 1)
Details
Menetrend:
18:00 -- 19:00 Adatvizualizációs alapok a ggplot2 csomaggal (kezdőknek)
19:00 -- 19:15 Szünet (gyors pizzázás, hogy bírjuk szusszal a végéig)
19:15 -- 20:15 Szűr, szabdal, olvaszt, átalakul: a data.table csomag (haladóknak)
20:00-tól kötetlen program, jól megérdemelt pihenés
Adatvizualizációs alapok a ggplot2 csomaggal (kezdőknek)
Miután a legutóbbi alkalommal igazi RStudio ninják lettünk, áprilisban megpróbáljuk beleásni magunkat a ggplot2 rejtelmeibe.
A tavalyi PISA eredményeket vizualizálva megtanuljuk,
• miket is hívunk “rétegeknek” vizualizáláskor,
• hogyan gyártunk nagyon gyorsan egyszerű pont-pont diagramot és hisztogramot és
• mik az alapvető finomhangolási lehetőségeink, hogy az ábránk ne csak hasznos legyen, de jól is nézzen ki.
Ajánlott előismeret: nincs.
Telepítési előkészület: ggplot2 csomag.
Az adatsort itt találjátok: https://raw.githubusercontent.com/rladies/meetup-presentations_budapest/master/Meetup_2017_04_19/pisa_hun_small.csv
A szkript vázát, amivel dolgozni fogunk pedig itt: https://raw.githubusercontent.com/rladies/meetup-presentations_budapest/master/Meetup_2017_04_19/exercises.R
Kérünk Benneteket, telepítsétek a csomagot (telepítési útmutató lenn) és letöltött adatsorral és szkript vázlattal érkezzetek.
Szűr, szabdal, olvaszt, átalakul: a data.table csomag 2. rész (haladóknak)
A márciusi meetup-on elkezdett data.table-lel való ismerkedést folytatjuk, a következőkkel:
• Group by, azaz csoportokon definiált műveletek
• Sorbarendezés
• Műveletek megadása egyszerre több oszlopon (.SD)
• Set key, azaz kulcsok beállítása, amitől bizonyos műveletek még hatékonyabbak lesznek
• Rolling join
• Reshaping: melt és dcast
Két input adatot fogunk használni, ebből az elsőt márciusban már megismertük:
https://github.com/hyzhangsf/stat133-1/blob/master/datasets/starwars.csv
Természetesen minden segédanyagot megtaláltok majd utólag a weben, mégis nagyon jó lenne, ha minél többen hoznátok notebookokat, hogy ott helyben ki is tudjátok próbálni a kódrészleteket.
Hogyan készüljetek a meetupra?
Három dologra lesz szükségetek a gépeteken:
• Magára az R interpreterre ( http://cran.rapporter.net/ )
• Egy okos-ügyes fejlesztőkörnyezetre, ami segíti a hatékony munkát, ez a mi esetünkben az RStudio lesz ( https://www.rstudio.com/products/rstudio/download/ )
• Azokra a speciális csomagokra, amit az adott alkalmon részletesebben megismerünk: az április meetup esetén ez a ggplot2 és a data.table lesz.
A részletes telepítési lépéseket Windows operációs rendszer fölött itt találjátok (https://github.com/rladies/meetup-presentations_budapest/blob/9dc7f8e35f0467e31a814be5fc1ec033bf593630/Meetup_2017_03_23/03_23_install_guide.pdf). Ebben a data.table telepítését mutatjuk be, de a ggplot2 csomagé ugyanúgy működik.
Ha bármi gond adódna a telepítéssel/letöltéssel, kezdés előtt még nyugodtan kérdezzetek.