Skip to content

Details

Menetrend:

18:00 -- 19:00 Adatvizualizációs alapok a ggplot2 csomaggal (kezdőknek)

19:00 -- 19:15 Szünet (gyors pizzázás, hogy bírjuk szusszal a végéig)

19:15 -- 20:15 Szűr, szabdal, olvaszt, átalakul: a data.table csomag (haladóknak)

20:00-tól kötetlen program, jól megérdemelt pihenés

Adatvizualizációs alapok a ggplot2 csomaggal (kezdőknek)

Miután a legutóbbi alkalommal igazi RStudio ninják lettünk, áprilisban megpróbáljuk beleásni magunkat a ggplot2 rejtelmeibe.

A tavalyi PISA eredményeket vizualizálva megtanuljuk,

• miket is hívunk “rétegeknek” vizualizáláskor,

• hogyan gyártunk nagyon gyorsan egyszerű pont-pont diagramot és hisztogramot és

• mik az alapvető finomhangolási lehetőségeink, hogy az ábránk ne csak hasznos legyen, de jól is nézzen ki.

Ajánlott előismeret: nincs.

Telepítési előkészület: ggplot2 csomag.

Az adatsort itt találjátok: https://raw.githubusercontent.com/rladies/meetup-presentations_budapest/master/Meetup_2017_04_19/pisa_hun_small.csv

A szkript vázát, amivel dolgozni fogunk pedig itt: https://raw.githubusercontent.com/rladies/meetup-presentations_budapest/master/Meetup_2017_04_19/exercises.R

Kérünk Benneteket, telepítsétek a csomagot (telepítési útmutató lenn) és letöltött adatsorral és szkript vázlattal érkezzetek.

Szűr, szabdal, olvaszt, átalakul: a data.table csomag 2. rész (haladóknak)

A márciusi meetup-on elkezdett data.table-lel való ismerkedést folytatjuk, a következőkkel:

• Group by, azaz csoportokon definiált műveletek

• Sorbarendezés

• Műveletek megadása egyszerre több oszlopon (.SD)

• Set key, azaz kulcsok beállítása, amitől bizonyos műveletek még hatékonyabbak lesznek

• Rolling join

• Reshaping: melt és dcast

Két input adatot fogunk használni, ebből az elsőt márciusban már megismertük:
https://github.com/hyzhangsf/stat133-1/blob/master/datasets/starwars.csv ­

https://raw.githubusercontent.com/rladies/meetup-presentations_budapest/master/Meetup_2017_04_19/sw_friends.csv

Természetesen minden segédanyagot megtaláltok majd utólag a weben, mégis nagyon jó lenne, ha minél többen hoznátok notebookokat, hogy ott helyben ki is tudjátok próbálni a kódrészleteket.

Hogyan készüljetek a meetupra?

Három dologra lesz szükségetek a gépeteken:

• Magára az R interpreterre ( http://cran.rapporter.net/ )

• Egy okos-ügyes fejlesztőkörnyezetre, ami segíti a hatékony munkát, ez a mi esetünkben az RStudio lesz ( https://www.rstudio.com/products/rstudio/download/ )

• Azokra a speciális csomagokra, amit az adott alkalmon részletesebben megismerünk: az április meetup esetén ez a ggplot2 és a data.table lesz.

A részletes telepítési lépéseket Windows operációs rendszer fölött itt találjátok (https://github.com/rladies/meetup-presentations_budapest/blob/9dc7f8e35f0467e31a814be5fc1ec033bf593630/Meetup_2017_03_23/03_23_install_guide.pdf). Ebben a data.table telepítését mutatjuk be, de a ggplot2 csomagé ugyanúgy működik.

Ha bármi gond adódna a telepítéssel/letöltéssel, kezdés előtt még nyugodtan kérdezzetek.

Members are also interested in