Tidyverse - przegląd nowinek


Details
Dwie prezentacje związane z szybko rozwijającym się tidyverse.
Wybrane aspekty upoRządkowanego uniweRsum przybliżą nam Adam Wróbel i Piotr Ćwiałkowski (jeżeli znajdzie się jeszcze jeden chętny to zapraszamy).
Adam Wróbel:
Temat: Pakiet purrr alternatywą dla rodziny funkcji lapply
Opis prezentacji:
Bardzo często pracując z R spotykamy się z potrzebą wykonania tej samej operacji na wielu obiektach. Przykładem może być wykorzystanie funkcji lapply do wykonania danej funkcji na każdym elemencie listy. Tą samą funkcjonalność w bardziej ustrukturyzowanej formie zapewnia kolejny pakiet od Hadleya: purrr. Podczas prezentacji pokażę jak purrr wpisuje się w Tidyverse oraz czemu moim zdaniem warto zacząć stosować purrr.
BIO:
Entuzjasta R i data science, współorganizator eRka (Krakowska społeczność R). Ukończył metody ilościowe na SGH. Zawodowo związany z modelowaniem ryzyka: obecnie w zespole walidacji modeli ryzyka kredytowego w UBS, wcześniej jako aktuariusz w Nationale Nederlanden.
Piotr Ćwiakowski:
Temat: Ggplot czy ggproto? O przydatnych rozszerzeniach pakietu ggplot2.
Odkąd w ggplot2 dostępny jest oficjalny mechanizm do tworzenia funkcji geom, stat czy position, w R-owej społeczności zaroiło się od autorskich rozszerzeń pakietu Hadleya. Niektóre z nich znakomicie ułatwiają wizualizację danych w ggplot2 – na przykład pakiet ggrepel, który zapobiega nakładaniu się na siebie etykiet na wykresie. Niestety nie wszyscy mają czas śledzić R-bloggers i media społecznościowe w poszukiwaniu innowacji R-owych. A szkoda – skoro od pierwszej wizualizacji danych do wykresu w standardzie publikacyjnym droga jest długa i żmudna, to czemu nie skorzystać z gotowych rozwiązań? Bez automatyzacji, gotowych procedur oraz zdefiniowanych stylów nie da się efektywnie skrócić czasu poświęcanego na ślęczenie nad estetycznymi szczegółami. Na spotkaniu opowiem o najciekawszych dodatkach do ggplot2 oraz o filozofii tworzenia własnych funkcji w tym pakiecie.
Bio:
Jestem doktorantem na Wydziale Nauk Ekonomicznych Uniwersytetu Warszawskiego. Program R wykorzystuję obecnie głównie w analizach przestrzennych warszawskiego rynku nieruchomości oraz mikrosymulacjach (analiza polityki podatkowo-zasiłkowej Polski) a w wolnych chwilach poszerzam wiedzę o zastosowaniach R w biostatystyce. Od dwóch lat prowadzę szkolenia z analizy i wizualizacji danych (także w ggplot2) – najpierw na Uniwersytecie Otwartym UW a obecnie w ramach projektu edukacyjnego LabMasters (http://labmasters.pl/). ;

Sponsors
Tidyverse - przegląd nowinek