Past Meetup

SER XXVI - Wizualizacje Modeli Statystycznych

This Meetup is past

158 people went

Details

Na najbliższym spotkaniu referaty z obszaru wizualizacji modeli statystycznych wygłoszą Agnieszka Sitko oraz Marcin Kosiński. Sponsorem spotkania jest firma 7N dzięki której możemy liczyć na pizzę i napoje.

############# O Sponsorze #############

7N jest duńską firmą oferującą projekty doświadczonym specjalistom IT. Wyróżnia nas przejrzystość warunków finansowych, dobra opieka nad konsultantami i swoboda we współpracy (np. brak umów lojalnościowych). Posiadamy bogate portfolio klientów – ok 40 firm z różnych branż – zdecydowana większość z nich to międzynarodowe korporacje, choć zdarzają się również perspektywiczne startupy.

##################### Plan spotkania #################

18:00 - 18:10 Prezentacja Sponsora - 7N

18:10 - 18:40 Agnieszka Sitko - factorMerger

18:40 - 19:10 Networking + pizza (dzięki 7N)

19:10 - 19:40 Marcin Kosiński - survminer

##################### Agnieszka Sitko ################

# factorMerger - hierarchiczna klasteryzacja i wizualizacja zmiennych jakościowych

Wnikliwa analiza zmiennej jakościowej może doprowadzić do zidentyfikowania podobieństw między jej poziomami, co z kolei pozwala na redukcję wymiarów i poprawę skuteczności modelu. We wskazaniu istotnych różnic pomocne mogą okazać się wielokrotne porównania post hoc. Jednak nie mamy gwarancji, że ich wyniki będą spójne i umożliwią jednoznaczy podział danych. Pakiet factorMerger udostępnia metody, które grupują poziomy zmiennej jakościowej w nieprzecinające się klastry. Pozwala także na hierarchiczną wizualizację przeprowadzonej analizy, co pogłębia zrozumienie struktury grup.

# BIO:

Data scientist, szczególnie zainteresowana wizualizacją danych i algorytmiką. Zawodowo analityk danych mediowych w MEC Analytics & Insight. Prywatnie miłośnik gotowania i smakosz dobrej kuchni.

################## Marcin Kosiński ######################

# survminer - wykresy analizy przeżycia pełne informacji i elegancji

survminer to pakiet w R, który na scenie analizy przeżycia wypełnia lukę wizualizacji estymatorów krzywych przeżycia w duchu 'Grammar of Graphics' (ggplot2). W trakcie prezentacji przedstawię jak wyjątkowo elastyczne i konfigurowalne jest to narzędzie do tworzenia wykresów krzywych przeżycia. Wyjaśnię także czym są te wykresy oraz jak je interpretować. Warto rozumieć tę metodologię, ponieważ skala zastosowań analizy przeżycia jest rozpięta niemalże nad każdą dziedziną życia - od kontroli jakości żarówek, przez wyliczanie składek ubezpieczeniowych aż do badań klinicznych nad nowotworami. Jeżeli starczy czasu zaprezentuję także funkcjonalności survminer'a do diagnostyki i sprawdzenia założeń modelu Coxa proporcjonalnych hazardów - najbardziej popularnej metody statystycznej w analizie przeżycia, która niekoniecznie jest najlepiej rozumiana.

# BIO:

Marcin Kosiński jest wiernym entuzjastą pakietu statystycznego R. Wykorzystywał pakiet R w obszarze spersonalizowanej rekomendacji artykułów w czasie rzeczywistym na portalu wp.pl, w ramach stanowiska Data Scientist w Grupie Wirtualna Polska, gdzie pracował przez 30 miesięcy (do marca 2017). Od początku 2017 freelanceR (http://r-addict.com/ (https://l.facebook.com/l.php?u=http%3A%2F%2Fr-addict.com%2F&h=ATP0ce0g66GOB6uagKBXCvCGrVLeLLbxpsVckKiICAHyU3iAkmhdHgnjiDIk1QVQ4_CM1padlcd2kFq-2DMso_2Zbn4_g-2Wg2eUjKQUHMUkJ1Z64UDutC3v4VgZ83Z0fjb1q6zy)). Organizator Warszawskich Spotkań Entuzjastów R (wser.pl) oraz główny organizator Ogólnopolskiej Konferencji Użytkowników R – Why R? 2017 (27-29 września, Warszawa) (http://whyr.pl/). Z wykształcenia absolwent Statystyki Matematycznej i Analizy Danych na Politechnice Warszawskiej. Pasjonat modeli analizy przeżycia i biostatystyki – wciąż poszukuje nowych pomysłów na wizualizacje wyników z tych obszarów.