• Październikowe SERy
    SERy wracają po wakacjach z dwoma super prelekcjami: Alicja Gosiewska opowie o pakiecie auditor do diagnostyki Black Boxów, a Damian Rodziewicz o analizie danych satelitarnych w R. Agenda: 18:00 - 18:05 Powitanie 18:05 - 18:35 Prezentacja Alicji i pytania 18:35 - 19:05 - Pizza 19:05 - 19:35 Prezentacja Damiana Afterparty w pobliskim pubie. Spotkanie sponsoruje firma Appsilon. Bio's: Alicja jest doktorantką na Wydziale Matematyki i Nauk Informacyjnych Politechniki Warszawskiej. Ukończyła matematykę na Wydziale MIM UW oraz Statystykę Matematyczną i Analizę Danych na Wydziale MiNI PW. Obecnie zajmuje się zagadnieniami diagnostyki modeli uczenia maszynowego oraz xAI (wyjaśnialną sztuczną inteligencją). Działa w organizacji R-Ladies, gdzie prowadzi szkolenia z programowania w języku R. Współorganizuje również Konferencję WhyR?. Damian uważa się za maniaka technologii, co jest trafne, biorąc pod uwagę, że jest współzałożycielem i głównym architektem w Appsilonie. Ma tytuł magistra informatyki MIM UW oraz ukończył studia podyplomowe z zakresu prawa menedżerskiego. Przed założeniem Appsilon pracował w Accenture, UBS, Microsoft i Domino Data Lab. Jest zagorzałym pływakiem i amatorem psychologii. Abstrakty: **Pakiet auditor** Uczenie maszynowe z powodzeniem znajduje zastosowanie w różnych obszarach nauki oraz biznesu. Odgrywa ono istotną rolę w biologii, medycynie, fizyce, finansach oraz wielu innych dziedzinach. Jednakże, poważny problem stanowią modele, które zawodzą w konfrontacji z rzeczywistymi danymi. Dlatego też, tak ważna jest ich wcześniejsza walidacja. Podczas prezentacji opowiem o pakiecie auditor, który służy do diagnostyki dowolnych modeli predykcyjnych. Pakiet umożliwia, między innymi, identyfikację wartości odstających i obserwacji wpływowych. Ponadto, ułatwia ocenę dokładności oraz jakości dopasowania modelu. Może być wykorzystany również do analizy podobieństwa reszt. Walidacja przeprowadzana jest na podstawie statystyk diagnostycznych oraz oceny wizualnej. **Using deep learning on Satellite imagery to get a business edge** Deep learning daje nowe możliwości analizy zdjęć satalitarnych. Dane satelitarne pozwalają dotrzeć do informacji niedostępnych w biznesie i podróżować w czasie. W połączeniu z zaawansowanymi technikami deep learningu dostarczają wnioski, które nie były wcześniej dostępne dla człowieka, ze względu na rozmiar i nieoczywistość obrazów. Dzięki możliwości powrotu do arbitralnego punktu w czasie możemy zapobiegać oszustwom. Możemy budować prognozy i obserwować zdarzenia, do których nie mielibyśmy dostępu w inny sposób. Zbadamy wiele pojawiających się przypadków użycia danych staleitarnych i ich wspólne cechy. Pokażemy, jak pracujemy z danymi satelitarnymi w R i jak używamy Shiny do budowania systemów wspomagania decyzji dla biznesu.

    Sala 329 Wydział MINI PW

    Koszykowa 75 · Warsaw

    6 comments
  • After Why R? beeR
    We are gathering to grab a beeR and talk about R initiatives for this and the next year. An excellent occasion to see people you've met at Why R? 2018 conference. #shmoozing

    Politechnika Warszawska, Wydział MINI

    ul. Koszykowa 75 · Warsaw

    6 comments
  • RxConsulting
    Przed nami ostatni SER przed wakacjami! Tym razem będziemy gościć prelegentów, którzy zawodowo związanie są z firmą McKinsey i pokażą jakie ciekawe projekty consultingowe można realizować przy wykorzystaniu R. Speakers: Michal Siwek - Data Science Expert and Mateusz Zawisza - Data Science Specialist. Mateusz Zawisza Bio Zdobywał doświadczenia analityczne podczas realizacji projektów w Polsce i zagranicą, w zakresie projektowania i implementacji analitycznych narzędzi wspomagania decyzji, a także rozwoju procesów i kompetencji analitycznych u Klientów z branż: handlu detalicznego i hurtowego, produkcyjnej, telekomunikacyjnej, finansowej, a także sektora publicznego. Absolwent SGH na kierunku Metod Ilościowe w Ekonomii i Systemy Informacyjne oraz Studium Doktoranckiego w Kolegium Analiz Ekonomicznych SGH. Współautor podręcznika "Receptury w R" i ponad 10 publikacji z zakresu ekonomii i zarządzania ilościowego. Od 10 lat prowadzi zajęcia w Szkole Głównej Handlowej w obszarze analityki predykcyjnej i decyzyjnej, ostatnio, jako wykładowca na studiach podyplomowych SGH "Inżynieria danych - Big Data". Presentation title Multidyscyplinarny obraz dzisiejszego data scientisty na przykładzie projektów analitycznych McKinsey&Company Abstract Na przykładzie projektu optymalizacji cen w globalnej sieci detalicznej przedstawione zostaną główne etapy analityczne tego projektu oraz wybrane zagadnienia, których zaadresowanie wymagało łączenia interdyscyplinarnych metod analitycznych. W trakcie prezentacji poruszone będą kwestie związane z m.in. radzeniem z przekleństwem wymiaru, konsekwencjami niewłaściwego modelowania heterogenicznych obiektów, uwarunkowaniami stosowania metod machine learningu i ekonometrii, czy wsparciem decydenta w obliczu sprzecznych celów biznesowych. Michal Siwek Bio Michał jest Ekspertem Data Science w McKinsey Analytics. Ma doświadczenie w zakresie kompleksowych analiz danych w dziedzinie opieki zdrowotnej, biotechnologii, sektora publicznego, bankowości, marketingu oraz produkcji. Przed dołączeniem do McKinsey Michał pracował przez wiele lat w bankowości jako specjalista ds. zarządzania ryzykiem kredytowym. Michał uzyskał tytuł magistra inżyniera informatyki na Politechnice Wrocławskiej i odbył studia doktoranckie w Szkole Głównej Handlowej w Warszawie. Presentation title Eksperymenty analityczne w sprzedaży Abstract Opracowanie strategii wdrożenia rozwiązań analitycznych dla przedsiębiorstwa. Pokazanie wartości danych i sposobu ich użycia przez agentów sprzedaży/ Opracowanie prototypu przyjaznego dla użytkownika narzędzia obejmującego analizy klientów zmniejszających wartość transakcji, zmieniających udział w portfelu i analizy możliwości zwiększania sprzedaży poprzez sprzedaż krzyżową lub dodatkową. Agenda: 18-18:05 Welcome 18:05-18:10 Kilka słów od sponsora firmy McKinsey 18:10 - 18:40 Prezentacja 1 18:40-19:10 Pizza break 19:10-19:40 - Prezentacja 2 After party od 20 w pubie Znajomi Znajomych na Wilczej

    Sala 328 Wydziału Matematyki i Nauk Informacyjnych Politechniki Warszawskiej

    ul. Koszykowa 75 · Warsaw

    3 comments
  • MaySER
    In May we will have 2 great presentations: 1) Krystian Igras from Appsilon Data Science "Data validation understandable for business with assertr package" 2) Patricia Martinkova from Department of Statistical Modelling, Institute of Computer Science of the Czech Academy of Sciences "ShinyItemAnalysis for Psychometric Training and to Enforce Routine Analysis of Educational Tests" Presentations will take around 30 minutes each and we will have pizza break in between. Later we move to the bar near by. Event will be in English. Abstracts: "Data validation understandable for business with assertr package" Nowadays, more and more organizations transform their business using data collected over years. Its analysis can help with making appropriate business decisions. One of the most important stages of such analysis is continuous examination of the data's condition. It turns out that the data validation process should be carried out at many stages of analysis, so we need flexible tool that allows us to perform validation for each one. We decided to choose assertr from many possible packages which outperforms other tools with provided features. I will discuss most of them in my presentation. During the analysis, we learn more about data and related problems. Well-run communication concerning state of the data can result with improvement of data collection processes, its condition, and allow us to continue our work with better results. Nevertheless, it is common for analyses to be carried out in a language incomprehensible to business. I will show you how we solved this problem through minor improvements of assertr, and usage of shiny.semantic package to generate clear and elegant, yet understandable for business reports. BIOs: Patrícia Martinková is a researcher and vice-head at Department of Statistical Modelling, Institute of Computer Science of the Czech Academy of Sciences. She is also a researcher at Faculty of Education of the Charles University, where she is principal investigator of PRIMUS project Center for Educational Measurement and Psychometrics (CEMP). She is Fulbright alumna and[masked] visiting research scholar with the Center for Statistics and the Social Sciences, and an affiliate assistant professor at Department of Statistics, University of Washington. Her current research focuses on developing models and estimators for measuring the quality of educational tests and psychological assessments with focus on admission and selection process. http://www.cs.cas.cz/martinkova/ Krystian Igras is a Data Scientist at Appsilon Data Science. He is finishing his studies at Warsaw University Match department. In his Master thesis he is contributing to DALEX package - ML black box explainer. True R and Shiny enthusiast who enjoys sharing his knowledge.

    Sala 329 Wydział MINI PW

    Koszykowa 75 · Warsaw

  • Machine learning in R
    We are going to have a super interesting meeting in April. Two talks focused on machine learning. This meeting will be in English. It is a part of Why R? 2018 conference pre-meetings. 14:00 - 16:00 (90 min + 30 min for discussion) First talk will be given by our special guest - professor Bernd Bischl from Ludwig-Maximilians-University Munich. He is an author of many R packages, among all the mlr (Machine Learning in R), a very interesting framework for machine learning modelling. During his talk he will introduce the logic behind mlr, walk over more advance cases, show some demos and share insight about the most recent developments like iml package. 16:00 - 17:30 (60 min + 30 min of discussion) Second talk will be given by Mateusz Staniak and Przemyslaw Biecek. It will be focused on selected explainers for machine learning models implemented in the family of DALEX packages, like: live, breakDown, auditor and factorMerger. 17:30 - ... (pizza+networking sponsored by WLOG Solutions)

    Sala 329 Wydział MINI PW

    Koszykowa 75 · Warsaw

    4 comments
  • Rozstrzygnięcie konkursu Data Science Masters na najlepszą pracę z DS i ML
    • What we'll do Zapraszamy na galę finałową z okazji rozstrzygnięcia konkursu Data Science Masters. W konkursie na najlepszą pracę magisterską otrzymaliśmy 72 świetne zgłoszenia z 11 różnych uczelni. Podczas gali przedstawimy tematykę najciekawszych prac magisterskich i usłyszymy trzy wystąpienia osób, które otrzymały nagrodę w tym konkursie. Warto przyjść, posłuchać i porozmawiać. • What to bring • Important to know

    Politechnika Warszawska, Wydział MINI

    ul. Koszykowa 75 · Warsaw

  • SER XXXI: Analiza mowy + Świat dla Małych i Dużych
    • What we'll do Tym razem we wtorek! Bezpiecznie o 18:15! 2 prezentacje 18:15-18:45 Danijel Koržinek - Korpusowa analiza mowy w języku R 18:45-19:15 Networking i pizza 19:15-19:45 Daniel Rodak - Świat dla Małych i Dużych - wykorzystanie języka R do popularyzacji nauki 20:00 - afterparty: Pizza przy Politechnice Opisy poniżej # Korpusowa analiza mowy w języku R Dzięki szybkiemu rozwojowi technologii można zautomatyzować wiele zadań związanych z analizą dużych zbiorów nagrań mowy. Takie rozwiązania mają szczególnie duże znaczenie dla różnych dziedzin nauki wykorzystujących w swoich badaniach wielkie korpusy mowy: w lingwistyce, psychologii, socjologii, nawet medycynie. Badania te polegają na mierzeniu różnych wskaźników występujących w nagraniach mowy i porównaniu ich wśród wybranej populacji, w zależności od przeznaczenia. Jako narzędzie łączące wszystko całość z punktu widzenia użytkowników, na świecie wybrano środowisko R. Celem prezentacji będzie zademonstrowanie takiej pracy badawczej na kilku przykładach oraz dyskusja na temat wdrożenia tego typu rozwiązań w Polsce. # BIO: Danijel Koržinek jest adiunktem na Polsko-Japońskiej Akademii Technik Komputerowych. Od kilkunastu lat się zajmuje rozpoznawaniem mowy i pokrewnymi dziedzinami. Uczestniczył w kilku projektach związanych z rozpoznawaniem mowy: w środowisku telefonicznym, do transkrypcji posiedzeń Senatu RP, transkrypcji radia i telewizji, tłumaczenia mowy. Obecnie jest uczestnikiem projektu Clarin-PL, którego celem jest przygotowanie infrastruktury badawczej w dziedzinie nauk humanistycznych i socjologicznych. Poza tym, jest miłośnikiem różnych tematów uczenia maszynowego i ostatnio również języka R. -------------------------------------------------------------------------------------------------------------------------------- # Świat dla Małych i Dużych - wykorzystanie języka R do popularyzacji nauki Bardzo często deklaracja, że ktoś zajmuje się fizyką budzi w ludziach pewien niepokój. Chciałbym pokazać, że zrozumienie fizyki nie jest niemożliwe. Błędem edukacji szkolnej, który jest przyczyną takiego przeświadczenia, jest nacisk na liczenie i zaniedbywanie zrozumienia. Założyłem bloga, którego celem jest wypełnienie tej luki. W jego tworzeniu użycie języka R i wszystkich możliwości jakie daje jest ogromną pomocą. Pokażę jak można wykorzystać wizualizację i analizę danych oraz Shiny do tłumaczenia fizyki w przystępny sposób. # BIO: Daniel Rodak jest absolwentem Inżynierii Nanostruktur na Wydziale Fizyki UW. Podczas studiów zajmował się zagadnieniami od chemii doświadczalnej po fizykę teoretyczną. Pasjonuje się tym jak działa nasz świat. Aby dzielić się tą pasją założył bloga (https://swiatdlamalychiduzych.blogspot.com) popularyzującego naukę, a wizualizacje i aplikacje pisane w R ułatwiają szerzenie wiedzy w zrozumiały sposób. • What to bring • Important to know

    Sala 107 Wydziału Matematyki i Nauk Informacyjnych Politechniki Warszawskiej

    ul. Koszykowa 75 · Warsaw

    3 comments
  • Wstęp do Shiny by iDash
    Bezpłatne szkolenie z podstaw Shiny przygotowane przez zespół iDash. Formularz rejestracyjny: https://idash.pl/20180125_shinyintro_darmowe_so.php Rejestracja jest konieczna na ten meetup!!!

    Politechnika Warszawska, Wydział MINI

    ul. Koszykowa 75 · Warsaw

    16 comments
  • Made in Warsaw
    W listopadzie posłuchamy o świetnych rozwiązaniach i pakietach R stworzonych nad Wisłą. Będzie i o Machine Learningu i o nowych rozszerzeniach do R – warto przyjść posłuchać. Zaczniemy (18:00-18:30) od prezentacji dr Michała Dramińskiego (IPI PAN) ''MCFS-ID (Monte Carlo Feature Selection and Interdependence Discovery)'' dotyczącej pakietu rmcfs (https://cran.r-project.org/web/packages/rmcfs/index.html) wspierającego wybór istotnych cech dla problemów małe n duże p.Michał ma bogate doświadczenie i w pracy badawczej i w biznesie (Netezza, IBM, iQor), więcej o nim można znaleźć tutaj: http://www.ipipan.eu/staff/m.draminski/index.html Drugą prezentację (18:40-19:10) poprowadzi dr Wit Jakuczun (WLOG Solution), który opowie o RSuite - wzbogaceniu R o funkcjonalności przydatne do dużych biznesowych wdrożeń. Więcej o RSuite można przeczytać tutaj: http://rsuite.io/ a o Wicie tutaj: http://whyr.pl/blog/guests/2017/02/22/Wit-Jakuczun.html Po prezentacjach gorąco pizza i czas na networking. Serdecznie zapraszamy!

    Sala 329 Wydział MINI PW

    Koszykowa 75 · Warsaw

    3 comments
  • Oktobe[R]fest
    Tym razem pomijamy część z prezentacjmi i zapraszamy wszystkich na wspólny wypad na piwo i rozmowy o R i nie tylko. Prosimy o RSVP aby wiedzieć ile miejsc zarezerwować w pubie.

    Artezan Pub

    Moniuszki 1a · Warsaw

    4 comments