Przejdź do treści

December'18 Warsaw R Enthusiasts

Zdjęcie użytkownika MarcinKosinski
Hosted By
MarcinKosinski
December'18 Warsaw R Enthusiasts

Szczegóły

On our next meetup, 6th Dec 18:00, we will have a chance to listen to
Dr Rafael de Andrade Moral and Filip Cyprowski.

Dr Rafael de Andrade Moral

Bio
I am a Lecturer in Statistics at Maynooth University, Ireland. I graduated in Biology and then obtained an MSc and a PhD in Statistics from University of São Paulo, Brazil. My research interests include the development and application of statistical modelling techniques to Biology and Agriculture, more specifically in relation to Animal Ecology. I am also interested in the computational implementation of statistical models, especially in the form of R code.

Title

Diagnostic Plots for Univariate and Bivariate Models (and Joint Models in Ecology)

Abstract

When using univariate models, goodness-of-fit can be assessed through many different methods, including graphical tools such as half-normal plots with a simulation envelope. This is straightforward due to the notion of ordering of a univariate sample, which can readily reveal possible outliers. In the bivariate case, however, it is often difficult to detect extreme points and verify whether a sample of residuals is a reasonable realisation from a fitted model. We propose a new framework, implemented as the bivrp R package, available on the Comprehensive R Archive Network. Our framework uses the same principles of the simulation envelope in a half-normal plot, but as a simulation polygon for each point in a bivariate sample. By using algorithms of convex hull construction and polygon area reduction, we describe how our method works and illustrate its functionality with examples using simulated bivariate normal data and real bivariate count data on animal ecology. We show how different model diagnostics can produce different results and pinpoint potential drawbacks of our approach, such as the limitations in terms of computational burden and convex hull bias.

Filip Cyprowski

Bio

Od 8 lat związany z analizą danych i tworzeniem aplikacji analitycznych. Przez długi czas przewodniczył teamowi data science w Sotrender, obecnie buduje zespół w Lingaro w skład którego wchodzą deweloperzy piszący w różnych językach i technologiach. Od trzech lat doświadczenia na tym polu stara się przekazać studentom kierunku Data Science na Politechnice Białostockiej. Prywatnie wielki fan Scali, Google Cloud Platform i strasznych filmów.

Title

"That's a bad idea": R in production environment

Abstract

R powstał w środowisku statystyków i miał zastąpić raczej rozpowszechnione w środowisku analityków oprogramowanie do analizy danych (SAS, SPSS itd.), nie języki programowania służące do budowania złożonych aplikacji webowych. Nic dziwnego, że wśród deweloperów pomysły budowania w R rozwiązań produkcyjnych budzą - w najlepszym przypadku - zdziwienie. Prezentacja udowodni, że R nie tylko sprawdzi się jako język backendu, ale też że - zwłaszcza w aplikacjach zależnych od dużych zbiorów danych - może być językiem pierwszego wyboru.
Tagi: software engineering, docker, test driven development, microservices, SOA

Photo of R Users & R-Ladies Warsaw (Spotkania Entuzjastów R) group
R Users & R-Ladies Warsaw (Spotkania Entuzjastów R)
Zobacz więcej wydarzeń