• Données en grande dimension et médecine de précision : promesses et défis.

    Presentation par Chloé-Agathe Azencott Abstract : Deux patients présentant les mêmes symptômes n'ont pas nécessairement la même maladie, au sens ou celle-ci peut évoluer de manière très différente, et qu'un même traitement peut avoir des effets très différents. De ce constat est née la médecine personalisée, ou médecine de précision, qui vise à aussi adapter la stratégie thérapeutique aux spécificités des patients. Or ces différences entre patients s'expliquent en partie par des différences génomiques. Mettre en œuvre la médecine de précision requiert donc d'identifier, dans des jeux de données génomiques, les variables associées à la présence d'une maladie, à son évolution, ou à une réponse thérapeutique. Cependant, ces jeux de données comportent fréquemment largement plus de variables (pouvant aller jusqu'à la dizaine de millions) que d'échantillons (plus classiquement de l'ordre de quelques milliers), ce qui pose des problèmes tant calculatoires que statistiques. Dans cet exposé, je présenterai comment utiliser des connaissances a priori sur la structure des variables, qu'il s'agisse de contraindre la sélection de variables grâce à des réseaux biologiques, ou pour tenir compte des corrélations entre régions du génome, pour répondre à ces difficultés. Chloé-Agathe Azencott est chercheur au Centre for Computational Biology (CBIO) de Mines ParisTech, Institut Curie and INSERM. Elle est aussi co-fondatrice de Woman in Machine Learning and data Science de Paris. https://cazencott.info http://wimlds.org/about-the-paris-team/

  • Analyse en Composant Principal (ACP) et cluster avec le package FactoMineR

    FactoMineR est un package R dédié aux analyses factorielles. Durant ce meet up, Nancy Rebout va nous montrer comment effectuer une analyse en composantes principales (ACP) suivie d'une classification hiérarchique ascendante en utilisant FactoMineR sur une interface tout particulièrement "user friendly". Il suffit de cliquer sur les boutons ! Elle nous présentera également les deux packages liés à FactoMineR que sont Factoshiny et FactoInvestigate, deux packages qui valent la peine d'être connus et vous feront gagner un temps non négligeable. Nancy Rebout est doctorante en comportement animal et étudie plus spécifiquement la complexité des vocalisations chez différentes espèces de macaques. Nancy travaille également à mi temps dans une société privée où elle effectue de la modélisation dans le domaine de l'écologie.

  • Reticulate: interface entre R et Python

    Epitech

    Reticulate c'est un R package utilise pour utiliser Python et R ensemble, https://rstudio.github.io/reticulate/. Camille Beluffi, data scientist chez CASC4DE, nous ferait un retour d'experience sur cette package. 18:30 Accueil 18:40 Presentation 18:55 Discussion

  • Fluctuat nec mergitur - comment être un·e utilisateur·rice de R résistant·e

    Travailler avec R peut parfois être douloureux : erreurs dans le code, procédés un peu trop compliqués, etc. Dans cette présentation je donnerai des éléments pour réduire votre frustration liée à R en vous aidant à 1) rester informé·e·s 2) mieux gérer vos questions et bogues. Pendant la présentation je vous montrerai comment utiliser les paquets reprex et gistr pour bien poser vos questions. J'espère aussi partager autour de *vos* stratégies pour être un·e utilisateur·rice de R bien informé·e et résistant·e ! Presentation par Maëlle Salmom: masalmon.eu Working with R can involve some pain: errors in scripts, cumbersome workflows, etc. In this talk I shall give tips for reducing your overall frustration with R by helping you 1) stay informed and 2) better deal with your questions&bugs. The talk will feature a live demonstration of the reprex and gistr packages for efficient question asking. I also hope to hear about *your* strategies to be a well-informed, resilient R user!

    2
  • Outils et modèles statistiques pour l'allocation dynamique

    Lorsqu'un utilisateur (par exemple un médecin) doit réaliser un choix entre une ancienne et une nouvelle solution (par exemple un vaccin), il faut déterminer le plus vite possible si le nouveau produit doit être adopté ou l'ancien maintenu. Toute erreur se traduirait en pertes (comme par exemple des pertes humaines). Cette problématique peut également se retrouver dans de nombreux secteurs, comme par exemple la publicité en ligne (où l'utilisateur doit mettre en place deux publicités différentes) ou la finance. Cependant, il est nécessaire de collecter suffisamment de données pour trouver la meilleure solution (explorer) avant de pouvoir la mettre en production (c'est-à-dire exploiter). Les algorithmes de bandits ont été introduits pour répondre à ce genre de problématique : à quel moment dois-je stopper mon exploration pour démarrer mon exploitation? Autrement dit : comment trouver la meilleure solution tout en minimisant les pertes? Emmanuelle Claeys est doctorante à l'Universite de Strasbourg. http://www.emmanuelle-claeys.com/ Programme de la soirée: 18:30 Accueil 18:40 Presentation par Emmanuelle Claeys 19:10 Discussions

    1
  • Statistics et analyse de données avec R

    Epitech

    Myriam Maumy-Bertrand, enseignant chercheur à l’IRMA et membre de CEMOSIS, nous parlera de comment elle se sert du logiciel R pour rendre la statistique mathématique vivante (si la statistique peut vivre…) A travers des exemples de la vie quotidienne et des jeux de données, elle abordera quelques fonctions de R et quelques packages incontournables si on veut faire de l’analyse de données dans le monde du Big Data.

  • Fouille de textes avec R: expression régulier.

    Location visible to members

    Dans ce meetup le theme est la fouille de textes. Une presentation sur comme manipuler de textes avec le function basic de R (grep, grepl, etc...) et avec le package stringr (https://cran.r-project.org/web/packages/stringr/vignettes/stringr.html) serait fait. Nous verrons comment extraire de valeur numérique et des tables dans un text. La presentation serait fait par Rita Giordano. For this meetup will be presented a talk on how to manipulate string with R using the basic function as grep and the packages stringr (https://cran.r-project.org/web/packages/stringr/vignettes/stringr.html). We will see how to extract numerical value and tables from a text file. The presentation will be performed by Rita Giordano.

  • R-Ladies Strasbourg Introductory meetup

    Location visible to members

    In this meetup R-Ladies Global will be introduced, which is a global organisation of woman programming in R. I will also talk about the local R-Ladies Strasbourg and we will discuss about what we would like to talk for the future meetings. Before the meeting could you please take 5 minutes to take this survey (https://docs.google.com/forms/d/e/1FAIpQLSenZZnX_Go5gauWlMrc_kjIHs52fq73LsNhY314QggTKkZsww/viewform)? Dans ce meetup nous allons faire une introduction sur R-Ladies Global, une association des femmes dans la programmation R. Une presentation sur l'association locale R-Ladies Strasbourg sera fait. Pourriez vouz completer une questionnaire (https://docs.google.com/forms/d/e/1FAIpQLSenZZnX_Go5gauWlMrc_kjIHs52fq73LsNhY314QggTKkZsww/viewform) avant le meetup, s'il vous plait?