Aller au contenu

Big-Data & Data-Science : édition d'avril

Photo de Anastasia Lieva
Hosted By
Anastasia L. et Julien L.
Big-Data & Data-Science : édition d'avril

Détails

Bonjour!

On réserve cette date pour le meet-up d'avril.

Voici le programme de ce meet-up :

  1. Speaker :Lauren Schroeder a travaillé pendant 3 ans dans l'industrie du manufacturing à créer des produits de base sans défauts en utilisant des méthodes statistiques. Elle vient du Milwaukee, Wisconsin. Aujourd'hui elle est étudiante en analyse de données, et elle réalise des projets concernant la capture, l'analyse, et la visualisation de données en utilisant Python.

La Loi de Benford. La loi de Benford indique que la fréquence d’apparition du premier chiffre significatif d’un nombre répond à une distribution prédéterminée. Après une explication de cette loi, on va voir les applications de la loi pour détecter les fraudes financières.

  1. Speaker: Benjamin Guinebertière est évangéliste technique à Microsoft France. Il accompagne des entreprises de tailles différentes (startups, PME, grands comptes) qui vont vers le cloud Microsoft, écoute et parle dans des meetups et autres événements pour rencontrer les communautés. Il a une expertise plus particulière sur le Big Data et le machine learning sur Azure. Infos online : http://3-4.fr

Dans ce talk, nous verrons un certain nombres de sujets autour du Big Data et du machine learning. Après une brève introduction sur les liens entre IoT, Machine Learning et Big Data, nous verrons différentes façons de décliner du Big Data avec une architecture Lambda ou une architecture Kappa. On verra également comment Azure permet de mettre en œuvre ces architectures que ce soit avec des technologies open source sur des VMs ou des conteneurs Docker, des services managés exposant des technos open source ou propriétaires Microsoft. On verra également rapidement les différentes briques de Machine Learning que Microsoft met à disposition.

Puis, on passera à un projet open source, « boontadata », qui permet de comparer différents moteurs de traitement au fil de l’eau, typiquement mis en œuvre dans une architecture Kappa ; il s’agit par exemple de Flink ou Spark Streaming dans le monde open source, ou encore Stream Analytics pour Azure. Cette comparaison se fait principalement sur des aspects de code et de résultats fonctionnels, et tire parti de Docker. C’est aussi l’occasion d’aborder quelques problématiques liées à des événements qui peuvent arriver en retard ou dans le désordre alors qu’on fait des agrégations sur des fenêtres de temps.

Photo of Big Data / Data Science Montpellier group
Big Data / Data Science Montpellier
Afficher d'autres événements