What we're about

Ce groupe cherche à créer un espace d'échange sur la commune de Rennes et ses alentours autour de la data science, le big data et le machine learning, par l'alternance d'interventions générales, sur des concepts et idées principales de la discipline, et applicatives, par la présentation de cas réels. Les intervenants auront des profils d'universitaires, d'entrepreneurs ou plus techniques comme des data scientists ou des data engineers et s'attacheront à présenter les derniers algorithmes en vogue, leurs derniers résultats de recherche ou encore leurs applications.

Upcoming events (2)

Classification de Binaires Windows via Apprentissage par Renforcement

Bonjour à tous, Le meetup ML va débuter sa nouvelle année 2019 avec l'intervention d'Olivier Gesny, responsable du Pôle Embarqué, Cybersécurité et IA au sein de Silicom. Il nous parlera d'une approche mêlant classification supervisée multiple et apprentissage par renforcement. Voici le resumé de sont intervention: "Cela fait maintenant plusieurs années que de nouvelles méthodes viennent enrichir le monde de l’intelligence artificielle pour répondre à des défis de notre société. C’est dans cette optique que Silicom a introduit une nouvelle approche dans la classification de binaires sains et malveillants de type Windows PE. Cette approche s’appuie sur des évolutions de l’algorithme d’apprentissage par renforcement Tangled Program Graphs (TPG) pour permettre la classification multiple de binaires. Le modèle développé introduit un objet mathématique doté de capacités d’apprentissage non supervisé de propriétés de l’environnement. Ce modèle montre de bonnes capacités de découvertes de règles métier pour faciliter le travail des analystes et des sondes de détection de binaires malveillants." Biographie: Baigné dans la datascience et la modélisation au début de sa carrière en R&D chez Bouygues Telecom, Olivier a rejoint Silicom en l'an 2000 pour exercer des activités d'Étude et Développement de produits et systèmes complexes. Olivier est actuellement responsable du Pôle Embarqué, Cybersécurité et IA au sein de Silicom à Rennes Référence: https://github.com/silicom-ia/CESAR_2018 Au plaisir de vous revoir,

Utilisation de l’IA pour exploiter les ressources inutilisées des clouds privés

Bonjour à tous et bonne année 2019 ! Déjà 2 meetups programmés pour 2019: - Le 21 janvier prochain: Olivier Gesny nous parlera de Classification de Binaires Windows via Apprentissage par Renforcement (plus d'information ici: https://www.meetup.com/fr-FR/Meetup-Machine-Learning-Rennes/events/257280480/) - Le 18 mars prochain, nous accueillerons Jean-Emile Dartois, chercheur travaillant chez IRT B-com sur la problématique de l'exploitation des ressources inutilisées sur des clouds privés. Il nous expliquera en détail la problématique de l'estimation des futures ressources disponibles dans le cloud et l'intérêt d'utiliser une régression quantile. Ci-dessous, un résumé de son intervention. A bientôt, Résumé: Les cloud privés représentent plus de ¾ des capacités globales des centres de données, mais en moyenne, 55% de leurs ressources restent inutilisées [1]. Ce gâchis n’est pas acceptable compte tenu de la pollution engendrées par les centres de données. En effet, l'industrie électronique est un des premiers pollueurs et les investissements dans ce secteur sont en croissance continue (+15% par an) [2]. Nous développons au sein de l’IRT B-com une solution de cloud collaboratif (une forme d’airBnB des centres de données) ayant pour but de regrouper et de mettre à disposition de manière sécurisée les ressources informatiques non utilisées de multiples entreprises et administrations publiques. Il s'agit d'une alternative au cloud public, à la fois bas coût et souveraine, particulièrement adaptée à des applications de traitement de données de type Big Data. Cependant, les clients de ce cloud collaboratif ne souhaite pas sacrifier la qualité du service même pour un hébergement à bas coût. Pour répondre à ce défi, une des solutions est d’utiliser l'Intelligence Artificielle pour estimer les futures ressources disponibles. Dans cette présentation, je montrerai dans un premiers temps l'intérêt de l'utilisation de la Régression Quantile pour estimer les ressources inutilisées. Puis, je parlerai de l’utilisation de ce modèle prédictif pour dynamiquement allouer ces ressources inutilisées à un cluster Apache Spark orchestré par Kubernetes. Biographie: Jean-Emile Dartois est chercheur à IRT B-com depuis octobre 2014 et prépare depuis février 2017 un doctorat sur l’optimisation des centres de données. Il partage son temps entre la conception d'applications industrielles et la recherche académique. Il est impliqué dans l'architecture et le développement de projets Open Source (e.g. OpenStack Watcher) depuis de nombreuses années. Ses intérêts de recherche comprennent le Cloud Computing, l’utilisation du machine learning, et les problématiques d’optimisation multi-critères. Bibliographie: [1] IDC White Paper | Quantifying Datacenter Inefficiency [2] Cisco Global Cloud Index White Paper | Forecast and Methodology, 2016–2021

Photos (20)