• Elastic Paris Meetup #37 : Talan Labs

    Talan

    Rejoignez-nous pour notre prochain meetup chez Talan Labs qui nous accueillera pour cette soirée. Merci à eux ! Talk 1 : Migrer vers Elasticsearch et classifier des données Vous avez un moteur de recherche qui ne vous satisfait pas, vous ne maîtrisez pas sa technologie ou pire elle a atteint ses limites ? Venez découvrir les raisons qui feront qu'une migration vers Elasticsearch sera une réussite pour votre projet. #GettingStarted Chez ByPath on classifie des gros volumes de données non-structurées, comme par exemple des intitulés de poste ou à partir d'informations géographiques partielles ? Je vous propose de découvrir comment nous avons astucieusement segmenté nos données pour les utiliser dans des recherches complexes mais ultra-rapides. #Customize Si le temps le permet, on verra comment s'est passé notre montée de version 2.4.5 vers 6.6.1, et comment il est possible d'intégrer la suite ELK dans une application. Xavier Facq travaille chez ByPath comme Senior Java Software Engineer et Search Architect. Il a rejoint l'équipe R&D au début du projet et son premier fait d'armes a été de le migrer vers Elasticsearch ! Tiens donc ?! Talk 2 : Mise en place d'une recherche "à la google" dans une base cliente Les clients souhaitent souvent une recherche à la google dans leur application. Pour un cas simple, Elasticsearch s'en sort facilement. Mais quand ça se complexifie, avec notamment des objets imbriqués et des poids différents selon les critères, c'est moins évident. Je vous ferai un retour d'expérience sur la mise en place de ce type de recherche sur une base de 30 millions d'enregistrements. Jonathan Baranzini est développeur depuis 13 ans. Il se spécialise sur les problématiques de données et les bases NoSQL. Talk 3 : Exploiter les données du Grand Débat avec Elasticsearch - Les défis de l'exploitation des données du Grand Débat - Pourquoi utiliser Elasticsearch ? - Pré-traitement et ingestion dans ES - Analyzers et agrégations - Démo de l’outil Antoine Franz est co-fondateur de la startup Zimple, qui propose un moteur de recherche pour fichiers 3D et vend des accessoires pour imprimante 3D. Gauthier Schweitzer est consultant Data chez Eleven, cabinet de conseil en stratégie. Tous deux sont des data scientists formés à l’ENSAE (Ecole Nationale de la Statistique et de l’Administration Economique). Lien vers la plateforme : https://www.democratie.app Déroulement de la soirée : 19h00 : ouverture des portes (food and drinks) 19h30 : accueil par Elastic et Talan Labs 19h45 : Talk 1 : Migrer vers Elasticsearch et classifier des données 20h15 : Talk 2 : Mise en place d'une recherche "à la google" dans une base cliente 20h30 : Talk 3 : Exploiter les données du Grand Débat avec Elasticsearch 20h45 : Social discussions (food and drinks) 22h00 : fin du meetup

    1
  • A la découverte d'Elasticsearch

    Technopole Hélioparc

    Nous organisons sous la forme d'un BBL (Brown Bag Lunch: https://www.elastic.co/blog/free-lunch-for-open-source-engineers) une session découverte d'Elasticsearch. L'idée est que chacun vienne avec son sandwich et assiste à une session entre midi et deux, tout en mangeant son repas. C'est très décontracté. La session de manière détaillée : Vous utilisez encore des requêtes SQL pour faire des recherches ? Vos utilisateurs vous reprochent de ne pas pouvoir chercher sur toutes les rubriques ? Votre temps de réponse moyen est supérieur à la demi-seconde avec seulement quelques millions de documents ? Il vous faut 3 jours pour produire des statistiques sur vos données ? Vous rêvez d’offrir une recherche "à la google" sur les données de votre SI ? Ne cherchez plus ! Cette conférence est faite pour vous. David présentera au cours de la session pourquoi et comment il est passé de la recherche SQL à Elasticsearch en détaillant les apports de ce moteur par rapport à une solution pure Lucene : * Pourquoi Elasticsearch ? * L'indexation * La recherche * Les agrégations et le principe de navigation par facettes * La scalabilité horizontale * L'analyse et le mapping (en fonction du temps disponible) * La communauté Par David Pilato, développeur et évangéliste chez elastic.co

    2
  • Elastic Paris Meetup #36 : Aircall

    11 Rue Saint-Georges

    Rejoignez-nous pour notre prochain meetup chez Aircall qui nous accueillera pour cette soirée. Merci à eux ! Talk 1 : Elasticsearch sur Kubernetes : comment ça marche ? - Introduction rapide à Kubernetes, ses avantages, ses inconvénients - Elasticsearch dans Kubernetes : pourquoi? - Analyse macro de l’architecture d’un cluster Elasticsearch déployé sur Kubernetes - Démo live : Déployons un cluster Elasticsearch - Utilisation au quotidien, d’un point de vue DevOps / SRE et d’un point de vue développeur / data engineer Cédric de Saint Martin est Lead Site Reliability Engineer de la start-up Wiremind, et est en charge de la refonte de l’infrastructure vers un workflow et un outillage moderne. Wiremind possède de nombreux cluster Elasticsearch utilisés en production et pilotés par Kubernetes. Talk 2 : K8s Monitoring La stack Elastic permet nativement de monitorer les environnements k8s au travers de ses « beats » et sans composant supplémentaire. Avec La stack Elastic, au travers de ses fonctions d’auto-discovery permettant de suivre la volatilité des containers et de ses dashboards, l’information récupérée par les commandes kubectl get, top, describe.... vous est désormais plus accessible. « Come and see ». Yannick Fhima est Solution Architect chez Elastic pour la région EMEA. Avant de rejoindre Elastic, Yannick a travaillé dans le monde de la sécurité autour des problématiques de « Gestion d’identité, de contrôle d’accès, de single sign-on, d’authentification forte..... API Management». Talk 3 : Connecter Elasticsearch avec Excel via SQL et ODBC Découvrez comment utiliser les outils de BI tels que Microsoft Excel ou PowerBI sur Elasticsearch grâce au langage SQL et au driver ODBC ! Vincent Maury est Architecte Solutions chez Elastic pour la région Europe du Sud. Avant de rejoindre Elastic, Vincent a passé la dernière décade dans le monde de la sécurité IT. Plus récemment, il a contribué aux solutions de Web Application Firewalls et Threat Analytics de DenyAll en tant que Directeur Technique. Vincent vit sa passion pour la sécurité et les nouvelles technologies en général ! Déroulement de la soirée : 19h00 : ouverture des portes (food and drinks) 19h30 : accueil par Elastic et Aircall 19h45 : Talk 1 : Elasticsearch sur Kubernetes : comment ça marche ? 20h15 : Talk 2 : K8s Monitoring 20h30 : Talk 3 : Connecter Elasticsearch avec Excel via SQL et ODBC 20h45 : Social discussions (food and drinks) 22h00 : fin du meetup

    4
  • Elastic Paris Meetup #35 : Malt

    La Manufacture

    Rejoignez-nous pour notre prochain meetup chez Malt qui nous accueillera pour cette soirée. Merci à eux ! Talk 1: Les différents cas d'usage d'Elasticsearch chez Malt Elasticsearch est utilisé depuis 2012 chez Malt. A travers cette présentation vous aurez un aperçu de son usage au sein du moteur de recherche public mais aussi sur certaines parties privées du site. Ce sera l'occasion de parler de scoring à travers les fonctions de gauss decay et functions script, de boost par proximité géographique mais aussi d'ontologie, d'analyseur multi langue ou de migration de mapping. Hugo Lassiège est CTO et co fondateur chez Malt. Il officie dans l'informatique depuis 18 ans principalement en tant qu'ingénieur en développement. Il apprécie discuter d'architecture technique ou d'organisation (qui n'est rien d'autre que de l'architecture sociale), de moteur de recherche, de science des données. Vous pourrez le retrouver sur Twitter ou sur son blog http://www.eventuallycoding.com Talk 2: Nouveautés de Lucene 8 et Elasticsearch 7 Découvrez les nouveautés apportées par Lucene 8 et les conséquences dans Elasticsearch 7. Jim Ferenczi est développeur dans l'équipe Elasticsearch. Il est également committeur sur le project Lucene. Déroulement de la soirée : 19h00 : ouverture des portes (food and drinks) 19h30 : accueil par Elastic et Malt 19h45 : Talk 1: Les différents cas d'usage d'Elasticsearch chez Malt 20h15 : Talk 2: Nouveautés de Lucene 8 et Elasticsearch 7 20h45 : Social discussions (food and drinks) 22h00 : fin du meetup

    11
  • Elastic Rennes Meetup #2 - NLP et autocompletion puis Machine Learning

    Lieu confirmé: Salle Ruby à la FrenchTech (Mabilais) Rejoignez-nous pour notre second meetup sur Rennes ! Déroulement de la soirée : 19H00 Talk 1: Auto-complétion avec Elasticsearch sur du fulltext intégral non structuré à l'aide de techniques de NLP 19H45 Talk 2: Machine Learning avec Elastic 20H30 Social discussions (food and drinks) 21H30 Fin du meetup Talk 1: Auto-complétion avec Elasticsearch sur du fulltext intégral non structuré à l'aide de techniques de NLP Lorsqu'un utilisateur navigue sur un site web avec une fonction de recherche, l’auto-complétion est en général la première fonctionnalité utilisée. Elle se doit donc d'être la plus optimale possible. Réaliser un service d’auto-complétion à l'aide d'un moteur de recherche tel qu'Elasticsearch ou Apache Solr semble souvent aisé. En effet, dans la majorité des situations, il s'agit de retourner des auteurs, des titres ou du moins un ensemble de libellés assez courts. Dans le cadre d'un projet, il nous a été demandé d'effectuer un service d’auto-complétion sur du texte complet non structuré. Le fond documentaire utilisé est un mélange d'extractions de documents PDF et de contributions éditoriales en langues française et anglaise. Malheureusement ces extractions de documents PDF sont de qualité très variable (de médiocre à correcte). Le cahier des charges était le suivant : - ce service d’auto-complétion permet de trouver des expressions issues du fulltext à partir de n'importe quel début de mot de l'expression ; - il doit être tolérant aux erreurs de frappe ; - il doit être le plus performant possible à la recherche ; - et bien entendu, la qualité doit être au mieux de ce qu'il est possible d'obtenir avec le fond documentaire du projet. L'idée de cet échange est de présenter : - les méthodes choisies pour réaliser ce service avec toutes ces contraintes ; - les difficultés rencontrés ; - les améliorations/adaptations possibles. Ludovic Boutros (Zenika) nous présentera ce premier talk. Talk 2: Machine Learning avec Elastic Comment fonctionne le machine learning d'Elastic, et comment l'utiliser pour traquer des données anormales dans votre SI. David Sztykman (@dsztykman sur Twitter), Solutions Architect chez Elastic, est spécialisé dans les environnements distribués et Cloud. Avant d'intégrer Elastic, il a travaillé plus de 10 ans dans le monde du CDN (Content Delivery Network) et la sécurité notamment sur les problématiques de Web Application Firewall distribué.

    3
  • Elastic Paris Meetup #34 : Centreon

    Centreon

    Rejoignez-nous pour notre prochain meetup chez Centreon qui nous accueillera pour cette soirée. Merci à eux ! Talk 1: La business intelligence appliquée au texte dans l'entreprise ou sur le web Aujourd’hui les organisations (entreprises, associations, personnes, …) produisent et consomment des quantités de documents et de textes numériques (rapport, étude, synthèse, contrat, réponse aux enquêtes, sous format PDF, Office, web, …). L’avènement des technologies du BIG DATA ont permis de mieux gérer ces énormes volumes de données, avec notamment la Business Intelligence qui a pour vocation d’exploiter cette multitude de données afin de faciliter le travail et les usages en contexte d’entreprise. Seulement, voilà, ces outils se concentrent sur les données structurées ; or le texte n’est pas une donnée structurée. De fait, la Business Intelligence se coupe de tout un pan de données (intéressantes voire prioritaires) en excluant les textes, données non structurées par définition. Alors comment intégrer les données non structurées et faire de la Business Intelligence avec ? Je vous propose de voir comment le couplage d'un annotateur NLP/TAL et de la stack Elastic décuple les possibilité d'analyse de masses de texte. Le saviez vous ? Elasticsearch peut servir à indexer autre chose que des logs ;-) Ivan Monnier est CTO de Qwam, une société spécialisée dans le traitement de masses de texte. Qwam édite des solutions de crawl, de CMS et de Text Analytics et utilise extensivement la stack Elastic. Talk 2: AppSearch : Déployez rapidement l'expérience de recherche Elastic sur n'importe qu'elle plateforme Développé au dessus d'Elasticsearch, AppSearch est un outil puissant qui permet d'intégrer un moteur de recherche pertinent et flexible à des sites internet/intranet ou applications en seulement quelques heures. AppSearch donne aux utilisateurs l'autonomie nécessaire pour manipuler et personnaliser facilement les résultats de recherche à partir de son interface backend claire et intuitive. Ils n'auront plus besoin de faire appel aux développeurs pour cela. L'outil offre aussi une quantité importante d'API aux développeurs pour indexer des données, contrôler le moteur de recherche ou extraire les statistiques et les logs. Il permet aussi d'accéder à différentes analyses sur les recherches effectuées : popularité, absence de résultat, opportunités perdues, analyse des clics. Felix Petit est Territory Manager chez Elastic depuis cet été pour le sud de l'Europe. Il est spécialisé dans les solutions de Search qui ont été intégrée à Elastic depuis l'acquisition de Swiftype (Site Search, AppSearch & Enterprise Search). Il a occupé des postes similaires chez Oracle, Tesla & Dell. Déroulement de la soirée : 19H00 Snacks & drinks et discussions 19H30 Accueil par Elastic et Centreon 19H45 Talk 1: La business intelligence appliquée au texte dans l'entreprise ou sur le web 20H15 Talk 2: AppSearch : Déployez rapidement l'expérience de recherche Elastic sur n'importe qu'elle plateforme 20H45 Discussions 21H30 Fin du Meetup

    1
  • Elastic Toulouse Meetup #1 : Orange

    Orange

    IMPORTANT: venir avec des papiers d'identité pour pouvoir accéder au site. Rejoignez-nous pour notre premier meetup sur Toulouse qui sera hébergé pour l'occasion par Orange. Les snacks et boissons sont offerts par Business et Décision. Merci à eux ! Talk 1: Mise en place d’un produit Log as a service avec elasticsearch Nicolas Rouyer, exerce le métier d’expert Big Data chez Orange à Toulouse. Ses domaines de prédilection sont le Big Data et le NoSQL. Il dirige une équipe d’experts Big Data et ambitionne de fournir des plates-formes complètes à la demande pour ses clients internes, notamment des ressources elastic as a service. Talk 2: Machine Learning avec Elastic Comment fonctionne le machine learning d'Elastic, et comment l'utiliser pour traquer des données anormales dans votre SI. David Sztykman (@dsztykman sur Twitter), Solutions Architect chez Elastic, est spécialisé dans les environnements distribués et Cloud. Avant d'intégrer Elastic, il a travaillé plus de 10 ans dans le monde du CDN (Content Delivery Network) et la sécurité notamment sur les problématiques de Web Application Firewall distribué. Déroulement de la soirée : 19H00 Ouverture des portes (food and drinks) 19H45 Accueil par Orange, Business et Décision et Elastic 20H00 Talk 1: Mise en place d’un produit Log as a service avec elasticsearch 20H30 Talk 2: Machine Learning avec Elastic 21H00 Social discussions (food and drinks restant) 22H00 Fin du meetup

    3
  • Elastic Paris Meetup #33 : Meritis

    MERITIS

    Rejoignez-nous pour notre prochain meetup chez Meritis qui nous accueillera pour cette soirée. Merci à eux ! Talk 1: Testcontainers pour de vrais tests d'intégration d'Elasticsearch Les tests d'intégration peuvent devenir un cauchemar lorsqu'ils sont lancés depuis la même JVM que votre code: * Conflit de JARs (JAR Hell) * Security Manager * Effets de bord De plus, tester avec un produit qui est lancé de façon différente de la façon dont il est lancé en production, ne garantira jamais que les tests d'intégration sont sincères. Aussi, après avoir découvert le projet TestContainers (https://www.testcontainers.org/) qui lance des conteneurs Docker, j'ai décidé d'écrire une implémentation pour Elasticsearch: https://github.com/dadoonet/testcontainers-java-module-elasticsearch. Je vous propose de découvrir tout cela pendant cette session. Par David Pilato, Developer | Evangelist, Elastic. Depuis 2013, David est développeur et évangéliste chez elastic.co, après avoir passé les deux années précédentes à promouvoir le projet open-source Elasticsearch. Il en anime la communauté française et organise des [BBLs](http://brownbaglunch.fr) au sein des entreprises. Talk 2: Search amélioré en utilisant le NLP Le NLP aide les ordinateurs à comprendre un peu mieux ce que les utilisateurs recherchent. Le NLP va permettre aux applications de recherche de retourner de meilleurs résultats en enrichissant les documents passés à Elasticsearch. Mais comment implémenter ces solutions ? Dans cette présentation, nous verrons comment utiliser Elasticsearch en addition de solutions NLP. Par Melvyn Peignon, Curriculum Developer, Elastic. Melvyn est actuellement basé à Cergy, France, et travaille dans l’équipe formation d’Elastic. L’équipe est responsable de la création de différents cours et de leur présentation dans le monde entier. Précédemment, Melvyn a fait de la recherche en data science impliquant Machine Learning, Deep Learning et NLP. Déroulement de la soirée : 19H00 Accueil par Elastic et Meritis 19H15 Talk 1 : Testcontainers pour de vrais tests d'intégration d'Elasticsearch 19H45 Talk 2 : Search amélioré en utilisant le NLP 20H15 Snacks&drinks et discussions 21H30 Fin du Meetup

    6
  • Elastic Rennes Meetup #1 - What’s new in 6.3 & The Beats family

    Merci de vous inscrire (ou de vous "désinscrire" si vous avez un empêchement) pour qu'on puisse gérer au mieux l'intendance. Agenda • 18h30 - What’s new in 6.3? • 19h00 - The Beats family Talk: What’s new in 6.3? La version 6.3 de l'Elastic Stack vient tout juste de sortir. Laurent HUET, Elastic, vous expliquera les principaux changements. Nous parlerons de choses comme l'ajout de l'API Rollup, l'ajout du SQL, le nouveau langage de query dans Kibana, la communication inter-pipeline de Logstash, le spooling sur disque de Beats, l'autodiscovery docker/kubernetes de FileBeat et MetricBeat, ... Nous évoquerons bien sur le changement de packaging avec l'ouverture du code commercial X-Pack. Talk: The Beats Family Maxime Odye, Zenika, vous présentera la famille Beats et leurs intérêts. Nous verrons la mise en place 'out of the box', les dashboards Kibana clés en main mais aussi un exemple d'architecture plus compliqué avec un broker (type RabbitMQ ou Kafka) et l'intégration Jolokia pour le monitoring de logs JVM. Maxime fera un focus particulier sur Metricbeat et évoquera également l'intégration avec Docker.

    1
  • Elastic Paris Meetup #32: Security Operations + Métaheuristique & Classification

    Rejoingnez-nous pour notre prochain meetup à Centreon! Merci à Centreon pour héberger notre meetup! Talk 1: Security Operation Center with the Elastic Stack, what else? - Nicolas Hanteville & Florian Scherb The presentation will focus on the problems encountered when using the Elastic Stack for the creation of a SOC, and found solutions. These problems can be encountered in many cases of use. The topics of project preparation and Kibana plugin creation will be discussed. Nicolas Hanteville: In the field of audit, intrusion tests and digital investigations for more than ten years in consulting companies, ministries and large groups. He joined vente-privee.com in 2016 as CISO Deputy and head of SOC. He has participated in numerous researches in the field of digital investigations. Florian Scherb: SOC engineer at vente-privee.com since 2017, he is at the origin of several Kibana plugins (unofficial). Talk 2: Métaheuristique et Classification avec Elasticsearch - Melvyn Peignon Les problèmes de classification sont récurrents. Dans quel langage est ce document? A quelle équipe forwarder ce message? Est ce que ce tweet est positive ou negative? Tout ces problèmes sont des problèmes de classification et peuvent être résolu avec Elasticsearch! Nous parlerons de comment est ce qu’on peut implémenter un "classifier" directement dans Elasticsearch. Puis dans un second temps nous verrons comment utiliser des métaheuristiques pour optimiser la précision et le recall de tels algorithmes. Melvyn Peignon: Melvyn, Education Engineer, actuellement basé à Cergy, France, travaille dans l’équipe formation d’Elastic. L'équipe est responsable de la création de différents cours et de leur présentation dans le monde entier. Précédemment, Melvyn a fait de la recherche en data science impliquant Machine Learning, Deep Learning et Détection de communauté. Nourriture et boissons seront de la partie également.

    3