Aller au contenu

Traitement de données en temps réel de l'API de Twitter

Photo de Sébastien L.
Hosted By
Sébastien L.
Traitement de données en temps réel de l'API de Twitter

Détails

Pour clôturer la première saison et le lancement de ce meetup de Machine Learning, et avant de laisser la parole à différents invités (le premier en septembre), je vous ferai une séance de rattrapage de mon intervention au meetup Nantes Machine Learning, qui a consisté à introduire un algorithme de clustering en ligne et à l'appliquer à un flux de tweet.

Voici le résumé exact :

L'apprentissage statistique (statistical learning) est à l'origine de nombreux algorithmes de prédiction/classification/clustering ces 30 dernières années (Linear Regression, SVM, Random Forest, k-means). Le principe de ce genre d'algorithmes est le suivant : à partir d'un jeu de données d'apprentissage (training set), l'algorithme construit sa décision (classifieur, prédicteur, ...).

Dans cet exposé, nous aborderons une autre type d'apprentissage appelée apprentissage en ligne (online learning), qui donne lieu à un nouveau type d'algorithmes capable de réagir en temps réel à un flux de données. Nous explorerons en particulier un problème assez peu traité mais très intéressant d'un point de vue pratique : l'apprentissage en ligne non-supervisée (online clustering) avec une partie pratique (notebook python) sur un usecase "sentiment analysis from Twitter API".

Photo of IAPau Machine Learning group
IAPau Machine Learning
Afficher d'autres événements
2 Avenue du Président Pierre Angot · Pau