Skip to content

Details

http://photos2.meetupstatic.com/photos/event/a/1/9/0/600_449441360.jpeg

Ce groupe a pour objectif de fédérer une communauté de personnes, souhaitant découvrir et partager les meilleures recettes à utiliser dans les compétitions de Machine Learning organisées par Kaggle (feature engineering, hyper paramètres, cross validation, stacking, ensemble, blending, 'eXtreme Gradient Boosting', etc).

Comme convenu lors de l'atelier #1, deux ateliers auront lieu en parallèle :

Le premier atelier sera consacré à la compétition Titanic (https://www.kaggle.com/c/titanic). Idéal pour mettre en pratique une grande partie des techniques du Data Scientist : feature engineering, gestion de l'imputation des valeurs manquantes, réalisation de modèles non-linéaires, cross-validation, traitement des valeurs textuelles, etc.

Le deuxième atelier sera dédié au traitement d'images où deux compétitions Kaggle seront abordées :

• Digit Recognizer (https://www.kaggle.com/c/digit-recognizer): identification de caractère manuscrit : comment manipuler une image, comment appliquer un algorithme de classification sur une image, SVM, ...

• Facial Keypoints Detection (https://www.kaggle.com/c/facial-keypoints-detection) : détection de point spécifique d’un visage : pré-traitement sur les images, appliquer un réseau de neurones, ...

Cet atelier sera animé par :

• Alexia Audevart, data enthousiaste chez ekito

• Florent Pajot, consultant data scientist chez SQLi

• Reynald Rivière, data scientist chez Agora.

Ordre du jour :

• Introduction aux compétitionsTitanic (https://www.kaggle.com/c/titanic) ou aux compétitions Facial Keypoints Detection (https://www.kaggle.com/c/facial-keypoints-detection) et Digit Recognizer (https://www.kaggle.com/c/digit-recognizer)

• Présentation des compétitions en cours

• Constitution des équipes

Pré-requis :

Vous devez être muni d’un ordinateur portable relativement récent et avoir installé Anaconda : distribution Python (version 2.7) libre intégrant directement un grand nombre de packages pour la Data Science.

https://www.continuum.io/downloads

Un éditeur tel que Jupyter Notebook (ou Zeppelin, IPython) est également à prévoir (déjà installé dans Anaconda)

http://jupyter.readthedocs.io/en/latest/install.html

Les personnes souhaitant suivre l'atelier dédié aux traitements d'images devront installer les librairies suivantes :

• Scikit-image (http://scikit-image.org/) (déjà présente dans Anaconda)

• Theano (http://deeplearning.net/software/theano/install.html)

• Keras (http://keras.io/)

Attention : vous devez entrer le code d'invitation lors de votre réponse. Dans le cas contraire, la validation de votre inscription n'est pas assurée.

Procédure pour nous rejoindre :

Envoyez une demande d'inscription à la mailing list spéciale "Kagglers".

• Aller sur la page de google group https://groups.google.com (https://groups.google.com/)

• Recherche le groupe "Toulouse Data Science Kaggler"

• Demande à rejoindre le groupe

Members are also interested in