Data Kaggler #2

This is a past event

34 people went

Grand Builder / ekito

15, rue Gabriel Peri · Toulouse

How to find us

Métro Jean-Jaurès (métro Ligne A et B)

Location image of event venue

Details

Ce groupe a pour objectif de fédérer une communauté de personnes, souhaitant découvrir et partager les meilleures recettes à utiliser dans les compétitions de Machine Learning organisées par Kaggle (feature engineering, hyper paramètres, cross validation, stacking, ensemble, blending, 'eXtreme Gradient Boosting', etc).

Comme convenu lors de l'atelier #1, deux ateliers auront lieu en parallèle :

Le premier atelier sera consacré à la compétition Titanic (https://www.kaggle.com/c/titanic). Idéal pour mettre en pratique une grande partie des techniques du Data Scientist : feature engineering, gestion de l'imputation des valeurs manquantes, réalisation de modèles non-linéaires, cross-validation, traitement des valeurs textuelles, etc.

Le deuxième atelier sera dédié au traitement d'images où deux compétitions Kaggle seront abordées :

• Digit Recognizer (https://www.kaggle.com/c/digit-recognizer): identification de caractère manuscrit : comment manipuler une image, comment appliquer un algorithme de classification sur une image, SVM, ...

• Facial Keypoints Detection (https://www.kaggle.com/c/facial-keypoints-detection) : détection de point spécifique d’un visage : pré-traitement sur les images, appliquer un réseau de neurones, ...

Cet atelier sera animé par :

• Alexia Audevart, data enthousiaste chez ekito

• Florent Pajot, consultant data scientist chez SQLi

• Reynald Rivière, data scientist chez Agora.

Ordre du jour :

• Introduction aux compétitionsTitanic (https://www.kaggle.com/c/titanic) ou aux compétitions Facial Keypoints Detection (https://www.kaggle.com/c/facial-keypoints-detection) et Digit Recognizer (https://www.kaggle.com/c/digit-recognizer)

• Présentation des compétitions en cours

• Constitution des équipes

Pré-requis :

Vous devez être muni d’un ordinateur portable relativement récent et avoir installé Anaconda : distribution Python (version 2.7) libre intégrant directement un grand nombre de packages pour la Data Science.

https://www.continuum.io/downloads

Un éditeur tel que Jupyter Notebook (ou Zeppelin, IPython) est également à prévoir (déjà installé dans Anaconda)

http://jupyter.readthedocs.io/en/latest/install.html

Les personnes souhaitant suivre l'atelier dédié aux traitements d'images devront installer les librairies suivantes :

• Scikit-image (http://scikit-image.org/) (déjà présente dans Anaconda)

• Theano (http://deeplearning.net/software/theano/install.html)

• Keras (http://keras.io/)

Attention : vous devez entrer le code d'invitation lors de votre réponse. Dans le cas contraire, la validation de votre inscription n'est pas assurée.

Procédure pour nous rejoindre :

Envoyez une demande d'inscription à la mailing list spéciale "Kagglers".

• Aller sur la page de google group https://groups.google.com (https://groups.google.com/)

• Recherche le groupe "Toulouse Data Science Kaggler"

• Demande à rejoindre le groupe

--------------------------------------------------------------------

Un grand merci à notre fidèle sponsor Dexstr qui nous soutient depuis déjà un an !

Et un grand merci également à notre nouveau sponsor SQLi

Merci à ekito qui nous accueille aimablement dans leurs locaux 15 rue Gabriel Péri !

------------------------------------------------------------------
Les meetups peuvent être filmés et le public photographié au long de l'événement. En participant à ces rencontres vous autorisez la publication des photos sur notre site Toulouse Data Science Meetup. Cette autorisation n'inclut pas une utilisation publicitaire d'image.
--------------------------------------------------------------------