Data Kaggler #2
Détails
http://photos2.meetupstatic.com/photos/event/a/1/9/0/600_449441360.jpeg
Ce groupe a pour objectif de fédérer une communauté de personnes, souhaitant découvrir et partager les meilleures recettes à utiliser dans les compétitions de Machine Learning organisées par Kaggle (feature engineering, hyper paramètres, cross validation, stacking, ensemble, blending, 'eXtreme Gradient Boosting', etc).
Comme convenu lors de l'atelier #1, deux ateliers auront lieu en parallèle :
Le premier atelier sera consacré à la compétition Titanic (https://www.kaggle.com/c/titanic). Idéal pour mettre en pratique une grande partie des techniques du Data Scientist : feature engineering, gestion de l'imputation des valeurs manquantes, réalisation de modèles non-linéaires, cross-validation, traitement des valeurs textuelles, etc.
Le deuxième atelier sera dédié au traitement d'images où deux compétitions Kaggle seront abordées :
• Digit Recognizer (https://www.kaggle.com/c/digit-recognizer): identification de caractère manuscrit : comment manipuler une image, comment appliquer un algorithme de classification sur une image, SVM, ...
• Facial Keypoints Detection (https://www.kaggle.com/c/facial-keypoints-detection) : détection de point spécifique d’un visage : pré-traitement sur les images, appliquer un réseau de neurones, ...
Cet atelier sera animé par :
• Alexia Audevart, data enthousiaste chez ekito
• Florent Pajot, consultant data scientist chez SQLi
• Reynald Rivière, data scientist chez Agora.
Ordre du jour :
• Introduction aux compétitionsTitanic (https://www.kaggle.com/c/titanic) ou aux compétitions Facial Keypoints Detection (https://www.kaggle.com/c/facial-keypoints-detection) et Digit Recognizer (https://www.kaggle.com/c/digit-recognizer)
• Présentation des compétitions en cours
• Constitution des équipes
Pré-requis :
Vous devez être muni d’un ordinateur portable relativement récent et avoir installé Anaconda : distribution Python (version 2.7) libre intégrant directement un grand nombre de packages pour la Data Science.
https://www.continuum.io/downloads
Un éditeur tel que Jupyter Notebook (ou Zeppelin, IPython) est également à prévoir (déjà installé dans Anaconda)
http://jupyter.readthedocs.io/en/latest/install.html
Les personnes souhaitant suivre l'atelier dédié aux traitements d'images devront installer les librairies suivantes :
• Scikit-image (http://scikit-image.org/) (déjà présente dans Anaconda)
• Theano (http://deeplearning.net/software/theano/install.html)
• Keras (http://keras.io/)
Attention : vous devez entrer le code d'invitation lors de votre réponse. Dans le cas contraire, la validation de votre inscription n'est pas assurée.
Procédure pour nous rejoindre :
Envoyez une demande d'inscription à la mailing list spéciale "Kagglers".
• Aller sur la page de google group https://groups.google.com (https://groups.google.com/)
• Recherche le groupe "Toulouse Data Science Kaggler"
• Demande à rejoindre le groupe
--------------------------------------------------------------------
Un grand merci à notre fidèle sponsor Dexstr qui nous soutient depuis déjà un an !
http://photos2.meetupstatic.com/photos/event/1/4/1/b/600_448385147.jpeg
Et un grand merci également à notre nouveau sponsor SQLi
http://photos2.meetupstatic.com/photos/event/1/4/5/8/600_448385208.jpeg
Merci à ekito qui nous accueille aimablement dans leurs locaux 15 rue Gabriel Péri !
