Web Scraping : apprendre à récupérer des données avec Scrapy (les bases)


Details
Places limitées 😋
Réservation sur eventbrite : https://goo.gl/gX3P4T
Connaissances requises :
Bases Html5 et CSS3 & Json
Developer tool (chrome ou firefox)
Bases en programmation
Avoir python et Jupyter installé sur son ordinateur
je conseille d'installer la distribution https://www.anaconda.com/download/ (https://www.lesjeudis.com/metiers/web/webmaster))
Description
Scrapy est un framework python haut-niveau pour faire du web crawling et du web scraping. Il permet de créer des scripts complexes et d'aller plus loin que des outils tel que webscraper.io
Le cours prendra la forme suivante ; les deux dernières parties sont indicatives et seront abordées selon l'avancée du groupe :
Comprendre Scrapy (qu'est ce qu'il fait, qu'est ce qu'il ne fait pas, ce qu'il faut connaître, comment l'utiliser)
Premier pas avec scrapy et l'utilisation du shell exercice avec http://quotes.toscrape.com/
Création d'un spider et récupération des données exercice avec http://cmrh.fr/annuaire/ exercice avec http://www.lva-auto.fr/
Fonctionnalitées avancées de scrapy (pagination, envoi d'email) et interaction avec Python exercice avec http://www.champagnesdevignerons.com/
Gérer le JavaScript : splash exercice avec http://www.chocolatiers.fr/
https://secure.meetupstatic.com/photos/event/1/a/5/c/600_465846748.jpeg

Web Scraping : apprendre à récupérer des données avec Scrapy (les bases)