Past Meetup

Wikidata pour la science 2018

This Meetup is past

38 people went

Details

Wikimédia France et le Center for Data Science de Paris-Saclay organisent une journée (9h à 17h30) de découverte de Wikidata ouverte à tous au sein de l'Université Paris-Saclay. Cette journée sera l'occasion de découvrir comment Wikidata parvient à constituer une des premières bases de connaissances au monde, et comment l’intégrer et l’exploiter dans les projets des étudiants et des chercheurs de l'université.

Le partage des données, avec comme objectif le Linked Data (Web des données), encore appelé Graphe Global Géant et Web 3.0, implique apriori la constitution coûteuse de bases de connaissances, qui elles mêmes se périment très vite. L’alternative, fortement soutenue par les grands acteurs du Web et en particulier Google, est l’élaboration collective de ces bases de connaissances par crowdsourcing.
Les divers domaines scientifiques sont déjà représentés dans Wikidata. Ces contributions peuvent être exploitées par exemple pour faciliter la découverte d’information, la reproductibilité et la traçabilité des travaux de recherche. Le Center For Data Science a travaillé sur les outils destinés à faciliter la découverte et la réutilisation des données de Wikidata.
Durant cette journée à travers des exemples réels et des travaux pratiques, vous pourrez découvrir comment vous pouvez utiliser les données de Wikidata avec les outils développés au sein du Center for Data Science de Paris-Saclay pour utiliser des données massives.

Les sujets suivants seront abordés durant la journée :
* Qu'est-ce que Wikidata et Wikipédia ? (Historique du projet )
* Comment créer un compte sur Wikidata ? Autant que possible, il faudrait que vous ayez créé votre compte avant.
* Comment peut-on contribuer, manuellement ou automatiquement à ce projet ? Démonstration : scrapper pour Wikidata en Python. Exercice : utiliser le Dump de Wikidata.
* Quels services propose le Center for Data Science de Paris Saclay dans ce domaine ? (SPARK, SPARQL, Cloud,...)

Prérequis :

Avoir son propre PC et avoir créer son compte sur Wikipedia ou Wikidata.

Programme (qui peut encore légèrement changer) :

• 9:00- 9:30 Accueil avec café*

• 9:30- 9:40 Le Center for Data Science de Paris Saclay - Cécile
Germain – LRI - Université Paris Sud

• 9:50- 10:00 Wikimédia France - Sylvain Boissel, Wikimédia France

• 10:00-10:15 Qu'est-ce que Wikidata et Wikipédia ? - Sylvain Boissel

• 10:15-10:45 Préparation aux ateliers de la journée : inscription à
Wikipedia/Wikidata - Sylvain Boissel

• 10:45- 11:00 Pause café*

• 11:00-11:30 Comment peut-on contribuer manuellement et
automatiquement à Wikidata ? - Sylvain Boissel

• 11:30- 12:00 Description des ateliers de l'après midi : Comment
importer des identifiants d'une base de données vers Wikidata et
inversement ?
- Karima Rafes et Sylvain Boissel

• 12:00 - 12:30 Préparation des ateliers : inscription aux environnements de travail pour data scientists au sein de l'université.

• 12:30- 13:30 Buffet*

• 13:30 - 14:00 Introduction à Spark pour traiter vos données (Python
et Scala) - Karima Rafes

• 14:00 - 15:00 Atelier pratique : croiser vos données avec Wikidata
avec Spark - Karima Rafes et Sylvain Boissel

• 15:00 - 15:30 Atelier pratique : importer vos propres identifiants
dans Wikidata via l'outil Mix'n'Match - Sylvain Boissel

• 15:30- 15:45 Pause café*

• 15:45 - 16:45 Atelier pratique : fusionner des données de Wikidata
avec Sparql et Spark - Karima Rafes

• 16:45 - 17:30 Atelier pratique : partager vos données au sein de
l'université - Karima Rafes

* offert par l'Université Paris-Sud.

Intervenants :
Sylvain Boissel, Wikimedia France
Karima Rafes, Center for Data Science et BorderCloud

Sites Web :
https://www.wikidata.org
https://io.datascience-paris-saclay.fr

Transport :

Descendre à l'arrêt Polytechnique laboratoire Bus 91.06 (Plan (http://www.vianavigo.com/fileadmin/fhp/Albatrans_91.06_C-D.pdf)) et ensuite passer par l'entrée du parking pour atteindre le bâtiment INRIA (sur la gauche de l'entrée du parking).