This Meetup is past

40 people went

Location visible to members

Details

Pour bien commencer l'année 2017, rien de tel qu'un nouveau meetup Big-Data ! La prochaine rencontre aura lieu fin janvier dans les locaux de TabMo - qu'on remercie pour la prise en charge de l'abonnement du meetup Big-Data-Montpellier -, ce qui nous permettra de rester en contact et de continuer d'échanger sur les défis Big Data.

Et voila la programme pour ce premier meet-up de 2017.

1. Introduction à la data-viz.

Mots clés: data-viz, d3js, java-script

Speaker : Sadri Gora, apprenant de formation Up-To Numerique.

Une introduction à la visualisation des données. A travers une démonstration de la librairie d3.js, Sadri va montrer l'utilité et le potentiel de visualisation des données.

2. Technologies du web sémantique

Mots clés: Web Semantique, ETL, Python, Virtuoso, RDF, JsonLD

Speaker : Nordine El Hassouni, ingénieur de R&D, « Mon travail consiste à transformer les données agronomiques hétérogènes issues de plusieurs sources, base de données relationnelle, fichiers GFF, CSV, HapMap etc. L'ensemble de ces sources sont structurées et organisées au travers de modèles afin de les rendre exploitables. »

Les sources de données en génomique végétale sont multiples, réparties et hétérogènes, et essentiellement accessibles par le Web. La possibilité pour les chercheurs de localiser, récupérer, intégrer et analyser, rapidement et régulièrement, l’information pertinente dans cette masse de données, reste un problème critique et important dans le domaine de la génomique. Pour résoudre cette question au niveau du développement des systèmes d’information, il est nécessaire de dépasser différents niveaux d’hétérogénéité. Les technologies du Web Sémantique, telles que le Resource Description Framework (RDF), RDF Schema (RDFS), Web Ontology Language (OWL) et SPARQL Query Language (SPARQL) offrent des solutions prometteuses à cette problématique de l’intégration des données.

3. Centraliser l'information de gènes depuis des sources diverses.

Mot clés: Pandas, Data Frame, GFF Fasta, BLAST.

Speaker : Enrique Ortega, Master en microbiologie reconverti en Bioinformatique. Utilisateur de python (script et objet), bash et des clusters de calcul scientifique : -"Mes intérêts me rapprochent aux Data Sciences à partir des grands jeux de données qui sont déjà existants, mon ennemi sont les cimetières des données. Sans poste actuellement."

20h15 ... APÉRO!