Past Meetup

Paris NLP Meetup #5

This Meetup is past

227 people went

Location image of event venue

Details

Seating is on a first come, first served basis whether you have RSVPed or not, so we suggest arriving early. We can host 80 people.

La salle permet d'accueillir 80 personnes. L'inscription est obligatoire mais ne garantit pas que vous pourrez entrer, nous vous recommandons donc d'arriver un peu en avance.

----------

Intervenants :

• Karl Neuberger (Partner) & Antoine Simoulin (Data Scientist) : présentation du projet Senometry - Analyse de dossiers médicaux textuels pour l’extraction de données structurées.

La richesse et le volume des données dans le secteur de la santé constituent un fabuleux terrain d’opportunités pour le machine learning et le big data. Il est impossible d’envisager un traitement manuel de cette masse d’information. Du fait de leur taille importante, l’analyse de cohortes de patients permet de résoudre des questions médicales (par exemple, le diabète est-il un facteur de risque de cancer du sein ?), d’apporter des preuves à des intuitions personnelles (par exemple, l’impact d’un médicament sur le risque de cancer), d’apporter le recul nécessaire aux médecins pour mettre à jour des signes subtils (par exemple la mise en évidence de particularités de certaines tumeurs rares) et enfin de faire des découvertes par hasard (c’est le concept de sérendipité).

Ces données sont issues de sources variées (imagerie, biologie, lettres de correspondance, fiches résumées, …) et les modes d’expression sont souvent complexes. Le vocabulaire médical fait appel à des abréviations, des synonymes qui de plus évoluent dans le temps. Il est ainsi nécessaire de développer des méthodes pour extraire des informations structurées afin de pouvoir les exploiter.

Quantmetry travaille avec l’unité de Sénologie du CHRU de Strasbourg (unité de traitement des maladies du sein) à la mise en place d’une méthodologie d’extraction et de structuration automatisée de données textuelles anonymisées issues des dossiers de patientes traitées pour un cancer du sein. Le vocabulaire médical, comme les problématiques de santé, constituent un vrai défi de traitement et de compréhension du langage et nécessitent une collaboration étroite entre le personnel de santé et les data scientists.

La présentation abordera le détail de la démarche d’analyse du texte et d’exploitation du contexte ainsi que la présentation de quelques résultats préliminaires.
• Damien Nouvel : Désambiguisations lexicales : méthodes et résultats.

Les systèmes TAL visant la compréhension de textes sont confrontés aux ambiguïtés liées aux langues et à leurs systèmes d'écriture. Dans l'objectif d'analyser des textes pour des visées linguistiques et sémantiques, deux types d'indices sont exploités : la recherche dans des bases lexicales et le contexte. La présentation introduira la problématique de manière générale et pour plusieurs langues, les méthodes généralement utilisées pour réaliser la désambiguisation seront décrites, la tâche sera illustrée pour la reconnaissance et la résolution des entités nommées en français.

----------

Liste complète des intervenants à venir. Si vous êtes intéressé, contactez-nous sur Twitter @ParisNLP!

Speakers will be announced soon. If want to have a talk contact us on Twitter @ParisNLP!