Metode distribucione semantike u R


Details
http://photos4.meetupstatic.com/photos/event/d/e/5/5/600_456296917.jpeg
Goran S. Milovanović iz Data Science Srbija će predstaviti i diskutovati metode distribucione semantike za text-mining u R. Prvi deo priče će biti fokusiran na klase i funkcije u R koje podržavaju preprocesiranje teksta za metode distribucione semantike, većim delom u blizini {tm} paketa koji je postao R standard u ovoj oblasti. Drugi deo priče i diskusije će se biti posvećen modeliranju Latentnom Dirišle alokacijom (LDA) iz R; glavni primer će koristiti popularni {topicmodels} paket; dotaćićemo se i proučavanja i vizuelizacije modela topika (putem raznih R paketa). Takođemo ćemo predstaviti i metode prepoznavanja entiteta iz Apache OpenNLP biblioteke, koji su u R dostupni kroz {openNLP} paket. Ako nam vreme dozvoli, razgovaraćemo o razlikama između varijacionog EM algoritma i Gibsovog semplera u oceni LDA modela iz matrice termina i dokumenata, te uporediti ono čime raspolažemo u R sa rešenjima dostupnim u Python za rešenje problema ocene ovog modela.

Metode distribucione semantike u R