addressalign-toparrow-leftarrow-rightbackbellblockcalendarcameraccwcheckchevron-downchevron-leftchevron-rightchevron-small-downchevron-small-leftchevron-small-rightchevron-small-upchevron-upcircle-with-checkcircle-with-crosscircle-with-pluscrossdots-three-verticaleditemptyheartexporteye-with-lineeyefacebookfolderfullheartglobegmailgooglegroupsimageimagesinstagramlinklocation-pinm-swarmSearchmailmessagesminusmoremuplabelShape 3 + Rectangle 1outlookpersonJoin Group on CardStartprice-ribbonShapeShapeShapeImported LayersImported LayersImported Layersshieldstartickettrashtriangle-downtriangle-uptwitteruseryahoo

Metode distribucione semantike u R

Goran S. Milovanović iz Data Science Srbija će predstaviti i diskutovati metode distribucione semantike za text-mining u R. Prvi deo priče će biti fokusiran na klase i funkcije u R koje podržavaju preprocesiranje teksta za metode distribucione semantike, većim delom u blizini {tm} paketa koji je postao R standard u ovoj oblasti. Drugi deo priče i diskusije će se biti posvećen modeliranju Latentnom Dirišle alokacijom (LDA) iz R; glavni primer će koristiti popularni {topicmodels} paket; dotaćićemo se i proučavanja i vizuelizacije modela topika (putem raznih R paketa). Takođemo ćemo predstaviti i metode prepoznavanja entiteta iz Apache OpenNLP biblioteke, koji su u R dostupni kroz {openNLP} paket. Ako nam vreme dozvoli, razgovaraćemo o razlikama između varijacionog EM algoritma i Gibsovog semplera u oceni LDA modela iz matrice termina i dokumenata, te uporediti ono čime raspolažemo u R sa rešenjima dostupnim u Python za rešenje problema ocene ovog modela.

Join or login to comment.

People in this
Meetup are also in:

Sign up

Meetup members, Log in

By clicking "Sign up" or "Sign up using Facebook", you confirm that you accept our Terms of Service & Privacy Policy