Šta mediji pišu o tech džinovima - analiza sentimenta teksta u R

BelgradeR
BelgradeR
Public group
Location image of event venue

Details

[VAŽNO] Meetup se ODLAŽE u skladu sa preventivnim merama protiv širenja novog koronavirusa COVID-19. Družićemo se i učiti R zajedno čim se ukaže prilika!

Meetup će biti posvećen uvodu u analizu sentimenta (emotivnog tona) teksta na engleskom jeziku u programskom jeziku R. Principe analize sentimenta ćemo diskutovati kroz minimalnu studiju slučaja predstavljanja tri tehnološka giganta - Apple, Samsung, i Huawei - u onaljn vestima na engleskom jeziku tokom januara i februara 2020.

Oslonićemo se na paket {newsrivr} kako bismo preko Newsriver API pretrage prikupili vesti koje nas interesuju. Pokazaćemo kako jednostavno pre-procesiranje teksta za analizu možemo da izvedemo kombinujući funkcije paketa {tidytext} i {dplyr}. U samoj analizi sentimenta prikupljenih tekstova oslonićemo se na Bing sentiment leksikon koji je dat u paketu {textdata}. Sve vizuelizacije radimo u {ggplot2} dok izveštaj o analizi reprodukujemo u R Markdоwn tokom samog meetupa. Konačno, primenom bejzijanskih A/B testova testitamo hipoteze o tome da li je sentiment bio pozitivniji ili ne u kontekstu vesti dobijenih pretragom za Apple, Samsung, i Huawei.

Meetup je namenjen svim entuzijastima u programskom jeziku R, profesionalcima u Data Science koji žele da steknu uvid u analizu sentimenta teksta, kao i publici koju interesuje mašinska analiza teksta uopšte. Mnogi detalji na koje moramo da obratimo pažnju u razvoju pravih sistema za NLP i analizu sentimenta neće biti obuhvaćeni studijom slučaja koju smo pripremili i njima ćemo posvetiti pažnju na kraju diskusije. Cilj je, pre svega, da se zainteresovani steknu uvid u korake i principe u analizi sentimenta teksta, a R programeri dobiju kod i objašnjenje od koga mogu da počnu i uče dalje ako su zainteresovani.

Predavač će biti dr Goran S. Milovanović, vlasnik konsultantske agencije DataKolektiv i Data Scientist za Wikidata u Wikimedia Deutschland.

Svi materijali su već sada dostupni na GitHub-u: https://github.com/GoranMilovanovic/Belgrade_20200312_SentimentAnalysis_R

----------------------------------------------

The Meetup will provide an introduction to sentiment analysis of English text in the programming language R. The principles of sentiment analysis will be discussed in a mini case study of how three tech giants - Apple, Samsung, and Huawei - were represented by online media in English during the first two months of 2020.

We will relly on the {newsrivr} package to search and collect the relevant news trough the Newsriver API. We will then demonstrate how to perform simple text pre-processing using {tidytext} and {dplyr}. In the sentiment analysis step itself we will rely on the Bing sentiment lexicon present in the {textdata} package. All visualizations will be produced in {ggplot2} while the report on the analysis will be reproduced in R Markdown during the meetup. Finally, we will use Bayesian A/B testing to test a set of simple hypotheses on the sentiment tone in the online media representation of Apple, Samsung, and Huawei.

Lecturer: Goran S. Milovanovic, Phd, DataKolektiv, Owner and Data Scientist for Wikidata, Wikimedia Deutschland.

Materials are already available on GitHub: https://github.com/GoranMilovanovic/Belgrade_20200312_SentimentAnalysis_R