R u analitici semantičkog veba: slučaj Wikidata; Izlagač: Dr G. S. Milovanović

This is a past event

27 people went

Location image of event venue

Details

Drage R-Ladies, Došao je kraj sezone odmora i vreme je za nove akcije 💪

Imaćemo čast i zadovoljstvo da novu sezonu započnemo izlaganjem Dr Gorana S. Milanovića, dugogodišnjim korisnikom R-a i Data Scientis-om ogromnog znanja i iskustva koje će nesebično podeliti sa nama.

Ako niste videle R-u akciji u pravom smislu te reči, dodjite da se priključite Goranovom izlaganju i kasnijoj diskusiji.

S nestrpljenjem očekujemo naše okupljanje 🤗

~~~~~~~

R u analitici semantičkog veba: slučaj Wikidata

Tokom meetup-a ću predstaviti bazu znanja, semantički veb sistem Wikidata, koji pruža podršku za struktuirane podatke slobodnoj enciklopediji Wikipedia i drugim projektima Wikimedia fondacije. Pokazaću nekoliko načina za pristup podacima sa Wikidata iz programskog jezika R, uključujući i lako upotrebljiv paket {WikidataR}. Predstaviću nekoliko Big Data analitičkih sistema razvijenih u R koji kroz mašinsko učenje (topic models - LDA, t-SNE) i vizuelizacije podataka i rezultata (rBokeh, plotly, visNetwork, igraph, dygraphs, Shiny) omogućavaju praćenje semantičke strukture Wikidata. Trudiću se, ipak, da centralna nit mog izlaganja ne bude samo prezentacija različitih sistema i rešenja, već suočavanje sa praktičnim, realnim problemima u Big Data analizama, od kojih - daću primere - neke efikasnije rešavamo u R (sa dovoljno dobrom hardverskom podrškom, naravno) nego u specijalizovanim Big Data sistemima (poput Spark, koji koristim praktično samo u ETL fazama). Voleo bih da vam poklonim neke trikove u izračunavanju ogromnih kontingencijskih tabela i metrika u R koji vam mogu poslužiti za razvoj igračaka poput popularnih recommender systems. Konačno, ako mi vreme dopusti, osvrnuo bih se na tipično savremeno obrazovanje u R za Data Science i zašto smatram da na kraju dana bolje pliva onaj koji je prvo zaista postao R programer, a onda naučio {tidyverse} - koji veoma volim i koristim svakodnevno. Biće i Rmarkdown notebook za sve koji bi voleli da počnu da uče o pristupu Wikidata iz R. Na kraju, cilj mi je da vam pokažem koliko je svet koji nastanjujemo u Data Science izuzetno zabavan, interesantan i dubok, i zašto ne treba da odustanete od namere da se u njemu profesionalno nastanite!

~~~~~~~

Dr Goran S. Milovanović je studirao matematiku, filozofiju, i psihologiju, na Univerzitetu u Beogradu i NYU (SAD), i stekao formalno obrazovanje u eksperimentalnoj i teorijskoj psihologiji u oblasti kognitivnih nauka. Programer je od 80-ih godina i 8-bitnih mašina sa 64K RAM memorije. Njegov put u Data Science započeo je proučavanjem probabilističkih modela ljudskih kognitivnih funkcija (kategorizacija i učenje koncepata, semantička memorija, kauzalna indukcija, odlučivanje u uslovima rizika i neizvesnosti) i modeliranjem podataka dobijenih bihejvioralnim eksperimenatima. Danas radi u programskim jezicima R i Python, uz podršku raznih drugih tehnologija i standarda (Apache Hadoop, Apache Spark, SPARQL, SQL, XML, JSON i drugih). Programski jezik R je njegova pasija i specijalnost. Od 2017. radi kao Data Scientist za projekte Wikidata i Wiktionary sa Wikimedia Deutschland, gde koristi R u analizi nekih od najvećih i najsloženijih skupova otvorenih podataka danas uopšte dostupnih. Vlasnik je konsultantske firme DataKolektiv.