Skip to content

Hibridni pristup recommender sistemima: atributivna i kolaborativna informacija

Photo of Milos Milovanovic
Hosted By
Milos M. and 4 others
Hibridni pristup recommender sistemima: atributivna i kolaborativna informacija

Details

U petak, 24. marta, sa početkom u 18:15, u novosadskom Startit centru (https://www.facebook.com/startitcentarnovisad/), Miroslava Antića 2, održavamo novi Data Science Meetup na temu recommender sistema.

Biće predstavljen novi hibridni pristup rešenju problema preporuke u recommender sistemima koji se bazira na kombinovanju (a) atributivne (content-based approach) i (b) kolaborativne (collaborative filtering approach) informacije u jedinstven prediktivni model. Pristupi bazirani na sadržaju (ili kognitivni pristupi, kako se još nazivaju), podrazumevaju klasičnu deskripciju ajtema i/ili korisnika sistema putem liste atributa. Atributi se koriste u matematičkom modeliranju rejtinga ajtema koje određeni korisnici sistema još nisu imali prilike da ocene, što je osnovni zadatak recommender sistema. Pristupi bazirani na kolaborativnoj informaciji (CF) podrazumevaju da sličnost između rejtinga korisnika i/ili ajtema sadrži atributivnu informaciju latentno, i pokušavaju da samo na osnovu sličnosti u ponašanju korisnika sistema izvedu predikcije za ocene novih korisnik-ajtem kombinacija.

https://a248.e.akamai.net/secure.meetupstatic.com/photos/event/e/4/c/b/600_459178571.jpeg

U novom pristupu koji se predstavlja na ovom Meetup dovodimo u pitanje to da li je atributivna informacija u potpunosti sadržana u sličnostima koje koriste pristupi kolaborativnim filtriranjem i pokazujemo da to nije tačno. Zatim predstavljamo deskriptivnu shemu za atributivnu i kolaborativnu informaciju koja omogućava da se obe koriste kao eksplanatorne varijable u ordinalnom logističkom modelu koji treniramo na MovieLens 100K datasetu. U odnosu na poznate CF algoritme (npr. one primenjene u {recommenderlab} paketu u R), ovaj hibridni pristup obara RMSE na skoro dvostruko manje vrednosti, sa petostruko manjim brojem karakteristika korišćenih u prediktivnom modelu. Selekcijom modela se pokazuje da atributivna informacija, iako ima manji doprinos u predikciji od sličnosti izvedene iz kolaborativne informacije, ne može da se eliminiše kao irelevantna za model. Hibridni pristup koji se ovde predstavlja je implementiran u R, uz pomoć paketa {ordinal} za ocenu ordered logit modela. Kompletan kod u R je dostupan na GitHub u odgovarajuće (https://github.com/smartcat-labs/OrdinalRecommenders)m (https://github.com/smartcat-labs/OrdinalRecommenders)repozitorijum (https://github.com/smartcat-labs/OrdinalRecommenders)u (https://github.com/smartcat-labs/OrdinalRecommenders).

Pristup je razvio za SmartCat i predstavljaće ga na Meetup njihov Data Science Consultant Dr Goran S. Milovanović (http://www.exactness.net/), član Upravnog odbora Data Science Srbija (http://www.datascience.rs/), i vlasnik beogradske Data Kolektiv.

Photo of Data Science Serbia group
Data Science Serbia
See more events
Startit Centar
Miroslava Antića 2 · Novi Sad