Kako zajahati valove statističkih paradoksa

Details
Data science i razvoj modela za otkrivanje prijevara ili kako zajahati valove statistickih paradoksa
Što učiniti kada planirate razviti sustav za detekciju prijevara ili prepoznati sumnjivu aktivnost, a jedino što imate je more atributa unutar baze podataka ili nestrukturiranih izvora podataka bez jasne ideje u kom smjeru krenuti? Ima li rješenja? Dođite na naš sljedeći meetup u suradnji s Visokim Učilištem Algebra i saznajte kako!
Očekujemo Vas na Visokom Učilištu Algebra 30. studenog u 18 sati u dvorani Faust Vrančić!
Agenda:
18:00 - 19:30 "Kako zajahati valove statističkih paradoksa"
Dr. sc. Goran Klepac
Datum: 30.11.2016 u 18 sati
Lokacija: Visoko Učilište Algebra, Ilica 242, 10 000, Zagreb
Dvorana: Dvorana Faust Vrančić
FACEBOOK: facebook.com/datasciencecroatia
Detalji predavanja:
Što učiniti kada planirate razviti sustav za detekciju prijevara ili prepoznati sumnjivu aktivnost, a jedino što imate je more atributa unutar baze podataka ili nestrukturiranih izvora podataka bez jasne ideje u kom smjeru krenuti? Iskustvo na globalnoj i domaćoj poslovnoj sceni pokazuju kako poduzeća uglavnom ne bilježe oznaku prijevare u bazama podataka, zbog toga što ponekad nemaju infrastrukturu za to ili pak ne mogu sa sigurnošću potvrditi radi li se u nekim slučajevima konkretno o prijevari ili je to tek sumnja na prijevaru. Ako pak kojim slučajem poduzeće bilježi oznaku prijevare u bazama podataka, problemi za razvoj analitičkih modela tu ne prestaju, jer govorimo o malim frekvencijama pojavnosti koje se ponekad mjere u promilima. Dakle, nema govora o primjeni standardne metodologije za razvoj prediktivnih modela. Ako i imate tu „sreću“ da je frekvencija pojavnosti granična za razvoj prediktivnih modela, nemojte se prerano veseliti jer to nisu modeli za predviđanje prekida ugovornih odnosa ili pak sustavi preporuka. Dakle, analiza relevantnosti atributa neće vam dati željene rezultate, a samim time ništa od razvoja klasičnih prediktivnih modela. Zašto? Zbog kreativnosti počinitelja, inventivnosti, originalnosti, faktora iznenađenja te uglavnom ne postoji jednoobrazan uzorak prijevare. Razvoj analitičkih modela za detekciju prijevara, kao i otkrivanje obrazaca prijevara iz uzoraka podataka, spada u vrlo zahtjevno područje iz domene data science. Što kada usprkos takvim okolnostima vi morate kreirati analitički model za detekciju prijevara? Ima li rješenja? Dođite na meetup i doznajte!

Kako zajahati valove statističkih paradoksa