1 UVOD Priporočilni sistemi za multimedijske vsebine so sistemi, ki na podlagi poznavanja uporabnikovih nagnjenj (profil uporabnika) in poznavanja lastnosti multimedijskih vse- bin (profil vsebine) predlagajo omejen nabor multimedij- skih vsebin po okusu uporabnika. Ti sistemi so že prera- sli testna okolja in si utrli pot v tržne aplikacije. Spletni portal Amazon, na primer, uporablja tovrstne rešitve za priporočanje izdelkov v svoji spletni trgovini [5]. Razvoj priporočilnih sistemov poteka predvsem v dveh smereh: (i) razvoj in izboljšava postopkov priporočanja in (ii) iskanje značilk, ki kar najbolje predstavijo objekte in subjekte v priporočilnih sistemih. Prvi postopki priporočanja so bili preprosti vsebinski (ang. content-based recommenders - CBR) [6] in sku- pinski (ang. collaborative filtering - CF) [1]. Na natečaju Netflix (http://www.netflixprize.com/) pa se je izkazalo, da postopek matričnega razcepa privede do bistveno boljših rezultatov kot drugi pristopi v priporočilnih sis- temih [2], [3]. Trenutno pristop z uporabo matričnega Prejet 26. avgust, 2011 Odobren 25. september, 2011 razcepa velja za najboljšega v primerih, ko je učna množica dovolj velika. Po drugi strani pa je bila predmet raziskav tudi nadgradnja profila uporabnika in profila vsebin z novimi značilkami, ki nosijo kar največ informacije za uspešno napoved relevantnih vsebin. Kot prve značilke so se uporabljali generični metapodatki, na primer žanr, igral- ska zasedba, režiser itn. [7], [1]. Postopki priporočanja so se hitro razvili to te mere, da so te metapodatke popolnoma izkoristili, zato so se raziskave usmerile k iskanju drugačnih značilk, ki bi izboljšale učinkovitost priporočilnih sistemov. V naših predhodnih raziskavah smo pokazali, da emotivni metapodatki pojasnijo znaten del variance v uporabniških podatkih in s tem izboljšajo uspešnost vsebinskega priporočilnega sistema [10]. Uvedba pristopa z uporabo postopka matričnega raz- cepa je pomenila zamenjavo predhodno človeku razu- mljivih značilk (kot je na primer žanr) z latentnimi značilkami, ki običajno niso človeku razumljive. Tako se je za podatkovni nabor Netflix izkazalo, da prva la- tentna faktorja pomenita delitev glede na intelektualnost oziroma moškost/ženskost [3], [2]. Tak postopek, torej interpretacija lastnosti glavnih latentnih faktorjev, je raziskovalno zanimiv pristop, saj odpira drugačen pogled na uporabnikova nagnjenja in njihovo modeliranje. 1.1 Predstavitev problema Glavni cilj prispevka je raziskava lastnosti glavnih latentnih faktorjev nabora podatkov priporočilnega sis- tema z vidika emocij, ki jih vsebine vzbudijo v končnih uporabnikih. Problem, predstavljen v prispevku, teme- lji na dveh predpostavkah: (i) da postopek matričnega razcepa identificira glavne latentne faktorje, ki opisujejo varianco ocen, ki so jih uporabniki pripisali vsebinam, ter (ii) da se emotivni parametri vsebin (parametri, ki opisujejo emocijo, vzbujeno v uporabniku) spreminjajo 178 TKALČIČ, KOŠIR, DOBRAVEC, TASIČ vzdolž glavnih osi, določenih z latentnimi faktorji. Na podlagi danih predpostavk želimo s pomočjo eksplana- torne faktorske analize identificirati emotivne parametre, ki predstavljajo vsebine na skrajnih koncih osi, kot je to predstavljeno v sliki 1. Gručam teh vsebin smo dodelili oznake G1.1, G1.2, G2.1 in G2.2. Rezultat je vizualizacija in interpretacija teh parametrov. Prvi latentni faktor Drugi latentni faktor Gruča 1.1 Gruča 2.1 Gruča 2.2 Gruča 1.2 Slika 1: Vsebine (predstavljene s trikotniki) so razpršene v prostoru, določenem z latentnimi faktorji. V gruče vsebin G1.1, G1.2, G2.1 in G2.2 so združene vsebine na skrajnih koncih osi dveh glavnih latentnih faktorjev. 2 POSKUS Potek poskusa je prikazan na sliki 2. V fazi pridobivanja podatkov smo pripravili matriko ocen, ki so jih realni uporabniki prisodili izbranim vsebinam. S postopkom matričnega razcepa smo nato izločili glavne latentne faktorje. Sledila je statistična obdelava vsebin, ki so se nahajale na skrajnih oseh ravnine, določene z dvema glavnima latentnima faktorjema. Zajem podatkov Matrika ocen Matrični razcep Glavni faktorji Faktorska analiza Predstavitev rezultatov Slika 2: Potek poskusa 2.1 Nabor podatkov Pripravili smo polno matriko ocen (ponazorjena v tabeli 1). V postopku je sodelovalo 52 uporabnikov, označenih z u ∈ {1 . . . 52}, ki so ocenili 70 slik, označenih z i ∈ {1 . . . 70}. Oceno, ki jo je uporabnik u prisodil sliki i, smo označili kot r(u, i) ∈ {1 . . . 5}. Slike so bile izbrane iz veliko večjega nabora slik IAPS [4], v katerem so slike označene z metapodatki, ki opisujejo emocijo, vzbujeno v uporabniku. Emocije smo označili z razširjenimi in pogosto uporabljenimi parametri: valenca (ang. valence), vzburjenje (ang. arousal) in dominanca (ang. dominance) [8]. Valenca loči emocije na pozi- tivne (npr. veselje) in negativne (npr. žalost), vzburjenje opisuje intenzivnost opazovane emocije, dominanca pa ovladovanje (npr. pomirjenost) oziroma neobvladovanje (npr. močna jeza) emocije. Vsaki sliki i je bila tako pripisano povprečje valence, vzburjenja in dominance, ki jih je vzbudila naboru uporabnikov, kot trojica vrednosti md(i) = {v̄, ā, d̄}. Pri tem se nabor uporabnikov, uporabljen za izračun povprečij, razlikuje od nabora uporabnikov, ki so sliki prisodili oceno. Podrobnejše informacije o naboru podatkov so na voljo v virih [11]. H H HHu i 1 2 3 ... 70 1 r(1, 1) r(1, 2) r(1, 3) r(1, 70) 2 r(2, 1) r(2, 2) r(2, 3) r(2, 70) 3 r(3, 1) r(3, 2) r(3, 3) r(3, 70) ... 52 r(52, 1) r(52, 2) r(52, 3) r(52, 70) Tabela 1: Matrika ocen vsebin: vsebuje ocene r(u, i) ∈ {1 . . . 5}, ki so jih uporabniki u ∈ {1 . . . 52}, prisodili vsebinam i ∈ {1 . . . 70}. 2.2 Matrični razcep Pristop z uporabo matričnega razcepa identificira pro- stor latentnih faktorjev, v katerem se vhodni podatki opišejo na bolj zgoščen način. V našem primeru so vhodni podatki združeni v matriko ocen vsebin (glej tabelo 1). Čeprav je metoda singularnih vrednosti (ang. singular value decomposition - SVD) bolj priljubljena, je za uporabo v priporočilnih sistemih neuporabna iz dveh razlogov: (i) redke posejanosti podatkov ter (ii) ve- likosti prostora podatkov (veliko uporabnikov in vsebin). Zato smo glavne latentne faktorje izračunali s pogosto uporabljenim stohastičnim gradientnim postopkom (ang. stochastic gradient descent algorithm) [2], [3], [9]. Pri postopku matričnega razcepa je vsak uporabnik opisan z vektorjem latentnih faktorjev uporabnika pu, prav tako je vsaka vsebina opisana z vektorjem latentnih faktorjev vsebine qi. Profil uporabnika, ki opisuje uporabnikova nagnje- nja, je tako v obliki vektorja latentnih lastnosti pu. Vrednosti v vektorju odsevajo stopnjo uporabnikovega nagnjenja k ustrezni latentni značilki. V podatkovnem naboru Netflix, na primer, prvi latentni faktor kaže na (ne)intelektualnost. Visoka vrednost prvega faktorja pro- fila uporabnika bi tako pomenila nagnjenost uporabnika k intelektualnim vsebinam. Po enakem razmisleku vrednosti v profilu vsebine qi odsevajo stopnjo prisotnosti ustrezne latentne lastnosti v dani vsebini. V podatkovnem naboru Netflix bi tako visoka vrednost prvega faktorja v profilu vsebine pome- nila, da gre za intelektualno vsebino. EMOTIVNE LASTNOSTI LATENTNIH FAKTORJEV V PRIPOROČILNIH SISTEMIH ZA SLIKE 179 gruča število vsebin v gruči G1.1 31 G1.2 13 G2.1 15 G2.2 24 Tabela 2: Število vsebin v vsaki od štirih opazovanih gruč Vektorja imata enako dolžino F , ki pomeni število uporabljenih značilk. Naloga priporočilnega sistema je, da predvidi oceno, ki bi jo izbrani uporabnik u dodelil določeni vsebini i. Napoved ocene r̂(u, i) je izračunana kot skalarni produkt obeh vektorjev r̂(u, i) = pu · qTi . V fazi učenja stohastični gradientni postopek uči vrednosti značilk v vektorjih p in q z minimizacijo srednje kva- dratične napake (ang. root mean sqare error - RMSE) med pravo oceno r(u, i) in napovedano oceno r̂(u, i): argmin ∑ u,i (r(u, i)− pu · qTi ) + λ(‖qi‖ 2 + ‖pu‖2) (1) kjer je λ regularizacijski faktor, ki služi preprečevanju prekomernega prileganja (ang. overfitting). Stohastični gradientni postopek smo izvedli v večjem številu zapo- rednih učnih ciklov. Uspešnost napovedi ocen z vidika RMSE smo opa- zovali ob uporabi različnega števila značilk F ∈ {1 . . . 300} in različnega števila učnih ciklov e ∈ {1 . . . 500}. Pri določitvi dveh glavnih latentnih faktorjev smo uporabili opisani postopek matričnega razcepa z uporabo dveh faktorjev F = 2 in e = 2000 učnimi cikli. Vsak uporabnik in vsaka vsebina je tako predstavljena z vektorjem dveh značilk, na podlagi katerih izračunamo napovedano oceno r̂(u, i) = (qi,1, qi,2) · (pu,1, pu,2), (2) kjer vrednosti značilk qi,1, qi,2, pu,1 in pu,2 pomenijo vrednosti prvih dveh latentnih faktorjev uporabnika u in vsebine i. 2.3 Razporejanje v gruče V vsako gručo vsebin smo razporedili tiste vsebine, ki so imele vrednost ustrezne značilke nad 70 % ma- ksimalne vrednosti za gruči G1.1 in G2.1 ter manj kot 30 % maksimalne vrednosti za gruči G1.2 in G2.2. Tak pristop je v gruče razporedil različno število vsebin, kot je prikazano v tabeli 2. 3 REZULTATI Kot zanimiv stranski rezultat poskusa smo najprej opa- zovali uspešnost postopka matričnega razcepa (v smislu RMSE) v odvisnosti števila uporabljenih značilk F (glej sliko 3) ter v odvisnosti od števila učnih ciklov e 0 0,2 0,4 0,6 0,8 1 1,2 1,4 1 2 3 4 5 6 7 8 9 10 15 20 30 40 50 100 200 300 500 100 50 10 Slika 3: RMSE (y os) kot funkcija števila uporabljenih značilk F (x os) pri izbranem številu učnih ciklov e ∈ {10, 50, 100, 500} 0 0,2 0,4 0,6 0,8 1 1,2 1,4 1 10 50 100 200 300 400 500 100 features Slika 4: RMSE (y os) kot funkcija števila učnih ciklov e (x os) pi izbranem številu uporabljenih značilk (F = 100) (glej sliko 4). Uporabili smo desetkratno navzkrižno preverjanje. Slike od 5 do 7 prikazujejo porazdelitev emotivnih parametrov valenca, vzburjenje in dominanca v štirih opazovanih gručah v obliki grafikona kvantilov. Na vsa- kem grafikonu kvantilov so prikazani: srednja oznaka, ki pomeni mediano, robova okvirja, ki pomenita percentili 25 in 75, zunanja kraka, ki sta skrajni vrednosti brez upoštevanja zunanjih točk (ang. outliers), ter zunanje točke, ki so prikazane individualno z oznako +. 4 SKLEP Rezultati kažejo, da sta parametra valenca in dominanca vezana na prvi latentni faktor, ki pojasnjuje večino variance v ocenah uporabnikov. Ugotovimo lahko tudi, da parameter vzburjenje dosega visoke vrednosti v gruči G1.2, medtem ko so v gruči G1.1 vrednosti enakomerno porazdeljene. Izkaže pa se, da med drugim latentnim faktorjem (gruči G2.1 in G2.2) in emotivnimi parametri ni vidne povezave. V prispevku smo prepoznali emotivne lastnosti vse- bin, ki ležijo na skrajnih delih osi, določenih z glavnima latentnima faktorjema, ter pojasnjujejo večino variance v ocenah uporabnikov. 180 TKALČIČ, KOŠIR, DOBRAVEC, TASIČ 2 3 4 5 6 7 8 11 12 21 22 valence Slika 5: Porazdelitev parametra valenca v štirih opazovanih gručah 2.5 3 3.5 4 4.5 5 5.5 6 6.5 7 7.5 11 12 21 22 arousal Slika 6: Porazdelitev parametra vzburjenje v štirih opazovanih gručah ZAHVALA Delo je bilo izvedeno s podporo Javne agencije za raziskovalno dejavnost Republike Slovenije po pogodbi P2-0246. Avtorji se zahvaljujejo dijakom in osebju Gimnazije Poljane za sodelovanje pri pripravi nabora podatkov, ter sodelavcem iz Laboratorija za digitalno obdelavo podatkov, slik in videa za pomoč pri izvedbi poskusa.