1 UVOD Raziskave človekovega zaznavanja glasbe so interdi- sciplinaren izziv, ki povezuje raziskovalna področja psihologije, kognitivne znanosti, komunikacije človek- računalnik, strojnega učenja in pridobivanja informacij iz glasbe (angl. music information retrieval - MIR). Odpirajo tako teoretična kot praktična vprašanja o zazna- vanju glasbe [1], z vidika MIR pa so aktualne predvsem zaradi možnosti nadgradnje obstoječih priporočilnih sis- temov v smeri uporabniku prilagojenih poizvedb in Prejet 2. februar, 2015 Odobren 23. marec, 2015 interakcij [2], [3]. Poslušanje glasbe je lahko izjemno individualna in čustveno navdana izkušnja, odvisna od osebnostnih lastnosti posameznika, glasbenih preferenc, trenutnega počutja, kot tudi bolj splošnega konteksta (starost, spol, izobrazba, socialni in kulturni vpliv, itn.), zato je način, kako merimo uporabnikovo zaznavanje, še posebno pomemben. Trenutne MIR raziskave so osredinjene na integracijo omenjenih parametrov, njihov namen pa je razvoj algoritmov za računalniško analizo glasbe in njihovo implementacijo v priporočilne sisteme. Pri tem sta pomembni predvsem učinkovita in intuitivna predstavitev in interakcija z vsebinami. Eden glavnih izzivov pri tem pa je zaobseganje kompleksnosti inte- rakcij za graditev sistema, ki bo prilagojen preferencam in trenutnemu počutju posameznega uporabnika. Članek predstavlja uporabniške vmesnike in meto- dologijo zbiranja podatkov o uporabnikovih čustvenih in vizualnih odzivih na glasbo, ki smo jih uporabili pri graditvi glasbene podatkovne zbirke Moodo. Drugo poglavje predstavlja ozadje in trenutne trende raziskav na področju pridobivanja informacij iz glasbe, glas- bene vizualizacije in komunikacije človek-računalnik. Tretje poglavje opisuje metodologijo zbiranja podat- kov in zasnovo uporabniških vmesnikov za modelira- nje večmodalnih interakcij za potrebe glasbene zbirke Moodo. Predstavljena sta postopka preliminarne analize nabora čustvenih oznak in raziskave zaznavanja glasbe. Četrto poglavje obsega analizo zbranih podatkov, razi- skavo uporabniške izkušnje in rezultate evalvacije novih 94 PESEK ET AL. uporabniških vmesnikov MoodStripe in MoodGraph ter primerjavo s klasično metodo zbiranja podatkov. V za- ključnem, petem poglavju avtor razpravlja o možnostih nadaljne uporabe novih vmesnikov. Članek prinaša: • celovit pristop k načrtovanju metodologije za zbi- ranje podatkov o uporabnikih; • nova grafična uporabniška vmesnika MoodStripe in MoodGraph, ki po intuitivnosti in uporabniški izkušnji presegata obstoječe vmesnike za zbiranje podatkov o uporabnikih. 2 PREGLED PODROČJA Pregled področja zajema problematiko pridobivanja in- formacij iz glasbe s poudarkom na glasbenih pri- poročilnih sistemih in glasbeni vizualizaciji ter splošnih izzivih s področja komunikacije človek—računalnik. 2.1 Pridobivanje informacij iz glasbe Raziskave pri pridobivanju informacij iz glasbe (MIR) se primarno ukvarjajo z algoritmi za analizo podatkov iz glasbe. Med drugimi je eden od ciljev področja tudi graditev glasbenih priporočilnih sistemov. Ti lahko delujejo na podlagi različnih glasbenih parametrov. Sis- tem lahko glasbo priporoča glede na podobnost tre- nutno predvajanega posnetka z drugimi, izračunano na podlagi značilnic izločenih iz posnetkov. Posnetki se lahko primerjajo tudi na ravni metapodatkov, kjer sistem priporoča skladbe, ki so medsebojno podobne glede na izvajalca, obdobje ali zvrst. Čedalje pogostejši so tudi sistemi, ki primerjajo družabne oznake (angl. social tags), ki poleg pogosto vključenih oznak o žanru vsebu- jejo tudi podrobnosti o glasbenih entitetah, kot so: način izvedbe skladbe, tip vokala, uporabljeni inštrumenti in situacijske opise, npr. glasba za ozadje, telesne vaje ali delo. Prav tako so v oznakah pogosto prisotne čustvene oznake, ki se navezujejo na zaznana čustva v glasbi (npr. melanholično), kot tudi čustva, vzbujena v uporabniku (npr. vznemirjenje, energično). Prav čustva imajo pri izboru priporočil pomembno vlogo, zato je na področju MIR veliko aktivnih raziskav, ki se ukvarjajo z razvojem algoritmov za razpoznavo čustev v glasbi. Pri tem je potreba najprej definirati, kako lahko čustva sploh opišemo. Uporabnikovo počutje in trenutna čustva, kakor tudi čustveno označevanje glasbe, tipično zbiramo na dva načina: diskretno, kjer so čustva definirana kot diskretne kategorije, in zvezno, na pod- lagi prepletanja več dimenzij. Diskretni čustveni model meri intenziteto oz. prisotnost vsakega čustva posebej, ločeno od drugih čustev, tipično z večstopenjsko lestvico (npr. prisotno—neprisotno). Zvezni čustveni model pri merjenju čustev uporablja več dimenzij. Najbolj znan in pogosto uporabljen zvezni čustveni model je Russellov krožni model afekta (angl. Circumplex model of affect) [4]. V tem modelu so čustva predstavljena v dvodi- menzionalnem koordinatnem prostoru prijetnosti (angl. valence) in intenzitete (angl. arousal) — poimenova- nem tudi ”valence-arousal (VA) space” (v nadaljnjem besedilu VA- prostor). Izbira čustvenega modela ni tri- vialna in vpliva na rezultate modeliranja [5]. Za potrebe raziskav glasbene kognicije je bilo razvitih več različic Russellovega modela, na primer [6], [7], [8], [9], ki je v omenjenih raziskavah tudi najpogosteje uporabljen. Evalvacija MIR-algoritmov navadno poteka na ano- tiranih zbirkah podatkov, ki so zbrane z anketiranjem uporabnikov. V preteklih letih je bilo zgrajenih več javno dostopnih baz. Eerola idr. [5] so pri graditvi podatkovne zbirke, ki vsebuje 360 anotiranih posnetkov filmske glasbe, uporabili tridimenzionalni zvezni model (dimen- zije prijetnosti, intenzitete in napetosti). Podatkovna zbirka Mood Swings Turk vsebuje povprečno 17 anotacij za 240 posnetkov popularne glasbe; tu je bil uporabljen klasičen VA-model [10]. Prav tako so dvodimenzionalen VA model uporabili pri graditvi podatkovne zbirke MTV, ki vsebuje pet bipolarnih anotacij za 192 popularnih pe- smi [11] s seznamov predvajanj na kanalu MTV. Glavna omejitev obstoječih glasbenih zbirk za potrebe MIR je predvsem pomanjkanje zadostnega števila uporabniških podatkov, ki se navezujejo na zaznavanje glasbe. Poznamo tudi diskretne modele, ki v določenih vidi- kih presegajo različice Russelovega modela, na primer model GEMS [12] in zbirka čustev AllMusicGuide [13]. Zadnji naj bi bili primernejši za zajem vzbujenih čustev in so uporabljeni v več raziskavah [3], [14]. 2.2 Glasbena vizualizacija Raziskav na področju glasbene vizualizacije, ki po- udarjajo uporabniku prilagojen pristop, je razmeroma malo [15]. Eden večjih izzivov je povezovanje avdio— vizualnih modalitet uporabniškega vmesnika. Čeprav glasbene vizualizacije uporabljajo barvne sheme za upodobitev razmerij med entitetami, trenutni sistemi večinoma ne uporabljajo barvnih kombinacij, ki bi temeljile na analizi človekovega zaznavanja barv in glasbe, marveč so povezave med modalitetama izbrane naključno ali pa na podlagi nekih splošnih razmerij. Posledično je še danes glavni poudarek na vizuali- zacijah raznovrstnih glasbenih in zvočnih značilk, od nizkonivojskih spektralnih značilk do visokonivojskih glasbenih vzorcev in glasbenih metapodatkov [16]. Glas- bene vizualizacije te vrste lahko na grobo razdelimo v dve kategoriji: vizualizacije glasbenih parametrov (npr. harmonij, časovnih vzorcev in drugih glasbenih entitet) [17], [18], [19], [20] in vizualizacije virtualnih prostorov za pojasnjevanje razmerij med različnimi glasbenimi posnetki. Zadnji so primernesši za priporočilne sisteme in sisteme za analizo glasbe. Namen vizualizacij prosto- rov variira od aplikacij za virtualne glasbene knjižnice [21], [22], prilagoditve za mobilne naprave [23] do izdelave predogledov za predstavitev glasbenih datotek [24]. Nedavni izzivi, kot je npr. ”The Grand challenge at UPORABNIŠKI VMESNIKI IN METODOLOGIJA PRIDOBIVANJA VEČMODALNIH PODATKOV O GLASBI 95 Mirex evaluation exchange initiative”∗ pa kljub vsemu kažejo na to, da se zanimanje na področju uporabniško usmerjene interakcije in glasbene vizualizacije v za- dnjem času povečuje. 2.3 Uporabniški vidik: komunikacija človek— računalnik Področje komunikacije človek—računalnik (angl. hu- man computer interaction - HCI) se osredinja na funk- cionalnost in uporabnost uporabniških vmesnikov ter zajema celotno uporabnikovo izkušnjo. Zahteva integra- cijo treh osnovnih vidikov: človeški vidik (uporabnik), tehnološki vidik (sistem) in interakcijo med obema (ko- munikacija). Področje se v zadnjem času razvija v smer večmodalnih arhitektur [25] in povezovanje različnih sorodnih panog, kot so računalniški vid in procesiranje signalov z raziskavami v psihologiji, kognitivni znanosti in umetni inteligenci. V zadnjem času je čedalje več zanimanja za upo- rabniško usmerjen pristop, ki ne temelji zgolj na logični interakciji človek—računalnik, marveč poudarja subtilen (pogosto izmuzljiv in nelogičen), čustven del človeške komunikacije. To imenujemo ”čustveno računalništvo” [26] in pomeni aktualno temo uporabniško usmerjenih računalniških raziskav. Cilj čustvenega računalništva je simulacija vedenjskih vzorcev, osebnostnih in čustvenih značilnosti človeka z računalniškimi sredstvi: z opazova- njem, tolmačenjem in ustvarjanjem značilk čustvenega vpliva, vezanih na obdelavo informacij o uporabniku [27]. Danes je čedalje več primerov praktičnih aplikacij na različnih področjih, kot so navidezna resničnost, pametni nadzor, večmodalni vmesniki, nosljivi sen- zorji itn., s splošnim ciljem, da se izboljša interakcija človek—računalnik v bolj intuitivno, prilagojeno in pri- jetno uporabniško izkušnjo. 3 GRADITEV PODATKOVNE ZBIRKE Moodoo V nadaljevanju predstavljamo metodologijo graditve po- datkovne zbirke Moodoo, ki združuje podatke o upo- rabnkih in njihovih čustvenih in vizualnih odzivih na glasbo. Naš cilj je bil zbrati čim več čim bolj relevantnih podatkov, brez prevelikega bremena za anketirance, ki bi negativno vplivalo na kakovost zbranih podatkov. Zbiranje podatkov smo začeli s preliminarno analizo, s katero smo definirali nabor čustvenih oznak, upora- bljenih za označevanje čustev v zbirki. V nadaljevanju opisujemo osrednjo raziskavo, pri kateri predstavljamo tudi dva nova grafična uporabniška vmesnika za zajem podatkov: MoodStripe in MoodGraph in strukturo celo- tnega vprašalnika. Postopek zbiranja podatkov, vključno s preliminarno analizo, glavno raziskavo in naknadno evalvacijo vmesnikov, smo izvedli v slovenskem jeziku. ∗http://www.music-ir.org/mirex/wiki/2014:GC14UX 3.1 Preliminarna analiza: izbor čustvenih oznak in barv Namen preliminarne analize je bil izbor relevantnih čustvenih oznak za glavno raziskavo o čustvenem in barvnem zaznavanju glasbe. Pregled literature in raz- iskav s področja glasbenega zaznavanja, predvsem v psihologiji in MIR, namreč ni dal konkretnih rešitev, saj do danes nista bila splošno sprejeta model in nabor čustev, primernih za označevanje glasbe - obstoječe zbirke čustvenih oznak so večinoma izbrane intuitivno, brez dodatne razlage. Težava je tudi v tem, da niso vsa čustva primerna za opisovanje glasbe (npr. gnev). Posledično smo lasten nabor čustvenih oznak črpali iz več dobro definiranih dimenzionalnih in diskretnih modelov s področja raziskav glasbe [28], [12], [13]. Ker smo raziskavo izvedli v slovenskem jeziku in za slovensko govoreče uporabnike, smo v izhodišču zbrali širši nabor slovenskih čustvenih oznak, ki so bile kot podlaga za preliminarno analizo. V preliminarni analizi smo zbrali podatke 63 uporab- nikov. Vprašalnik je bil sestavljen iz 48 čustvenih oznak, s katerimi so uporabniki ocenjevali prisotnost čustev na sedemstopenjski (Likertovi) lestvici, od popolnoma ne- prisotno/neaktivno (1), do močno izraženo/aktivno (7). Z metodo glavnih komponent (angl. principal component analysis - PCA) smo identificirali prve tri komponente prostora oznak, ki so pojasnjevale več kot 64 odstotkov variance v podatkih. V končno zbirko smo vključili 17 čustvenih oznak, ki so močno korelirale s prvimi tremi komponentami. Preizkusili smo tudi najprimernejši način za izbor barve, ki opisuje posamezen glasbeni izsek, pri čemer smo uporabnikom ponudili možnost, da barvo izberejo s pomočjo zveznega barvnega kroga. Pozneje se je pri analizi pisnih opažanj uporabnikov (ob koncu ankete so uporabniki imeli možnost izražanja dodatnih opažanj) izkazalo, da je zvezni barvni krog preobsežen in za upo- rabnika prezahteven. Posledično smo razvili diskretni barvni krog z izborom 49 barv, kar je kompromis med kompleksnostjo in možnostjo izbire barve. Primernost izbranega diskretnega barvnega kroga smo v naknadnih raziskavah tudi evalvirali. Pomemben rezultat preliminarne analize je bilo opažanje uporabnikov o samem vmesniku za opisovanje čustev. Standardna Likertova lestvica je za uporabnika premalo intuitiven in preveč naporen vmesnik, saj je s to metodo prisiljen izbrati intenzivnost posameznega čustva na ločeni lestvici, za vsako čustvo posebej. Zaradi preglednosti, poenostavitve in zmanjšanja nepotrebnega napora pri označevanju smo posledično razvili dva nova grafična vmesnika za čustveno označevanje: MoodStripe in MoodGraph, ki ju predstavljamo v naslednjem raz- delku. 96 PESEK ET AL. 3.2 Glavna raziskava: pridobivanje uporabniko- vega zaznavanja čustev, barv in glasbe Glavno raziskavo smo načrtovali ob podpori rezulta- tov preliminarne analize. Potekala je v obliki daljšega vprašalnika, razdeljenega na tri dele. Prvi del vse- buje osnovna demografska vprašanja, ki vključujejo vprašanja o uporabnikovem glasbenem predznanju in izkušnjah. Drugi del se nanaša na uporabnikovo občutje ter zaznavanje čustev in barv, tretji del pa obravnava čustveno in barvno zaznavanje glasbe. 3.2.1 Prvi del: Demografski podatki: Z namenom evalvacije vpliva posameznikovega ozadja na zaznavo čustev, barv in glasbe smo v prvem delu zbirali osnovne demografske podatke. Ta del (tabela 1) vsebuje tri de- mografska vprašanja, vprašanja o glasbenih izkušnjah posameznika in glasbenih preferencah in dve vprašanji o prisotnosti zdravil in drog, ki bi lahko vplivala na zazna- vanje. Ker smo pri izpolnjevanju celotnega vprašalnika želeli doseči povprečen čas reševanja 15 minut, smo se posledično namenoma izognili večjemu naboru de- mografskih vprašanj, saj je zaradi vključevanja večih modalitet stuktura raziskave že dovolj kompleksna. 3.2.2 Drugi del: Podatki o trenutnem počutju in za- znavanju čustev in barv: Drugi del vprašalnika je osre- dotočen na pridobivanje informacij o uporabnikovem trenutnem počutju, njegovi zaznavi čustev in asociaciji čustev z barvami. Čustveno stanje je uporabnik sprva označil v dvodimenzionalnem VA—prostoru, glede na trenutno prijetnost in intenziteto čustvenega stanja (slika 1). V naslednjem koraku je uporabnik iz predstavljenega nabora čustvenih oznak vmesnika MoodGraph vsako po- samezno čustvo označil v VA-prostoru, glede na njegovo dojemanje posameznega čustva (slika 3). Na koncu smo uporabnika povprašali še o trenutnem čustvenem stanju, tako da je z oznakami, ki jih je postavljal v enodimen- zionalen grafični vmesnik MoodStripe (slika 4), izrazil prisotnost posameznega čustva. Struktura vprašanj in reference na posamezen grafični vmesnik, uporabljen pri posameznem vprašanju, so predstavljeni v tabeli 2. Slika 1: VA-prostor. Osi grafa označujejo prijetnost (abscisa) in intenziteto (ordinata) čustev. Slika 2: Diskretni barvni krog z 49 barvami (črna pika označuje izbrano barvo). Vprašanji 2 in 5 v drugem delu vprašalnika se nanašata na izbor barve v vmesniku. Slika 3: Grafični vmesnik MoodGraph: oznake čustev lahko po principu povleci in spusti (angl. drag-and-drop) uporabnik postavi v dvodimenzionalni VA-prostor. Slika 4: Grafični vmesnik MoodStripe: zaradi večje zbirke oznak smo v vprašalniku uporabili tri instance tega upo- rabniškega vmesnika za izvedbo vprašanja 4. Dimenzija se razteza od odsotnosti čustva (primerljiva večstopenjska lestvica pri označbi 1) do izrazito izraženega (lestvica pri najvišji stopnji) od leve proti desni. Oba grafična uporabniška vmesnika: MoodGraph in MoodStripe nadomeščata zbirko standardnih vmesnikov, t. j. Likertovih ordinalnih večstopenjskih lestvic, imple- mentiranih v obliki sistema gumbov (radio button), ki bi jih bilo treba implementirati za vsako čustveno oznako posebej. Glede na rezultate evalvacije vmesnikov (4. UPORABNIŠKI VMESNIKI IN METODOLOGIJA PRIDOBIVANJA VEČMODALNIH PODATKOV O GLASBI 97 Tabela 1: Demografska vprašanja. Posamezno vprašanje (prvi stolpec) vsebuje nabor mogočih odgovorov in dodatnih komentarjev (drugi stolpec). Odgovori na vprašanja so namenjeni odkrivanju potencialnih vplivov uporabnikovega ozadja na njegovo zaznavo. Vprašanje Mogoči odgovori in komentarji Starost v letih Spol {moški, ženska} Kraj bivanja {mesto, podeželje} Obiskovanje glasbene šole v letih, 0 - ni obiskoval/a Igranje inštrumenta ali petje v letih, 0 - ni igral/a Uporaba zdravil in drog ali uporabnik uživa zdravila ali droge Vpliv zdravil in drog ali je uporabnik trenutno pod vplivom zdravil ali drog, ki bi lahko vplivali na njegovo razpoloženje Preferenca glasbenih žanrov {Classical, Opera, Country, Folk, Latin, Dance / Disco, Electronic, RnB/Soul, Hip Hop/Rap, Reggae, Pop, Rock, Alternative, Metal, Blues, Jazz, Vocal, Easy Listening, New Age, Punk} - uporabnik je lahko zbral do tri (a najmanj enega) najljubše žanre. Žanri so bili predstavljeni v angleškem jeziku zaradi splošne uporabe tujih oznak v slovenščini Dnevno poslušanje glasbe {manj kot 1, 1-2, 2-3, več kot 3} - v urah na dan Tabela 2: Drugi del: Zbiranje podatkov o trenutnem počutju ter zaznavanju posameznih čustev in barv. Pri četrtem vprašanju smo zbirko čustvenih oznak zaradi obsežnosti razdelili na tri podvprašanja. Pri petem vprašanju je uporabnik dojemanje posamezne čustvene oznake določal v VA-prostoru (slika 1) kot tudi z barvo, ki po njegovem mnenju ponazarja čustvo (slika 2). Vprašanje Mogoči odgovori in komentarji Trenutno čustveno stanje v VA-prostoru VA-prostor - slika 1 Barva trenutnega čustvenega stanja Barvni krog - slika 2 Dojemanje čustvenih oznak {Strah, Energičnost, Jeza, Sproščenost, Sreča, Žalost, Živahnost, Veselje, Razočaranje, Nezadovoljstvo} - slika 3 Trenutno čustveno stanje {Aktivno, Budno, Dremavo, Neaktivno, Nesrečno, Nezadovoljno, Razočarano, Sproščeno, Srečno, Utrujeno, Vedro, Veselo, Zadovoljno, Zaspano, Žalostno, Mirno, Jezno} - slika 4 Barve, asociirane s čustvi {Žalost, Jeza, Sproščenost, Razočaranje, Sreča, Nezadovoljstvo, Veselje, Strah, Živahnost, Energičnost} - slika 2 poglavje), sta se oba nova vmesnika iskazala za bolj intuitivna in funkcionalna. 3.2.3 Tretji del: zbiranje podatkov o uporabnikovem dojemanju zaznanih čustev (v glasbenem posnetku) in vzbujenih čustev (v uporabniku) ter glasbeno-barvnih asociacij: Tretji del vprašalnika se je nanašal na dva vidika dojemanja čustev v glasbi ter na barvne asoci- acije, ki jih v uporabniku vzbudi glasba. Uporabniku smo predvajali deset naključno izbranih 15-sekundnih posnetkov. Po poslušanju posameznega posnetka je upo- rabnik v barvnem krogu (vmesnik na sliki 2) izbral barvo, ki najbolje izraža konkreten glasbeni posnetek. V naslednjem koraku je uporabnik s pomočjo dvokate- gorne različice vmesnika MoodGraph (slika 5) izbiral posamezne čustvene oznake, in sicer med kategorijo zaznanih čustev v glasbi (angl. perceived emotions; označenih z ikono glasbena nota) in kategorijo vzbujenih čustev ob poslušanju glasbe (angl. induced emotions; označenih z ikono uporabnik). 4 ANALIZA DEMOGRAFSKIH PODATKOV IN EVALVACIJA UPORABNIŠKE IZKUŠNJE V nadaljevanju sta predstavljeni demograska analiza podatkov, zajetih v glavni raziskavi, in naknadna eval- vacija uporabniške izkušnje in predlaganih uporabniških vmesnikov. 4.1 Demografski podatki V spletni raziskavi je sodelovalo več kot 1100 udeležencev, predstavljamo pa rezultate analize 741 98 PESEK ET AL. Slika 5: Dvokategorni grafični vmesnik MoodGraph: oznake čustev lahko po principu povleci in spusti (angl. drag and drop) uporabnik postavi v dvodimentionalni VA-prostor. Oznake posamezne kategorije so označene z ikono kategorije (ikona uporabnik oz. ikona glasbena nota). Modri piki označujeta pozicijo izbranega čustva po posamezni dimenziji v VA- prostoru. udeležencev, ki so v celoti rešili vprašalnik. Med temi je bilo 247 moških (33 %) in 494 žensk (67 %). Najmlajši je štel 15 let, najstarejši pa 64. Več kot 75 % udeležencev je bilo starih manj kot 30 let (Q3=28.45 let), kar je pogojeno tudi z načinom izvedbe vprašalnika na spletu in uporabo socialnih omrežij za širjenje informacij o raziskavi. Skoraj 60% moških, ki so sodelovali v raziskavi, ni nikoli obiskovalo glasbene šole; pri ženskah je delež manjši, le dobrih 44 odstotkov. Skoraj 12 % žensk in le 6 % moških je glasbeno šolo obiskovalo vsaj šest let. Glasbena izobrazba močno korelira z leti igranja inštrumenta in petja (r=0.652; p<0.000). Med preferiranimi žanri je najbolj popularen rock, ki ga je na prvo mesto postavilo kar 31 % udeležencev. Sledi pop s 17 % in alternativa ter klasična glasba, vsak z dobrimi petimi odstotki. Preostali žanri so zbrali manj kot 5 % glasov. Podobno lahko opazimo pri drugem najljubšem žanru: rock je dosegel 20 %, pop pa 14 %. Varianca med žanri se pri drugem najljubšem žanru povečuje glede na prvega. Zanimivo pa je, da je klasična glasba najbolj popularna kot tretja najljubša zvrst pri 13 % udeležencev. Sledi rock (12 %) in pop (10 %). Izbira prvega najljubšega žanra korelira z leti (Spearman rho=-0.094, p=0.011) in časom dnevnega poslušanja glasbe (Spearman rho=-0.111, p=0.002). Celotna analiza ankete, vključno z drugim in tretjim delom, je predsta- vljena v Pesek idr. [29]. 4.2 Evalvacija uporabniške izkušnje Po glavni raziskavi smo naknadno izvedli še raziskavo uporabniške izkušnje in evalvacijo uporabniških vmesni- kov MoodStripe, MoodGraph in diskretnega barvnega kroga. Uporabniki, ki so prisostvovali osnovni raziskavi, so ocenjevali več vidikov: uporabniško izkušnjo (angl. user experience - UX) [30], zahtevnost vprašalnika in različne vidike funkcionalnosti in primernosti grafičnih vmesnikov. Cilj naknadne raziskave so bile primerjava funkcionalnosti in uporabniše izkušnje novih in standar- dnih vmesnikov, tipično uporabljenih v raziskavah. Eval- vacijo vmesnikov smo izvedli na podlagi vprašalnika NASA load task index [31] in dodatnih specifičnih vprašanj o vmesnikih, predstavljenih v poglavju 4.2. Pri evalvaciji uporabniških vmesnikov je sodelovalo 125 udeležencev. Vprašanja so skupaj z rezultati pred- stavljena na slikah 6, 7, 8, 9. Pri mentalni zahtevnosti vprašalnika (slika 6) rezultati nakazujejo na komple- ksnost vprašalnika, kar je pričakovano glede na količino zahtevanih informacij, označevanja čustvenega zaznava- nja in dolžino vprašalnika. Pri meritvi fizičnega napora se kaže morebitna nezadostna definicija vprašanja. Na- men je bil zbrati informacije o fizičnem naporu (npr. premiki z miško so fizično bolj naporni kot izbira s tipkovnico) in posledično evalvirati operacijo povleci in spusti. Rezultat lahko nakazuje tudi na dve pod- množici uporabnikov — tisti, ki opravijo večino dela s tipkovnico (in jim operacije povleci in spusti pome- nijo fizični napor zaradi potrebe po uporabi miške), in tisti, ki preferirajo miško (in jim predstavljeni grafični vmesniki ne pomenijo dodatnega napora). Vsekakor je za utemeljen zaključek evalvacije fizičnega napora dano vprašanje problematično, saj način interakcije (miška ali tipkovnica) v vprašanju ni eksplicitno izpostavljen. Na sliki 7 so predstavljeni rezultati meritev intuitivno- sti vmesnika MoodStripe. Vmesnik je bil pri uporabnikih ocenjen kot izjemno intuitiven in hkrati časovno manj kompleksen kot klasična večstopenjska lestvica. Za ta vmesnik lahko z določeno mero gotovosti trdimo, da smo dosegli namen in je vmesnik primeren kot alterna- tiva za večstopenjsko lestvico. Prav tako smo opazovali intuitivnost in časovno kompleksnost vmesnika Mood- Graph, ki se je izkazal za intuitivnega, a pričakovano (glede na zahtevnost dvokategorijskega prepoznavanja in označevanja glasbenih posnetkov) tudi za časovno kompleksnega (slika 8). Uporabnike smo povprašali tudi po smiselnosti nabora čustvenih oznak in števila barv in za konec po oceni časovne zahtevnosti izpolnjevanja vprašalnika (slika 9). Ocena primernosti nabora čustvenih oznak nakazuje, da je čustvenih oznak morda preveč, a se rezultat nagiba k uravnoteženi porazdelitvi. Rezultati pri številu barv barvnega kroga nakazujejo na delno pomanjkanje do- datnih barv. Pri predpostavki omejitve časa reševanja vprašalnika na največ 15 minut smo se delno ušteli, saj je za sorazmeren del udeležencev vprašalnik pomenil večjo časovno obremenitev. UPORABNIŠKI VMESNIKI IN METODOLOGIJA PRIDOBIVANJA VEČMODALNIH PODATKOV O GLASBI 99 Slika 6: Mentalna, fizična in časovna kompleksnot vprašalnika. Pričakovano je vprašalnik zahteval porazdeljen mentalni napor, fizični napor je nepričakovano bimodalno porazdeljen, časovna zahtevnost in kompleksnost reševanja pa sta rahlo nadpovprečni. Slika 7: Intuitivnost vmesnika MoodStripe. Vmesnik je ocenjen kot izjemno intuitiven in časovno manj kompleksen kot klasična večstopenjska lestvica. Slika 8: Ocena intuitivnosti in časovne zahtevnosti vmesnika MoodGraph. V tem primeru nismo izvedli primerjave s standardnimi vmesniki, saj je vmesnik kombinacija postavljanja točk v VA-prostor in oceno prisotnosti za vsako čustvo (glede na dve kategoriji), česar ni mogoče preprosto replicirati s klasičnim pristopom. 5 SKLEP Podatkovna zbirka Moodo je temeljna podlaga za gradi- tev personaliziranega priporočilnega sistema za glasbo. Z njo želimo preseči omejitve obstoječih glasbenih priporočilnih sistemov s povezovanjem avdio vizual- nih modalnosti v odločitveni model in s povzemanjem trenutnega počutja posameznika, njegovih osebnostnih lastnosti in širšega konteksta. V članku smo se osredinili na metodologijo zajemanja podatkov, ki smo jo izvedli v treh korakih, pri čemer smo za izboljšanje uporabniške izkušnje uvedli tudi dva nova grafična vmesnika: MoodStripe in MoodGraph. Z vmesniki smo izvedli zbiranje podatkov za podatkovno zbirko in jih nato evalvirali. Predstavljena metodologija je dala dobre rezultate, saj smo v glavni raziskavi zajeli več kot 1100 udeležencev, identificirali pa smo tudi 100 PESEK ET AL. Slika 9: Ocena primernosti nabora čustvenih oznak, ki nakazuje, da je čustvenih oznak morda preveč, a se hkrati rezultat nagiba k uravnoteženi porazdelitvi. Po drugi strani bi si uporabniki želeli večji nabor barv, kot jih ponuja obstoječa različica diskretnega barvnega kroga. Meritev časovne zahtevnosti kaže, da je večina udeležencev je porabila več kot 11 minut časa za izpolnitev vprašalnika. ključne smernice za nadaljnje izboljšave vmesnikov. Rezultati evalvacije vmesnikov MoodStripe in Mood- Graph nakazujejo na večjo intuitivnost in izboljšano uporabniško izkušnjo glede na standardne vmesnike. Predstavljeni vmesniki so uporabni širše, predvsem na področjih, ki se ukvarjajo z merjenjem uporab- nikovega zaznavanja in povezovanja večih modalitet. Predvsem so to teme na področjih, kot so: psiho- logija, kognitivne in sociološko orientirane znanosti), kjer ”temeljna resnica” ni striktno definirana, temveč je odvisna od odziva uporabnikov, ki jih zajamemo prek vprašalnikov. Evalvacija obeh uporabniških vme- snikov, MoodStripe in MoodGraph, potrjuje prednosti z vidika intuitivnosti in funkcionalnosti, ter splošne uporabniške izkušnje v primerjavi s klasičnim načinom zbiranja podatkov o uporabnikih. MoodStripe nam z metodo povleci in spusti omogoča preprosto označevanje več parametrov znotraj istega vmesnika, MoodGraph pa tudi možnost večkategoričnega označevanja v dvo- dimenzionalnem prostoru. S tem se močno izboljšajo sama interakcija s sistemom, preglednost označevanja in primerjanja posameznih parametrov, ki se izvaja v istem vmesniku, posledično pa tudi časovna zahtevnost celotnega procesa. Dolgoročni cilj je standardizacija vmesnikov MoodStripe in MoodGraph. V ta namen načrtujemo aplikacijo in evalvacijo uporabnosti obeh vmesnikov na drugih sorodnih področjih. ZAHVALA Raziskavo delno financira Evropski socialni sklad v okviru programa Inovativna shema - 2012.