1 Uvod V zadnjih letih je v robotiki opaziti povečan razvoj algo- ritmov za izvajanje periodičnih oz. ritmičnih nalog [1, 2]. Med te naloge spadajo povsem vsakdanje naloge, kot je npr. hoja [3] ali rokovanje [4], ter naloge vodenja ra- zličnih naprav, kot sta npr. napravi jojo [1] in žiroskopska naprava imenovana Powerball [2, 5, 6]. Tako naprava Prejet 15. oktober, 2009 Odobren 18. januar, 2010 jojo kot žiroskopska naprava Powerball sta nelinearna di- namična sistema, ki za uspešno izvedbo zahtevata sinhro- nizirano gibanje upravljavca in naprave. Njuno vodenje je za človeka povsem preprosto. Izvedba teh nalog z roboti pa je zahteven problem, ki zahteva uporabo naprednih algoritmov vodenja in kompleksnih senzorskih sistemov [1, 2]. Generiranje robotske trajektorije in njeno moduli- ranje je v robotiki zahteven problem, ki za splošen sistem še ni rešen. Eden od pristopov je generiranje trajektorije s posnemanjem oz. imitacijo [7]. Robotske trajektorije lahko posnemamo na različne načine [8]. Preprosteje je, da si zapomnimo časovno in- deksirane vektorje [9]. Večkrat se uporabijo bolj kompak- tni zapisi trajektorij, npr. z uporabo zlepkov [10] ali pa verjetnostnih zapisov v obliki skritih modelov Markova [11]. Eden od kompaktnejših zapisov je tudi uporaba dinamičnih primitivov imenovanih DMP [12], ki trajek- torijo zapišejo z vektorjem uteži, rekonstruirajo pa jo z linearno kombinacijo jedrnih funkcij. Dodatna prednost DMPjev je tudi zapis trajektorije z diferencialno enačbo drugega reda, ki zagotavlja zvezno in odvedljivo trajek- torijo. Pri izvajanju periodičnih nalog je bistveno določiti os- novno frekvenco gibanja [6]. Da lahko izločijo osnovno frekvenco gibanja, morajo sistemi posnemanja gibanja najprej obdelati demonstracijski signal [8]. V članku opisujemo uporabo sistema za posnemanje gibanja, ki deluje na podlagi DMP, kjer je določanje osnovne 32 Petrič, Gams, Žlajpah frekvence demonstracijskega signala vključeno v sam sistem. Tako sistem ne potrebuje nobene dodatne ob- delave signala in omogoča sprotno prilagajanje frekvenci zunanjega signala. Sistem deluje vzporedno v dveh nivojih. Prvi nivo določi frekvenco merjenega signala, drugi pa zagotavlja sledenje obliki trajektorije. Dvo- nivojski sistem posnemanja gibanja, ki smo ga upora- bili za izvedbo periodične naloge vodenja naprave jojo, temelji na frekvenčno prilagodljivih oscilatorjih in neli- nearnih dinamičnih sistemih [8] oz. DMPjih. V [8] so avtorji pokazali, da je sistem uporaben za določanje frekvence vhodnega signala, učenje oblike ene periode vhodnega signala in posnemanje naučenega signala s poljubno frekvenco in amplitudo. V tem prispevku bomo pokazali, da se lahko podobno strukturiran sistem uporabi za vodenje dinamičnih nelinearnih periodičnih nalog, kot je vodenje naprave jojo. Robotsko vodenje naprave jojo je že bilo predmet več raziskav [1, 13, 14]. Razviti so bili namenski al- goritmi vodenja s klasičnim pristopom na podlagi mo- deliranja sistemov. Naš raziskovalni izziv je namesto klasičnega pristopa z matematičnim modeliranjem upora- biti pristop, ki se zgleduje po človeku. Povprečni uporab- niki te naprave o dinamiki ne vedo kaj dosti, kljub temu pa se večina kaj hitro nauči uporabljati napravo. Podobno velja tudi za predlagani imitacijski sistem, saj ta ne temelji na modelih vodene naprave, temveč je odvisen le od merljivega periodičnega signala. Takšna struktura vo- denja bistveno poenostavi sinhronizacijo robota z zadano nalogo in omogoča preprosto doseganje človeku podob- nih rezultatov pri izvajanju nalog, ki zahtevajo sinhro- nizacijo z vodeno napravo. V naslednjih poglavjih je najprej podan opis predla- ganega sistema vodenja (2. poglavje). V 3. poglavju je opisan eksperimentalni sistem in dokumentirani so rezul- tati vodenja. Sklepi so podani v 4. poglavju. 2 Imitacijski sistem Imitacijski sistem je bil podrobno opisan za uporabo v cikličnih periodičnih nalogah v [8]. Avtorji so pokazali, da je sistem uporaben za določanje frekvence vhod- nega signala, učenje oblike ene periode in posnemanje naučenega signala pri poljubni frekvenci in amplitudi. V tem prispevku je predstavljena uporaba imitacijskega sis- tema za določanje frekvence periodične naloge, sinhro- nizacije robota s specifično nalogo in modulacijo pred- definirane trajektorije. Predlagana struktura vodenja omogoča vodenje različnih periodičnih nalog, ki imajo vsaj eno merljivo periodično veličino. Strukturo imitacijskega sistema sestavljata dva nivoja, kot to prikazuje slika 1. Prvi nivo predstavlja kanonični dinamični sistem (nabor diferencialnih enačb). Naloga na tem nivoju je izločiti osnovno frekvenco vhodnega sig- nala, ki je katerakoli merljiva periodična veličina. Če se imitacijski sistem uporabi za učenje trajektorije, kot v [8], je želena trajektorija enaka vhodnemu signalu. Drugi nivo sistema je izhodni dinamični sistem, katerega izhod je želena trajektorija robota. Diferencialne enačbe tega sis- tema so drugega reda, kar zagotavlja gladko in odvedljivo trajektorijo. Izhodni signal sestavimo z linearno kombi- nacijo utežnih in jedrnih funkcij ψ. + - Kanonični dinamični sistem Izhodni dinamični sistem+ + yin(t) Ω φ yd(t) w φl r Slika 1. Predlagana dvonivojska struktura sistema vodenja. Vhod v sistem je merjena periodična veličina yin, izhod je želena trajektorija robota yd. φl je fazni zamik med vhodnim in izhodnim signalom in r je parameter amplitude izhodnega signala Figure 1. Proposed two-layered structure of the control system. The input yin is a measured periodic quantity and the output is the desired trajectory yd of the robot. φl is the phase lag between the input and the output signal and r is the amplitude parameter Algoritem imitacijskega sistema je naslednji. Kanonični dinamični sistem izloči osnovno frekvenco Ω in fazo φ. Ti veličini sta povezani z izhodnim dinamičnim sistemom in določata frekvenco želene trajektorije. Oblika trajektorije je podana z vnaprej naučenim vektorjem uteži w in jedrnimi funkcijami ψ. Trajektorija se sinhronizira s frekvenco Ω s sidranjem jedrnih funkcij ψ na fazo φ. Naslednji poglavji podrobno opisujeta posamezna nivoja imitacijskega sistema. 2.1 Kanonični dinamični sistem Naloga kanoničnega sistema je izločiti osnovno frekvenco Ω, zagotoviti stabilno ciklično obnašanje sistema in s tem določiti fazo φ. Kanonični dinamični sistem sestavlja množica frekvenčno prilagodljivih faznih oscilatorjev [15, 16]. Oscilatorji so združeni v povratno zanko [8, 17], kot to prikazuje slika 2. Matematična struktura M adaptivnih frekvenčnih os- cilatorjev je podana z enačbami: φ̇i = ωi −Ke(t) sinφi, (1) ω̇i = −Ke(t) sinφi, (2) e(t) = yin(t)− ŷ(t), (3) ŷ(t) = M ∑ i=1 αi cosφi, (4) α̇i = ηe(t) cosφi, (5) kjer je K konstanta medsebojne povezanosti, φi faza i- tega oscilatorja, e(t) vhod v oscilatorje, yin vhodni signal, M število oscilatorjev, αi amplituda i-tega oscilatorja in η konstanta učenja. Vsi oscilatorji imajo enak vhodni signal e(t), kot to prikazuje slika 2. Zaradi negativne povratne zanke (3), Robotizirani jojo: strategija vodenja z uporabo nelinearnih dinamičnih sistemov 33 + - yin(t) e(t) ŷ(t) Ω, Φ ∑ αicos(φi) ω1(t), φ1 ω2(t), φ2 ω3(t), φ3 ωM (t), φM Logic Slika 2. Povratnozačna struktura M nelinearnih frekvenčno pri- lagodljivih oscilatorjev Figure 2. Feedback structure of M nonlinear adaptive frequency oscillators se razlika med vhodnim signalom in vsoto posameznih faznih signalov približuje ničli. Takšna struktura se lahko prilagodi različnim frekvenčnim komponentam vhodnega signala. Število frekvenčnih komponent je odvisno od števila uporabljenih frekvenčnih oscilatorjev. Ker je za izvajanje periodičnega giba pomembna samo osnovna frekvenca, sledi strukturi logični blok, ki določi osnovno frekvenco. Izbira oscilatorja z osnovno frekvenco je pomembna, saj izbrani oscilator poganja drugi nivo im- itacijskega sistema. Kanonični dinamični sistem se lahko uporabi tudi kot samostojen imitacijski sistem [17]. Z dodanim izhod- nim dinamičnim sistemom zagotovimo predvsem večjo robustnost sistema na različne perturbacije in možnost kompleksnih trajektorij z majhnim številom oscilatorjev. 2.2 Izhodni dinamični sistem Izhodni dinamični sistem se uporablja za generiranje in moduliranje oblike izhodnega signala. Kot je prikazano na sliki 1, so vhodi v izhodni dinamični sistem: osnovna frekvenca Ω, faza φ, amplituda trajektorije r in vektor uteži w. Ta vektor skupaj z diferencialnimi enačbami in jedrnimi funkcijami ψ določa obliko izhodnega signala drugega reda. Enačbe (6-11) veljajo za eno prostostno stopnjo sig- nala. Za več prostostnih stopenj se algoritem poveže vz- poredno. Obnašanje dinamičnega sistema je naslednje: trajektorija y potuje proti sidrišču g, kar podaja enačba ż = Ω     αz (βz (g − y)− z) + N ∑ i=1 ψiwir N ∑ i=1 ψi     , (6) ẏ = Ωz. (7) V tem primeru je Ω frekvenca, dobljena iz kanoničnega dinamičnega sistema, αz in βz sta pozitivni konstanti, ki zagotavljata, da sistem monotono konvergira k trajek- toriji, ki oscilira okoli sidriščne točke g. N je število je- drnih funkcij. Parameter r določa amplitudo izhodnega signala. Nelinearen člen v enačbi (6) določa želeno ob- liko trajektorije z množenjem jedrnih funkcij in vnaprej definiranega vektorja uteži w (wi ∈ w, i = 1, ..., N ). Jedrne funkcije ψ imajo Gaussovo obliko in so podane z enačbo ψi = exp (h (cos (φ− ci)− 1)) . (8) Njihovo širino določa h, porazdeljenost na eni periodi pa ci. V našem primeru je ci enakomerno porazdeljen med 0 in 2π v N korakih. Predlagani dvonivojski imitacijski sistem se lahko uporabi ne samo za generiranje in moduliranje izhod- nega signala, temveč tudi za učenje nove trajektorije. Ta prispevek se osredinja na generiranje in moduliranje izhodnega signala. Kot je bilo prikazano v [8], se lahko sistem uporabi tudi za učenje nove trajektorije, in sicer tako, da se v vsakem koraku spremeni vektor uteži w z metodo progresivne lokalne utežnostne regresije (ang. in- cremental locally weighted regression) [18]. S podanim ciljem ftarg(t) in r(t) je posodobitev wi v rekurziji po- dana z w t+1 i = w t i +ΨiP t+1 i r(t)er(t), (9) P t+1 i = 1 λ ( P t i − P t2 i r t2 λ Ψi + P t i r t2 ) , (10) er(t) = ftarg(t)− w t ir(t). (11) Začetno stanje rekurzije je wi = 0 in Pi = 1, kjer je i = 1, ..., N . S tem algoritmom smo določili utežnostni vektor za vnaprej definirano trajektorijo za vo- denje naprave jojo. Rezultate učenja želene trajektorije prikazuje slika 4. Dodatna prednost izhodnega dinamičnega sistema je gladko moduliranje izhodnega signala. To je pomembno, kadar imamo opravka s hitrimi dinamičnimi nalogami. 3 Vodenje naprave jojo V tem poglavju je predstavljena uporaba imitacijskega sistema za robotsko vodenje naprave jojo. Na eksperi- mentalnem sistemu je predstavljena uporaba imitacij- skega sistema z merjeno silo v povratni zanki in z rela- tivnim položajem naprave jojo v povratni zanki. Upora- bili smo različni napravi jojo. Njuni parametri so podani v tabeli 1. Opravljene so bile različne raziskave ter izpeljani ra- zlični algoritmi za vodenje naprave jojo [1, 13, 14]. Ti algoritmi se med seboj ločijo glede na merjeno veličino, ki je v povratni zanki. Na primer, veličina je lahko re- lativna višina naprave jojo, ki se lahko meri z uporabo računalniškega vida. Kot je opisano v [1], je pri 34 Petrič, Gams, Žlajpah Tip ra [m] l [m] m [kg] A 0.01 0.85 0.2564 B 0.01 0.7 0.2564 Tabela 1. Parametri naprav jojo, uporabljenih v eksperimentih Table 1. yoyo parameters used in experiments človeku informacija o višini ključna za uspešno igranje z napravo. V [13] so avtorji pokazali, da za uspešno robotsko vodenje naprave jojo zadostuje tudi samo mer- jenje sile na vrvici. V obeh primerih algoritma vo- denja temeljita na natančnem poznavanju dinamičnega obnašanja naprave. V tem prispevku pa je namesto klasičnega modeliranja uporabljen pristop, ki posnema človeka. Vodenje ne temelji več na modelih vodene naprave, temveč je odvisno le od poljubnega periodično merljivega signala. Takšna struktura vodenja bistveno poenostavi sinhronizacijo robota z napravo. Sinhro- nizacija ne temelji več na poznavanju dinamike naprave jojo, temveč se vzpostavi s pomočjo frekvence in trenutne faze merjenega periodičnega signala. To prinese dodatno prednost, saj je vhodni signal lahko katerakoli merljiva periodična veličina vodene naprave. Za izvedbo eksperimenta je bil uporabljen robot Mit- subishi PA-10 s sedmimi prostostnimi stopnjami. Na vrh robota smo pritrdili senzor sil in navora JR3, nanj pa dvoprstno prijemalo. V poglavju 3.2 je prikazana dodatna uporaba kamere, s katero smo merili relativno višino naprave jojo. Eksperimentalno postavitev podaja slika 3. Implementacija imitacijskega sistema je izvedena v okolju MATLAB/SIMULINK s frekvenco 100 Hz. Senzor sile Jojo Prijemalo Vrv Mitsubishi Pa-10 Kamera Slika 3. Eksperimentalni sistem Figure 3. Experimental setup Za izvedbo kakršnekoli naloge z napravo jojo je treba najprej definirati obliko trajektorije v eni periodi. Upora- bili smo vzorec, ki je opisan v [1]. Vzorec temelji na analizi gibanja naprave in omogoča vodenje naprave jojo. Obliko želene pozicije h, hitrosti ḣ in pospeška ḧ podaja slika 4. Utežnostni vektor w za obliko trajektorije na sliki 4 smo določili s pomočjo algoritma, opisanega z enačbami (9) - (11). Naučeni signal je prikazan s črtkano črto na h href h ḣ 0 1 ḧ t [s] Slika 4. Vnaprej definirana oblika trajektorije vrha roke za igranje z napravo jojo Figure 4. Pre-defined hand motion pattern for playing yoyo sliki 4. Utežnostni vektor je osnova za kreiranje izhod- nega signala iz imitacijskega sistema. Frekvenca in faza izhodnega dinamičnega sistema ter s tem tudi sinhro- nizacija robota z zadano nalogo je določena s kanoničnim dinamičnim sistemom. Gibanje robota smo omejili v eni smeri (gor-dol) s pomočjo inverznega kinematičnega modela. V nadaljevanju so predstavljeni rezultati vodenja z merjeno silo v povratni zanki (poglavje 3.1) in merjenim položajem v povratni zanki (poglavje 3.2). 3.1 Vodenje pri sinhronizaciji z merjeno silo Shema vodenja ob sinhronizaciji z merjeno silo je pred- stavljena na sliki 5. Kot je razvidno, imitacijski sistem generira in modulira želeno trajektorijo vrha robota, na katerem je pritrjena naprava jojo. Sila F , ki se meri s senzorjem sil in navorov JR3 na vrhu robota, zaključuje povratno zanko vodenja. + - Kanonični dinamični sistem Izhodni dinamični sistem Jojo ali h(t) F (t) Ω φ x(t) w Slika 5. Predlagana dvonivojska struktura za vodenje naprave jojo s silo ali relativnim položajem v povratni zanki Figure 5. Proposed two-layered structure of the control system for playing with yoyo, using force feedback or relative hieght of the jojo as a feedback Rezultati frekvenčne adaptacije so predstavljeni na sliki 6. Na zgornjem levem diagramu je predstavljena merjena sila v časovnem okviru od 0 do 400 s. Ker je ob- lika in frekvenca pulzov čez celotni časovni okvir enaka, sklepamo, da je naprava jojo dosegla stabilno delovanje. Podrobnejši vpogled v obliko merjene sile F podaja zgornji desni graf, kjer je časovni okvir od 200 do 210 s. S primerjavo desnih grafov opazimo, da je imitacij- Robotizirani jojo: strategija vodenja z uporabo nelinearnih dinamičnih sistemov 35 0 100 200 300 400 −3 −2 −1 0 1 F [N ] 0 100 200 300 400 0 5 10 t [s] Ω [r a s/ s] 200 205 210 −3 1 F [N ] 200 205 210 0 0.1 x [m ] t [s] Slika 6. Vodenje naprave jojo s silo F v povratni zanki (zgornja grafa). Trajektorija robota v smeri x (spodnji desni graf) in frekvenca Ω (spodnji levi graf). Jojo tipa A Figure 6. Playing yoyo by measuring only the force F (top plots). Robot trajectory x (bottom left plot) and the extracted frequency Ω (bottom right plot). Yoyo: type A skemu sistemu uspelo sinhronizirati gibanje robota x z merjeno silo F , ki v tem primeru pomeni merljivo pe- riodično veličino vodene naprave. Na spodnjem levem grafu je ponazorjena frekvenca Ω, kjer opazimo nihanje okoli določene srednje vrednosti. Vzrok za nihanje okoli srednje vrednosti je v obliki vhodnega signala (sile F ), katerega smo zaradi boljše konvergence imitacijskega sis- tema in povečanja razmerja med šumom in koristim sig- nalom preoblikovali tako, da smo mu povečali njegovo površino. 3.2 Vodenje pri sinhronizaciji z merjenim relativnim položajem V tem podpoglavju je predstavljena implementacija imi- tacijskega sistema za vodenje naprave jojo z merjenim položajem v povratni zanki. Relativni položaj naprave glede na vrh robota se lahko uspešno določi s pomočjo merilnega videosistema. V prispevku [1] avtor pravi, da človek za igranje z napravo jojo potrebuje vizualno infor- macijo o trenutnem položaju naprave. Prav tako kot v poglavju 3.1 je tudi v tem poglavju uporabljen enak princip vodenja, kar ponazarja shema na sliki 5. V tem primeru je vhodni signal v imitacijski sis- tem relativni položaj naprave jojo. Kot je prikazano na spodnjem grafu na sliki 7, se frekvenca Ω hitro prilagodi frekvenci gibanja naprave jojo. S tem dosežemo stabilno obnašanje naprave. Potek gibanja naprave jojo je prikazan na zgornjem grafu na sliki 7, kjer je s črtkano črto ponazorjena največja višina, ki jo naprava doseže v eni periodi. Opazimo, da se kljub temu, da je amplituda giba konstantna, maksimalna višina naprave jojo spreminja. To je posledica nihanja same naprave jojo, ki lahko na trenutke povzroči povečanje trenja med vrvjo in njenima diskoma, kar posledično zmanjša doseženo največjo višino naprave. Frekvenca naprave jojo je odvisna od njenih parametrov in od največje višine, ki jo doseže v eni pe- 0 10 20 30 40 50 60 −0.8 −0.6 −0.4 −0.2 h [m ] h hpeek 0 10 20 30 40 50 60 2 3 4 t [s] Ω [r a s/ s] Slika 7. Vodenje naprave jojo z merjenjem relativne višine h (zgornji graf). Jojo tipa B Figure 7. Playing yoyo by measuring the relative hihgt h (the top plot). Yoyo: type B riodi. Na to višino lahko vplivamo z velikostjo amplitude giba. Amplitudna modulacija je z uporabo imitacijskega sistema preprosta in se doseže s spremembo parametra r (glej enačbo (6) in sliko 1). Z uvedbo reguliranja parametra r dosežemo regulacijo maksimalne višine naprave jojo v eni periodi. Vhod v re- gulator je razlika med referenčno in največjo vrednostjo položaja naprave v eni periodi. Uporabili smo PI regula- tor u(t) = kpe(t) + ki ∫ e(t)dt, (12) s parametroma kp = 2 in ki = 0.4. Parametra smo določili empirično. + - Kanonični dinamični sistem Izhodni dinamični sistem Jojo R h(t) Ω φ x(t) w hd h̃ Slika 8. Predlagana dvonivojska struktura za reguliranje na- jvečje višine, ki jo naprava jojo doseže v eni periodi Figure 8. Proposed two-layered structure of the control system for regulating the peak hight of the yoyo Rezultati regulacije največje višine, ki jo naprava jojo doseže v eni periodi, so podani na sliki 9. Izkaže se, da potem ko se imitacijski sistem sinhronizira z napravo, kar ponazarja frekvenca Ω (spodnji graf), ta dobro sledi refe- renčni vrednosti. Doseženo vodenje naprave je stabilno. Določena odstopanja, ki so opažena v merjeni relativni višini, so bodisi posledica napake merilnega sistema bod- isi posledica že opisanega nihanja naprave jojo. 4 Sklep Najpomembnejši prispevek tega dela je uvedba imitacij- skega sistema v vodenje dinamičnih ritmičnih nalog, ki so nelinearne in hkrati zahtevajo sinhronizacijo gibanja 0 50 100 150 200 250 300 350 400 −0.8 −0.6 −0.4 −0.2 h [m ] h href 0 50 100 150 200 250 300 350 400 2 2.5 3 3.5 t [s] Ω [r a s/ s] Slika 9. Vodenje naprave jojo z reguliranjem relativne višine h (zgornji graf). Jojo tipa B Figure 9. Regulating the peak height of the yoyo by measuring the relative height h (the top plot). Yoyo: type B robota z vodeno napravo. Zaradi preproste uporabe in ro- bustnosti, ki jih prinaša predlagani imitacijski sistem, je ta primeren za vodenje takšnih nalog. Pomembno je le, da je vhod v imitacijski sistem ena periodično merljivih veličin sistema. Na primeru naprave jojo so prikazani eksperi- mentalni rezultati uporabe imitacijskega sistema. Izkaže se, da kljub temu, da je naloga dinamična, nelinearna in periodična, imitacijskemu sistemu uspe pravilno in dovolj hitro razbrati frekvenco in sinhronizirati gibanje robota z gibanjem naprave. Dodatno je bilo na primeru jojo pokazano, da je sis- tem neodvisen od vhodne merilne veličine, dokler je ta ena merljivih periodičnih veličin. V obeh predstavljenih primerih, merjenje sile ali merjenje relativnega položaja, je sistemu uspelo hitro razbrati pravilno frekvenco in vz- postaviti stabilno delovanje naprave. Po do zdaj objavl- jenih podatkih je ta sistem edini, ki je brez bistvenih spre- memb algoritma vodenja sposoben voditi napravo jojo, ne glede na izbrani merjeni signal. Z uvedbo regulacijske zanke za parameter r, ki omogoča amplitudno modulacijo trajektorije, smo dosegli tudi regulacijo največje višine, ki jo naprava jojo doseže v eni periodi na realnem sistemu. 5 Literatura [1] L. Žlajpah, Robotic yo-yo: modeling and control strate- gies, Robotica, Vol 24(2), pp. 211–220, 2005. [2] P. Cafuta in B. Curk, Neholonomsko robotsko breme, Elektrotehniški vestnik, Vol. 76(3), pp. 103–107, 2009. [3] A.J. Ijspeert, Central pattern generators for locomotion control in animals and robots: a review, Neural Networks, Vol. 21(4), 2008. [4] T. Kasuga in M. Hashimoto, Human-robot handshaking using neural oscillators, Proc. IEEE Int. Conf. Robotics and Automation, Spain (Barcelona), April, Vol. 4, pp. 3802–3807, 2005. [5] A. Gams, J. Lenarčič in L. Žlajpah, Vrtenje žiroskopske naprave z robotom, Elektrotehniški vestnik, Vol. 74(4), pp. 223–228, 2007. [6] T. Petrič, A. Gams in L. Žlajpah, Modeling and control strategy for robotic powerball, Proc. Int. Conf. Robotics in Alpe-Adria-Danube Region, RAAD, Romania (Brasov), May 25–27, 2009. [7] S. Schaal, Is imitation learning the route to humanoid robots?, Trends in cognitive sciences, Vol 3(6) , pp. 233– 248, 1999. [8] A. Gams, A. J. Ijspeert, S. Schaal in J. Lenarčič, On- line learning and modulation of periodic movements with nonlinear dynamical systems, Autonomous Robots, Vol. 27(1), pp. 3-23, 2009. [9] S. Kawamura in N. Fukao, Interpolation for input torque patterns obtained through learning control, Proc. Int. Conf. Automation, robotics and computer vision (ICARCV’94), 1994. [10] A. Ude, C. G. Atkeson, in M. Riley, Planning of joint trajectories for humanoid robots using B-spline wavelets, Proc. IEEE Int. Conf. Robotics and Automation, Califor- nia (San Francisco), April, pp. 2223–2228, 2000. [11] S. Calinon in A. Billard, Recognition and reproduction of gestures using a probabilistic framework combining PCA, ICA and HMM, Proc. Int. Conf. Machine Learning (ICML), Germany (Bonn), August , pp. 105–112, 2005. [12] S. Schaal, J. Peters, J. Nakanishi, in A. Ijspeert, Learn- ing movement primitives, International Symposium on Robotics Research (ISRR2003), Springer Tracts in Ad- vanced Robotics, Ciena, Italy: Springer, 2004. [13] H. Jin, Q. Ye, in M. Zacksenhouse, Return maps, pa- rameterization, and cycle-wise planning of yo-yo playing, IEEE Trans. Robotics, In press, 2009. [14] A. Gams, T. Petrič in L. Žlajpah, Controlling yo-yo and gyroscopic device with nonlinear dynamic systems, Proc. Int. Conf. Robotics in Alpe-Adria-Danube Region, RAAD, Romania (Brasov), May 25–27, 2009. [15] J. Buchli in A. Ijspeert, A simple, adaptive locomotion toy-system, Proc. Int. Conf. Simulation of Adaptive Be- havior (SAB’04), MIT Press, pp. 153–162, 2004. [16] L. Righetti, J. Buchl in A. Ijspert, Dynamic hebbian learn- ing in adaptive frequency oscillators, Physica, Vol. D 216(2) pp. 269–281, 2006. [17] L. Righetti in A. Ijspeert, Programmable central pattern generators: an application to biped locomotion control, Proc. IEEE Int. Conf. Robotics and Automation, pp. 1585– 1590, 2006. [18] S. Shall in C. G. Atkeson, Constructive incremental learn- ing from only local information, Neural Computation , Vol. 10(8), pp. 2047–2084, 1998. Tadej Petrič je diplomiral leta 2008 na Fakulteti za elek- trotehniko, računalništvo in informatiko v Mariboru. Zaposlen je kot mladi raziskovalec na Institutu ”Jožef Stefan”. Andrej Gams je diplomiral leta 2003 in doktoriral leta 2009 na Fakulteti za elektrotehniko v Ljubljani. Zaposlen je kot razisko- valec na Institutu ”Jožef Stefan”. Leon Žlajpah je diplomiral leta 1982, magistriral leta 1985 in doktoriral leta 1989 na Fakulteti za elektrotehniko v Ljubljani. Je raziskovalec in vodja odseka za avtomatiko, biokibernetiko in robotiko na Institutu ”Jožef Stefan”.