1 UVOD Cilj članka je predstaviti nadgradnjo poznane metode za zaznavanje srčnih utripov, zasnovane na rekonstrukciji signala EKG v 2D faznem prostoru z zaznavanjem P-Q- R-S-T karakterističnih točk elektrokardiograma (EKG). Delo je osredinjeno na obdelavo enega kanala EKG, ki zadostuje za pridobivanje informacije o delovanju kardiovaskularnega sistema [1, 2]. Metode za digitalno obdelavo signalov v faznem prostoru so že uveljavljene [3–10]. V delu je predstavljen pregled metod za digitalno obdelavo signalov EKG v faznem prostoru, uporabljenih v zadnjih dveh desetletjih [1, 2, 11–21]. Digitalna obdelava signala EKG je odločilnega pomena za učinkovito diagnozo srčnih motenj in obolenj. Večino klinično pomembne informacije EKG lahko izluščimo iz analize P-Q-R-S-T karakterističnih točk srčnega cikla (Slika 1). Zato je njihovo zaznavanje ena osnovnih nalog pri obdelavi signala EKG [22], razvoj učinkovitih avtomatskih metod za zaznavanje teh točk pa je zelo pomemben za odkrivanje srčnih obolenj v dolgih elektrokardiografskih posnetkih srčnih bolnikov [23]. Vse več pa je tudi nemedicinskih primerov uporabe EKG, v katerih je prav tako potrebno zaznavanje karakterističnih točk, npr. identifikacija oseb [24] in razpoznavanje čustev [25]. Rezultati v [24] kažejo, da so značilke pridobljene iz karakterističnih točk EKG, neodvisne od mesta postavitve senzorjev, neobčutljive na posameznikovo stanje stresa in edinstvene za vsakega posameznika ter tako primerne za identifikacijo oseb. Ugotovitve v [25] pa navajajo, da značilke, določene iz karakterističnih točk EKG, odlično izražajo čustveno stanje posameznika s skoraj 90-odstotno uspešnostjo za žalost in veselje. Avtomatsko zaznavanje karakterističnih točk je bilo že obravnavano v predhodnih delih [11, 22, 24–32]. Predlagane so bile različne metode, kot so odvajanje signalov in digitalno filtriranje [11, 22], valčna transformacija [26, 28, 31], nevronske mreže [27], skriti modeli Markova [29], Hilbertova transformacija [30]. Kardiovaskularni sistem je primer nelinearnega dinamičnega sistema [3]. Zaradi nedušene oscilacije pa ga lahko obravnavamo kot samodejni oscilator, ki pa ni strogo periodičen [1, 4]. Znanje determinističnega dinamičnega kaosa v realnih dinamičnih sistemih, kot je tudi kardiovaskularni, temelji na lastnostih njihovih atraktorjev (faznih portretov), ki služijo kot matematična slika takšnih sistemov [3]. Fazni portret je grafična predstavitev obnašanja dinamičnih sistemov v faznem prostoru in prva metoda za njihovo obdelavo je bila predstavljena v [5]. Fazni portret je sestavljen iz množice vseh poti dinamičnega sistema. Vsaka točka v faznem portretu kaže točno Prejet 28. september, 2011 Odobren 24. oktober, 2011 258 PLESNIK, MALGINA, TASIČ, ZAJC določeno stanje sistema v času. Z njihovo analizo je torej mogoče pregledati zgodovino posameznega dinamičnega sistema in na podlagi tega tudi oceniti njegovo obnašanje v prihodnje. Glede na [3] se dinamični sistem, ki ga ne moremo opisati z enačbami, ampak ga lahko zgolj opazujemo v času, imenuje sistem ''črne škatle''. Pri takšnem sistemu se vsa informacija nahaja v njegovih vhodnih in izhodnih signalih. Izhodni signal se lahko izmeri v obliki enodimenzionalnega časovnega skalarnega zaporedja xk=x(k*∆t), k = 1, …, N. (1) Različne metode rekonstrukcije faznega portreta dinamičnega sistema iz njegovega skalarnega časovnega zaporedja, opisanega z (1), so predstavljene v [6], matematična definicija metode zakasnitev, ki je uporabljena v tem delu, pa je posebej podana v [7]. Metoda zakasnitev je bila za modeliranje kaotičnega časovnega zaporedja uporabljena tudi v [8]. Pri obdelavi signalov EKG je bila rekonstrukcija faznih portretov iz skalarnega časovnega zaporedja uporabljena že v devetdesetih letih prejšnjega stoletja [1, 11–13]. Uporaba te metode na področju kardiografije pa se nadaljuje tudi v zadnjem desetletju v [2, 14–17]. V faznem portretu je upodobljen celoten posnetek EKG-signala v eni sami sliki (slika 1), kar poenostavlja delo z dolgimi posnetki, saj zamudno pomikanje po časovni lestvici ni več potrebno. Hkrati so predstavljene vse lastnosti celotnega EKG, kot so točke P-Q-R-S-T. Obstajajo tudi strojne implementacije metode v obliki detektorjev srčnih anomalij [18, 19], kjer avtorji metodo opisujejo kot hitro, natančno in zelo odporno na šum, kar nakazuje njeno uporabo v majhnih, prenosnih in nosljivih napravah, ki so omejene z energijskimi viri in procesno močjo (mobilni telefoni, pametni telefoni, elektronski obliži itd.). Poudariti velja, da gre v obeh primerih za obdelavo signala EKG v realnem času. Veljavo uporabe faznih portretov za obdelavo signala EKG pa potrjujejo tudi nekateri evropski raziskovalni projekti [33, 34]. Fazni portret je podrobneje opisan v [3, 9, 20], v [21] je podan obširen opis analize nelinearnega časovnega zaporedja EKG. Glede na njihove navedbe je metoda časovne zakasnitve za rekonstrukcijo faznega portreta najpreprostejša najpogosteje uporabljena (uporabljena je tudi v večini del, navedenih v tej sekciji). Ne glede na bolj redko uporabo pa je mogoča tudi uporaba drugih metod, npr. odvajanja, integriranja [2, 10]. 2 PODATKI Za evalvacijo predstavljenega algoritma je uporabljena QT baza [35] EKG-posnetkov, ki je zasnovana za preizkušanje algoritmov za zaznavanje posameznih valov EKG in njihovih mejnih vrednosti. Baza vsebuje 105 posnetkov EKG, v katerih so 15 Slika 1: Odsek normalnega EKG z označenimi karakterističnimi točkami iz posnetka sel100 iz QT baze [35] v (a) časovnem prostoru in (b) faznem prostoru minut dolgi signali EKG, vzorčeni z 250 Hz (225.000 vzorcev). Vsak posnetek vsebuje dva signala različnih kanalov z ročno določenimi karakterističnimi točkami na izbranem odseku vsaj 30 srčnih utripov. Skupaj je tako določenih 3622 kompleksov QRS, 3193 točk P in 3541 točk T. Algoritem je zasnovan in preizkušen v programskem okolju MATLAB® [36]. 3 METODA 3.1 Lastnosti normalnega EKG Elektrokardiogram upodablja električno aktivnost srca. Signal zajemamo na površini kože z elektrodami, ki posnamejo površinski kožni napetostni potencial. Razlika v teh potencialih med dvema elektrodama pomeni en EKG odvod. Standardna meritev EKG v medicini uporablja 12 kanalov [38], ki predstavijo delovanje srca iz 12 različnih smeri. Za zajem vseh 12 standardnih odvodov EKG-signala je potrebna namestitev 10 elektrod na točno določene lokacije telesa [37]. V tem delu je uporabljen en odvod (najraje odvod II), ki glede na [1, 2] zadostuje za rekonstrukcijo faznega portreta, zaznavanje posameznih točk EKG in klasifikacijo. Normalni EKG-cikel odvoda II je prikazan na sliki 1. Začne se s pozitivnim valom P, ki je posledica krčenja (depolarizacije) atrijev. Valu P sledi kombinacija treh valov: negativnega Q, pozitivnega R in negativnega S. Tej kombinaciji pravimo tudi kompleks QRS in pomeni sprostitev (repolarizacijo) atrijev in krčenje (depolarizacijo) ventriklov, ki se zgodita sočasno. Srčni cikel je končan s pozitivnim valom T, ki pomeni sprostitev (repolarizacijo) ventriklov. Amplitude teh valov, njihovo trajanje in intervali med njimi so lastnosti signala EKG in vsebujejo pomembne 0 0.2 0.4 0.6 0.8 1 0 0.5 1 1.5 2 2.5 t [s] (a) E C G (t ) [m V ] 0 0.5 1 1.5 2 2.5 0 0.5 1 1.5 2 2.5 ECG(t) [mV] (b) E C G (t + ta u ) [m V ] T P Q Q T RR S S P ZAZNAVANJE KARAKTERISTIČNIH TOČK ELEKTROKARDIOGRAMA V FAZNEM PROSTORU Z UPORABO RAČUNANJA… 259 informacije o delovanju srca, znane pa so tudi njihove normalne vrednosti [37]. 3.2 Rekonstrukcija faznega portreta – metoda zakasnitev Fazni portret dinamičnega sistema lahko glede na [6] in [7] rekonstruiramo v k-dimenzionalnem faznem prostoru. Iz enodimenzionalnega časovnega zaporedja skalarnih vrednosti y(t), ki določa dinamični sistem, ustvarimo n-dimenzionalni signal Y(t) ���� = �����, ��� + �, … , ��� + �� − 1����, (2) kjer je τ časovna zakasnitev in n dimenzija faznega prostora za rekonstrukcijo, v katerem je nato predstavljen fazni portret. V tem delu je fazni portret predstavljen v 2D (n = 2) faznem prostoru (y(t), y(t + τ)). Slika 1 prikazuje primer EKG-cikla v časovnem (slika 1(a)) in faznem prostoru (slika 1(b)) z označenimi karakterističnimi točkami. Na abscisno os faznega prostora so nanesene vrednosti amplitud osnovnega signala, na ordinatno os pa amplitudne vrednosti zakasnjenega signala. Ker je dimenzija faznega prostora določena, bo edini vpliv na sam fazni portret imela izbira zakasnitve. 3.3 Izbira optimalne zakasnitve Kompleks QRS (kombinacija valov Q, R in S) ter vala P in T povzročajo v faznem portretu specifične trajektorije in oblike. Določeno število zaporednih točk na teh trajektorijah sestavlja poligon in na podlagi njihove ploščine je mogoče razločevati med kompleksom QRS ter P in T valom, ki se odražajo v 2D faznem prostoru kot trije različno veliki poligoni (slika 1). Največji in najopaznejši poligon v faznem portretu je posledica kompleksa QRS, nekoliko manjši poligon pripada valu T, najmanjši, komaj vidni poligon pa je posledica vala P. Velikost teh poligonov določata amplituda posameznih valov in zakasnitev. Amplituda valov določi neko osnovno velikost poligonov, s primerno izbiro zakasnitve pa jih je mogoče še povečati oz. odpreti. Največji vpliv ima zakasnitev ravno na poligon kompleksa QRS. Da je razlika v velikosti med poligoni čim bolj očitna in zato zaznavanje posameznih valov čim lažje, je pomembno, da je uporabljena optimalna zakasnitev, ki čim bolj odpre poligone in maksimira njihovo velikost. Pri majhnih vrednostih zakasnitve τ je vrednost y(t+τ) blizu vrednosti y(t) in posledično je fazni portret zgoščen v bližini osi y = x. Z večanjem τ se fazni portret odpira in oddaljuje od diagonale, dokler ni dosežena točka preloma, ko fazni portret izgubi svojo okroglo obliko. Slika 2: Vpliv različnih vrednosti zakasnitve na obliko faznega portreta na primeru (a) dveh EKG ciklov: (b) 4 ms, (c) 10 ms, (d) 20 ms in (e) 40 ms Slika 2 prikazuje vpliv različnih vrednosti zakasnitve na obliko faznega portreta na primeru dveh ciklov EKG (slika 2(a)) posnetka sel100 iz QT baze [35]. Vrednost zakasnitve za rekonstrukcijo na sliki 2(b) je 4 ms, kar je majhna vrednost (en vzorec). Zato je fazni portret v tem primeru ozek in razporejen ob diagonali prostora. Slika 2(c) prikazuje fazni portret ob zakasnitvi 10 ms in lepo je vidna razlika v velikosti poligonov v primerjavi s prejšnjo sliko 2(b). Velikost faznega portreta narašča naprej do zakasnitve 20 ms (slika 2(d)), ko je dosežena prelomna točka. Fazni portreti pri zakasnitvah višjih vrednosti so prelomljeni, njihovi poligoni se med seboj sekajo in se tako razdelijo na več manjših, kar pa otežuje zaznavanje karakterističnih valov in točk. Primer takšnega faznega portreta prikazuje slika 2(e), kjer je vrednost zakasnitve 40 ms. Glede na vizualni učinek bi torej bila optimalna zakasnitev ravno vrednost tik pred točko preloma, to je 20 ms. Pred določitvijo optimalne zakasnitve je algoritem preizkušen na enominutnem segmentu EKG-signala posnetka sel16265 iz QT baze [35]. V izbranem intervalu je označenih 67 normalnih srčnih utripov. Fazni portret je rekonstruiran po postopku iz Sekcije 3.2. Slika 2(a) – (h) prikazuje fazne portrete izbranega signala pri različnih vrednostih zakasnitve. Namen poskusa je prikazati vpliv različnih vrednosti zakasnitve na učinkovitost algoritma glede na to, da je to po določitvi dimenzije edina preostala spremenljivka sistema. Rezultati poskusa so zbrani v tabeli 1, ki podaja število in odstotek zaznanih R točk v signalu (2. in 3. stolpec) pri različnih vrednostih zakasnitve (1. stolpec), ki so podane kot število vzorcev s pripadajočo časovno vrednostjo v oklepaju. Glede na sekcijo 2 pomeni vsak vzorec 4 ms v času. Iz rezultatov v tabeli 1 lahko povzamemo, da algoritem deluje zelo dobro do zakasnitve 20 vzorcev 0 0.2 0.4 0.6 0.8 1 0 0.5 1 ECG(t) [mV] (e) E C G (t + ta u ) [m V ] 0 0.2 0.4 0.6 0.8 1 0 0.5 1 ECG(t) [mV] (d) E C G (t + ta u ) [m V ] 0 0.2 0.4 0.6 0.8 1 0 0.5 1 ECG(t) [mV] (c) E C G (t + ta u ) [m V ] 0 0.2 0.4 0.6 0.8 1 0 0.5 1 ECG(t) [mV] (b) E C G (t + ta u ) [m V ] 0.8 1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 0 0.2 0.4 0.6 0.8 1 260 PLESNIK, MALGINA, TASIČ, ZAJC Tabela 1: Zaznavanje R točk v faznem prostoru pri različnih zakasnitvah Delay [no. of samples] No. of detected R waves PPV = [%] 1 (2 – 5 ms) 67 100.0 5 (18 – 21 ms) 67 100.0 8 (30 – 33 ms) 67 100.0 10 (38 – 41 ms) 67 100.0 15 (58 – 61 ms) 67 100.0 18 (70 – 73 ms) 67 100.0 19 (74 – 77 ms) 67 100.0 20 (78 – 81 ms) 68 100.0+1.5 21 (82 – 85 ms) 75 100.0+11.9 22 (86 – 89 ms) 95 100.0+41.8 23 (90 – 93 ms) 113 100.0+68.7 25 (98 – 101 ms) 130 100.0+94.0 (približno 80 ms), pri večjih zakasnitvah pa se njegova zmogljivost hitro zmanjša. Tako pri zakasnitvi 23 vzorcev (približno 90 ms) algoritem že povsem odpove, saj dodatno zazna kar 46 napačnih utripov. V [18] in [19] je bila kot optimalna zakasnitev izbrana vrednost 20 ms, kar se ujema s primerom s slike 2 in tudi z rezultati iz tabele 1. Za evalvacijo algoritma na signalih iz QT baze [35] je bila zato kot optimalna izbrana zakasnitev 20 ms. 3.4 Zaznavanje karakterističnih točk z uporabo računanja ploščin v faznem prostoru V tej sekciji je podan opis algoritma za zaznavanje karakterističnih točk signala EKG, ki pomenijo lokalne maksimume in minimume kompleksov QRS ter valov P in T. Zato so najprej določene vrednosti ploščin posameznih poligonov faznega portreta. Te vrednosti pomenijo elemente detekcijske funkcije in so določene z uporabo enačbe iz geometrije za ravninske poligone, ki ne sekajo sami sebe 2 3 11 2 2 3 11 2 1 ... 2 n n n n x x x xx x S abs abs abs y y y yy y − −       = + + +             , (3) kjer lahko upoštevamo kar absolutne vrednosti posameznih determinant, saj orientacija poligonov ni pomembna. Parameter n v (3) ponazarja število vzorcev, ki sestavljajo poligon, katerega ploščina je vrednost S. Izbira parametra n je odvisna od vzorčevalne frekvence signala in trajanja kompleksa QRS [18]. Število vzorcev n, ki sestavljajo posamezni poligon, naj bo manjše od polovice vzorcev, ki sestavljajo povprečni kompleks QRS v trajanju od 80-120 ms, kar za QT bazo [35] (vzorčenje z 250 Hz) pomeni spodnjo mejno vrednost 10 vzorcev na poligon, ki je bila tudi izbrana za evalvacijo algoritma. Z izbranimi parametri je nato določena detekcijska funkcija vrednosti ploščin poligonov, iz katere lahko Slika 3: Fazni portreti EKG signala sel16265 pri različnih vrednostih zakasnitev: (a) 5 ms, (b) 15 ms, (c) 20 ms, (d) 30 ms, (e) 45 ms, (f) 70 ms, (g) 85 ms in (h) 100 ms zaznamo komplekse QRS s pragovno funkcijo. Tako zaznani kompleksi pa ne podajajo točne informacije o posameznih točkah Q, R in S, temveč skupaj z znanimi normalnimi vrednostmi določenih intervalov in amplitud določajo le območje v signalu, kjer je te točke mogoče točno določiti. Točni trenutki (lokacije) točk R v signalu so določeni z upoštevanjem zaznanih kompleksov QRS in maksimalnim trajanjem normalnega kompleksa QRS (120 ms) [37]. Algoritem poišče maksimum v časovnem oknu, ki je dvakrat širše od 120 ms in v katerem je osrednja točka iz detekcijske funkcije zaznani kompleks QRS. Najvišji maksimum v tem časovnem oknu je določen kot točka R. V istem časovnem oknu sta nato določeni še točki Q in S kot prva lokalna minimuma pred (Q) in za (S) točko R. Zaznavanje točk T poteka podobno kot zaznavanje točk R. Iz detekcijske funkcije se določijo valovi T na intervalih med predhodno zaznanimi kompleksi QRS kot lokalni maksimumi. Posledično so določene točne lokacije točk T v signalu z uporabo časovnega okna z zaznanim valom T na sredini. Širina okna je enaka 200 ms, kar je enako maksimalni normalni vrednosti vala T [37, 38]. Prva karakteristična točka signala EKG je zaznana nazadnje glede na predhodno zaznane točke. Točka P je zaznana kot lokalni maksimum v časovnem oknu pred točko Q. Širina časovnega okna je 200 ms, kar je enako maksimalni normalni vrednosti intervala P–R [37], njegova skrajna desna točka pa je točka Q. Opisani postopek določanja točk je optimiziran za odvod II, v katerem je oblika EKG takšna, kot je opisana v sekciji 3.1. Ta odvod je uporabljen tudi v vseh primerih QT baze [35]. -5 0 5 -2 0 2 4 (a) -5 0 5 -2 0 2 4 (b) -5 0 5 -2 0 2 4 (c) -5 0 5 -2 0 2 4 (d) -5 0 5 -2 0 2 4 (e) -5 0 5 -2 0 2 4 (f) -5 0 5 -2 0 2 4 (g) -5 0 5 -2 0 2 4 (h) ZAZNAVANJE KARAKTERISTIČNIH TOČK ELEKTROKARDIOGRAMA V FAZNEM PROSTORU Z UPORABO RAČUNANJA… 261 Table 2: Rezultati zaznavanja karakterističnih točk EKG-signala z računanjem ploščin v faznem prostoru Points P Points QRS Points T P o in ts P - an n ot at ed P o in ts P - d et ec te d Q R S co m p le xe s - an no ta te d Q R S co m p le xe s - d et ec te d P o in ts T - an n ot at ed P o in ts T - d et ec te d Se=TP/ (TP+FN) [%] PPV=TP/ (TP+FP) [%] Se=TP/ (TP+FN) [%] PPV=TP/ (TP+FP) [%] Se=TP/ (TP+FN) [%] PPV=TP/ (TP+FP) [%] 3193 3333 3622 3622 3541 3542 99.19 95.02 99.67 99.67 94.58 94.55 4 REZULTATI Rezultat evalvacije algoritma, ki za zaznavanje karakterističnih točk EKG-signala uporablja računanje ploščin poligonov faznega portreta, na QT bazi [35] je podan v tabeli 2. Prvi, tretji in peti stolpec tabele 2 podajajo skupno število v QT bazi [35] označenih točk P, kompleksov QRS in točk T. Drugi, četrti in šesti stolpec podajajo skupno število z algoritmom zaznanih točk P, kompleksov QRS in točk T. Zadnjih šest stolpcev pa podaja vrednosti Se in PPV za uspešnost algoritma pri zaznavanju točk P, kompleksov QRS in točk T. Vrednosti za parameter Se so 99,19 % za točke P, 99,67 % za komplekse QRS in 94.58 % za točke T. Vrednosti za parameter PPV pa so 95.02 % za točke P, 99.67 % za komplekse QRS in 94.55 % za točke T. 5 RAZPRAVA Za evalvacijo algoritma v tem delu smo uporabili signale iz QT baze [35], ki je namenjena oceni algoritmov za zaznavanje posameznih delov EKG. Signali na posnetkih iz te baze vključujejo širok spekter morfologije kompleksa QRS in segmenta ST, kar pomeni realne klinične razmere. Kot merilo zmogljivosti algoritma sta bili uporabljeni standardni veličini občutljivosti (Se) in natančnosti (PPV). Občutljivost Se pomeni odstotek resničnih karakterističnih točk, ki so bile pravilno zaznane, natančnost PPV pa pomeni odstotek zaznanih karakterističnih točk, ki so bile dejansko resnične. Veličini Se in PPV odražata uspešnost algoritma za zaznavanje karakterističnih točk z uporabo računanja ploščin v faznem portretu. Algoritem je v povprečju zelo uspešen za vse posnetke iz baze (tabela 2) in je primerljiv z drugimi metodami [26, 31, 32]. Poudariti velja uspešnost pri zaznavanju kompleksov QRS, kjer je dosežena 100- odstotna učinkovitost pri vseh signalih, razen pri sel102 zaradi prisotnosti srčnega spodbujevalnika, ki povzroča široke komplekse QRS, ki zajemajo več kot 10 vzorcev, kolikor jih v poligonih faznega portreta obravnava algoritem. Skupaj je napačno zaznanih 12 utripov v signalu sel102 in celotni bazi. Glede na druge metode [31, 32] je uspešnost algoritma pri zaznavanju točk P in T nekoliko manjša, kar je zaradi napačnih zaznav, ki so posledica manjkajočih, invertiranih ali bifaznih valov, ki nastanejo zaradi različnih nenormalnosti v delovanju srca, npr. atrijskega bloka. Tako je od 3333 zaznanih točk P 169 napačnih zaznav (FP), kar je razlog za nižjo vrednost PPV. Na drugi strani pa je vrednost Se več kot 99 odstotkov, saj je zgrešenih (FN) zgolj 26 točk P. To pomeni, da je algoritem uspešen pri zaznavanju resničnih točk P (visoka občutljivost), vendar pa mu težave povzročajo manjkajoči in nenormalni valovi P. Nekoliko drugače je pri zaznavanju točk T, kjer imata tako Se kot tudi PPv nekoliko nižjo vrednost. Od zaznanih 3542 točk T je 193 napačno zaznanih (FP) in 192 zgrešenih (FN) točk T. V glavnem je ta težava posledica bifaznih valov T, pri katerih algoritem določi točko T kot maksimum pozitivnega dela vala T, medtem ko je bila resnična oznaka postavljena na prehod med pozitivnim in negativnim delom vala T. 6 SKLEP V članku je predstavljen uveljavljen algoritem za zaznavanje srčnih utripov, ki je uspešno razširjen z računanjem ploščin poligonov faznega portreta na zaznavanje vseh karakterističnih točk v elektrokardiogramu. Rezultat evalvacija na signalih iz QT baze [35] je primerljiv z rezultati iz sodobne znane literature, ki obravnava podoben problem. ZAHVALA Raziskava je bila izvedena v sklopu raziskovalnega programa P2-0246, ki ga financira ARRS.