1. Uvod Pravilno delovanje senzorjev je ključnega pomena za optimalno obratovanje biološke čistilne naprave odpadnih voda. Pri obratovanju čistilnih naprav se pogosto uporabljajo senzorji kisika, v zadnjem času pa tudi amonijevega dušika. Pri senzorjih lahko nastanejo različne napake, ki so posledica nabiranja usedlin, izpadov električnega toka in izklopov med rednim čiščenjem. Zadnji dve napaki je mogoče brez težav zaznati, saj se ponavadi kažeta kot padec izhoda senzorja na vrednost nič. Nepravilno delovanje senzorjev zaradi nabiranja usedlin pa je kompleksnejši problem. V čistilnih napravah senzorje čistijo periodično (ponavadi enkrat na teden) ne glede na dejansko stanje. Omenjeni problem je še posebej kritičen tedaj, ko izhod senzorja predstavlja regulirano Prejet 5. november, 2004 Odobren 25. oktober, 2005 Žele, Vrečko, Juričić48 veličino (senzor je uporabljen v povratni zanki), kar lahko pripelje do popolnoma neustreznega delovanja regulacijskega algoritma. Razvoj analitičnega modela čistilne naprave, ki bi s primerno natančnostjo napovedoval nominalni odziv procesa, je izredno težaven postopek. Poleg časovne spremenljivosti in nelinearnosti so največji problem nemerljive komponente dotoka, ki bistveno vplivajo na procese čiščenja. Nemerljive motnje so tudi eden glavnih vzrokov, da trenutno najboljši modeli s stališča napovedovanja odziva procesa ne dosegajo več kot približno 50% natančnost. Veliko preprostejše so statistične metode odkrivanja napak, zato smo v prispevku uporabili statistične modele, ki temeljijo na analizi kolinearnosti med signali čistilne naprave. V čistilni napravi je na voljo veliko merjenih signalov, ki so medsebojno korelirani. Z metodo glavnih komponent lahko na osnovi medsebojnih korelacij merjenih signalov sklepamo na pravilno delovanje senzorjev [3,5,6,8]. Spreminjanja signala ne opazujemo neodvisno, pač pa relativno glede na spreminjanje drugih signalov, s katerimi je v korelaciji. Metoda analize glavnih komponent skrči število signalov na t.i. glavne komponente, ki so dejansko linearna kombinacija signalov in so medsebojno neodvisne. Glavne komponente zajamejo večino variance meritev, kar pomeni, da vsebujejo informacijo skrito v meritvah. Normalno delovanje procesa opisuje t.i. statistični model, ki ga tvorijo smeri glavnih komponent v prostoru meritev in varianca v smeri glavnih komponent. Motnje, napake na senzorjih in druge spremembe v procesu porušijo medsebojne korelacije med izmerjenimi veličinami (spremenijo se smeri glavnih komponent). Ko meritve rekonstruiramo iz glavnih komponent, se bo napaka na senzorju odražala na residualih in jo bomo lahko odkrili s statističnimi testi [5]. Dosedanje delo na področju spremljanja delovanja čistilnih naprav z uporabo analize glavnih komponent je bilo usmerjeno v odkrivanje motenj oziroma ugotavljanje stanja čistilne naprave, kar naj bi služilo kot podpora pri prilagajanju načina vodenja čistilne naprave [9, 10, 11]. Cilj našega dela pa je načrtati in ovrednotiti sistem za nadzor in odkrivanje napak senzorjev v pilotni čistilni napravi, ki je postavljena v Čistilni napravi Domžale-Kamnik. Kot je bilo že omenjeno, so okvare senzorjev v čistilni napravi pereč problem, zato bi s pravočasnim odkrivanjem napak lahko znatno izboljšali kvaliteto vodenja. Spremljanje delovanja procesa z analizo glavnih komponent temelji na predpostavki, da je proces stacionaren (statistične lastnosti signalov se ne spreminjajo) [3]. Problem nestacionarnosti čistilne naprave, ki je posledica spreminjajočih se vremenskih razmer, bomo rešili z uporabo t.i. adaptivne analize glavnih komponent [1, 7]. V literaturi avtorji poročajo o uspešni uporabi adaptivnega postopka za spremljanje delovanja čistilnih naprav, predvsem s stališča odkrivanja motenj in ugotavljanja posebnih razmer (dež, temperatura) [9, 11]. V 1. poglavju bomo predstavili osnove analize glavnih komponent. V 2. poglavju bomo pokazali statistične teste za spremljanje delovanja procesa (T2 in SPE statistiko), ki izhajajo iz dekompozije prostora signalov na podprostor glavnih komponent in podprostor, ki vsebuje šum. Rekurzivno analizo glavnih komponent bomo opisali v 4. poglavju. V 5. poglavju pa bodo predstavljeni simulacijski rezultati odkrivanja napak senzorja amonijevega dušika pilotne naprave v čistilni napravi Domžale-Kamnik. 2. Analiza glavnih komponent V procesni industriji pogosto merimo veliko število signalov, ki so korelirani. To pomeni, da imamo opravka z redundantno informacijo, ki otežuje spremljanje delovanja procesa. Z analizo glavnih komponent korelirane signale transformiramo v prostor nižje dimenzije, ki vsebuje večino variance meritev, nove koordinate pa niso več korelirane [3, 5, 8]. Vzemimo matriko meritev X dimenzije (nxm), kjer m pomeni število merjenih signalov, n pa število vzorcev. Signali so normirani, kar pomeni, da imajo srednjo vrednost nič in varianco enako 1. Koordinate v novem prostoru oziroma t.i. matriko zadetkov T dobimo kot linearno kombinacijo signalov XPT = (1) kjer je mxmℜ∈P transformacijska matrika. Vektor zadetkov v trenutku k t(k)=[t1(k), t2(k),…,tm(k)] T dobimo z naslednjo transformacijo: )k()k( T xPt = , (2) pri čemer vektor meritev v trenutku k x(k)=[x1(k), x2(k),…,xm(k)] T tvorijo elementi k vrstice matrike meritev X. Transformacijska matrika P vsebuje lastne vektorje pi (i=1,2,..,m) kovariančne matrike meritev in jo dobimo z dekompozicijo T T PP XX XR Σ= − == 1n )cov( . (3) mxmℜ∈P je unitarna matrika IPP =T in mxmℜ∈ΣΣΣΣ je diagonalna matrika lastnih vrednosti kovariančne matrike v padajočem vrstnem redu ( m21 λλλ ≥≥≥ K ). Lastni vektorji so baza novega koordinatnega sistema in lastne vrednosti predstavljajo varianco meritev v teh smereh. Prvi lastni vektor predstavlja smer, v kateri je varianca signalov največja, drugi lastni vektor smer, v kateri je največja varianca preostalega podprostora meritev, itd. Pri transformaciji v nov koordinatni sistem obdržimo samo prvih p lastnih Zaznavanje nepravilnega delovanja senzorjev v čistilni napravi odpadnih voda... 49 vektorjev mxpℜ∈pP , ki ustrezajo največjim lastnim vrednostim pp XPT = . (4) Optimalna izbira števila p je taka, da s p lastnimi vektorji zajamemo večino variance meritev, preostali m- p lastni vektorji pa tvorijo podprostor, ki vsebuje šum meritev. V literaturi zasledimo več načinov določanja števila lastnih vektorjev [7]. V praksi se pogosto uporablja mera CPV (cumulative percent variance), ki nam pove, kolikšen odstotek celotne variance meritev vsebuje prvih a lastnih vektorjev ∑∑= == m 1j j p 1j j /%100)p(CVP λλ . (5) Število glavnih komponent je izbrano tako, da mera CVP preseže neko vnaprej določeno vrednost, ki je ponavadi 95%. S p glavnimi komponentami lahko meritve rekonstruiramo kot vsoto EEPTEXX pp +∑=+=+= = p 1i T~ T ii pt , (6) kjer je ti i stolpec matrike T. Prvi člen v vsoti je model PCA drugi del pa šum. Tako je prostor meritev razstavljen na dva ortogonalna prostora. Prvi ustreza sistematični varianci procesa, drugi pa šumu. 3. Statistično spremljanje delovanja procesa z analizo glavnih komponent Model PCA tvorijo smeri lastnih vektorjev in variance meritev v smereh lastnih vektorjev. Določimo ga v t.i. fazi učenja iz podatkov normalno delujočega sistema. Pri spremljanju delovanja procesa oziroma v t.i. fazi odločanje, pa se meritve v vsakem trenutku vzorčenja projicirajo na lastne vektorje. Statistično spremljanje delovanje procesa temelji na predpostavki, da se med normalnim delovanjem procesa meritve preslikajo v določeno območje v prostoru zadetkov, ki ga določa model PCA. Ujemanje modela PCA in trenutne meritve testiramo z dvema statistikama: • Hotellingova T2 statistika (ugotavljamo, ali je meritev znotraj predpisane envelope) )k()k()k(T 1T2 tΣt −= (7) Zgornja statistika ima F porazdelitev, ker je kovariančna matrika ocenjena iz končnega števila podatkov. Mejo zaupanja za α % verjetnost dobimo kot αα ,pn,p 2 ,n,p Fpn )1n(p T −− − = . (8) V zgornji enačbi je n število podatkov, ki smo jih uporabili za določitev modela PCA (kovariančne matrike), p je število lastnih vektorjev, s katerimi zajamemo večino variance meritev in Fn,n-p,α je meja zaupanja za F porazdelitev s stopnjama prostosti n in n- p ter α % verjetnost. • Statistika SPE (Q statistika) je vsota kvadratov elementov v posamezni vrstici matrike residualov. Testiramo, ali varianca meritev, ki ni zajeta z glavnimi komponentami, presega predpisano vrednost )k()()k()k()k()k(SPE TTT xPPIxee pp−== . (9) V enačbi (9) smo upoštevali, da je vektor residualov enak )k()k()k(~)k()k( tPxxxe p−=−= . Zgornja meja zaupanja je za α % verjetnost podana v [2] in temelji na Gaussovi aproksimaciji kvadratične forme neodvisnih naključnih spremenljivk, ki sta jo predlagala Jensen in Solomon v [4]. 0/1 2 1 002 1 2 02 1 )1( 1 2 h hhhc SPE         − ++= θ θ θ θ θ αα (10) cα je meja zaupanja normalne porazdelitve za α % verjetnost, ∑= += m 1pj i ji λθ za i=1,2,3 in 2 2 31 0 3 2 1h θ θθ −= . 4. Adaptivna analiza glavnih komponent Metodo analize glavnih komponent za spremljanje delovanja procesa lahko uporabljamo samo za stacionarne procese. V praksi pa se proces čiščenja odplak ponavadi počasi, a nenehno spreminjajo predvsem zaradi zunanjih vremenskih vplivov. Spreminjanje procesa se kaže kot sprememba srednjih vrednosti meritev, sprememba variance meritev in sprememba korelacij med spremenljivkami. Problem nestacionarnosti rešujemo z adaptivnim postopkom, ki omogoča prilagajanje srednjih vrednosti, varianc in kovariančne matrike meritev počasnim spremembam procesa. Tehnično to pomeni, da se pri odločanju omejimo na končni interval [t-T, t], namesto da bi upoštevali vse podatke iz zgodovine. Rekurzivni postopek adaptivne analize glavnih komponent je opisan v [7]. Začetni model PCA zgradimo iz začetnega bloka podatkov xmn1ℜ∈1X , ki vsebuje m spremenljivk merjenih v n1 diskretnih trenutkih. Srednja vrednost meritev je podana v vektorju [7] 1n 1n 1 )1( 1X T1=µµµµ , (11) Žele, Vrečko, Juričić50 kjer je 1nT 1n ]1,1,1[ ℜ∈= K1 . Normiran blok podatkov izračunamo kot [7] 1)( −−= (1)(1) 1 Sµ1XX 1 0 1 T n , (12) pri čemer je S diagonalna matrika standardnih deviacij meritev S(1)=diag(σ1(1), ..., σ1(m)). Kovariančna matrika je ( ) 01T01 XXR 1n 1 (1) 1 − = . (13) Z vsakim novim vzorcem signalov x(k+1)=[x1(k+1), x2(k+1),...,xm(k+1)] T model PCA spreminjamo rekurzivno [7], kot prikazujejo naslednje enačbe: )1k()a1()k(a)1k( +−+=+ xµµ m1,2,i,))1k()1k(x)(a1( ))1k()k((a)1k( 2 ii 2 i 2 i 2 i K=+−+− +++=+ µ µ∆σσ ( ) ( ) .)1( )1()1()1()()()()1(a 1)(k T T a kkkkkkk 1)(k1)(k 00 1-1- ++−+ +++∆+∆++= =+ xx SSRSS R µµµµµµµµ (14) Pri tem je )k()1k()1k( µµµµµµµµ∆µ∆µ∆µ∆µ −+=+ , 10 )1k())1k()1k(()1k( −++−+=+ Sµxx je normiran vektor podatkov in S(k+1)=diag(σ1(k+1), ...,σm(k+1)). a je faktor pozabljanja, s katerim uravnavamo dinamiko prilagajanja parametrov. Izberemo ga tako, da se model PCA prilagaja počasnim spremembam procesa. V vsakem koraku izračunamo tudi število glavnih komponent in meje zaupanja za T2 in statistiko SPE. Prekoračitev meje zaupanja ene izmed statistik je indikator za spremembo opazovanega procesa, zato se sproži alarm. Ko pa se model sčasoma prilagodi spremenjeni situaciji, alarm izzveni, čeprav se proces ni vrnil v normalno delujoče stanje. Opisanemu problemu se izognemo tako, da prilagajanje parametrov ustavimo (a postavimo na 1) takoj, ko statistiko SPE ali T2 prekoračita določeno mejo. Prilagajanje modela PCA nadaljujemo, ko sta obe statistiki ponovno pod določeno mejo. Postopek je natančneje opisan z naslednjim algoritmom: 1. korak : Izberemo ustrezen faktor pozabljanja a=a0. 2. korak: V vsakem trenutku vzorčenja z adaptivnim postopkom izračunamo statistiko SPE in T2 in ustrezne meje. 3. korak: Če je SPE>SPEα ali 2 ,n,p 2 TT α> potem je a=1, sicer a=a0. 4. korak: Nadaljujemo s korakom 2. 5. Odkrivanje napak senzorjev v čistilni napravi Rezultate odkrivanja napak z analizo glavnih komponent smo dobili s simulacijskimi poskusi z nelinearnim modelom pilotne čistilne naprave, ki je realiziran v programskem paketu GPS-X [2]. Shema pilotne naprave, ki je postavljena v Čistilni napravi Domžale-Kamnik, je prikazana na sliki 1. Na čistilni napravi se odpadna voda po mehanski stopnji čisti z aktivnim blatom (mikroorganizmi) po postopku MBBR (moving bed biofilm reactor). Pri analizi glavnih komponent smo uporabili naslednje signale (slika 1): • koncentracijo amonijevega dušika na dotoku, • koncentracijo raztopljenega kisika v prvem aerobnem reaktorju, • koncentracijo raztopljenega kisika v drugem aerobnem reaktorju, • skupni dotok zraka v oba reaktorja in • koncentracijo amonijevega dušika v drugem aerobnem reaktorju. Amonijev dušik na dotoku je dejanski izmerjeni signal in ima značilen vzorec periodičnih dnevnih sprememb (slika 2). Čas vzorčenja je dve minuti, število vseh vzorcev pa je 5040 (v enem tednu). Signal je nestacionaren, saj se njegove statistične lastnosti spreminjajo zaradi vpliva vremena. Napako na senzorju amonijevega dušika v drugem aerobnem reaktorju smo simulirali tako, da smo koncentraciji amonijevega dušika v reaktorju umetno dodali vrednosti, prikazane na sliki 3. iztok odvečno blato 88m3 130m3 117m3 115m388m3 600m3 zrak Anoksična reaktorja 1.aerobni reaktor 2.aerobni reaktor usedalnik notranji recikel dotok Slika 1: Shema pilotne čistilne naprave odpadnih voda Figure 1: A layout of the Wastewater Treatment Pilot Plant Zaznavanje nepravilnega delovanja senzorjev v čistilni napravi odpadnih voda... 51 a) faza učenja N H 4- N na do to ku (m g/ h) vzorec 0 500 1000 1500 2000 2500 15 20 25 30 35 40 45 b) faza spremljanja delovanja procesa N H 4- N na do to ku (m g/ h) 35 40 45 0 500 1000 1500 2000 2500 15 20 25 30 vzorec Slika 2: Koncentracija amonijevega dušika na dotoku Figure 2: Influent ammonia concentration Ker avtokorelacije signalov pri zakasnitvi Ts niso zanemarljive, moramo v matriko podatkov X dodati še zakasnjene signale z zakasnitvijo Ts [6](matrika podatkov je vsebovala vsega skupaj 10 signalov). Približno polovico vzorcev (koncentracija amonijevega dušika na dotoku je na sliki 2 a)) smo uporabili za izračun začetnega modela PCA (enačbe (11), (12), (13)). Izkazalo se je, da s tremi glavnimi komponentami zajamemo več kot 95% variance meritev. Za preostale podatke (koncentracija amonijevega dušika na dotoku je prikazana na sliki 2 b)) smo sproti v vsakem trenutku vzorčenja izračunali statistiko T2 in SPE. Na sliki 4 sta prikazani obe statistiki skupaj z mejami in ustrezni alarmi v primeru, ko smo ves čas (naslednjih 2540 vzorcev) uporabljali začetni model PCA. Jasno je razvidno, da nastopijo napačni alarmi, ki so posledica spremembe delovne točke procesa. Zaradi nelinearnosti procesa sprememba delovne točke spremeni medsebojne korelacije signalov in začetni model PCA ni več verodostojna slika dejanskih razmer. Slika 5 prikazuje rezultate pri uporabi adaptivnega PCA modela, ki smo ga rekurzivno računali s faktorjem pozabljanja 0.9995 (časovna konstanta prilagajanja je približno 3 dni). Z adaptivnim PCA modelom smo na osnovi obeh statistik detektirali napako senzorja. Statistika SPE v 535. vzorcu prekorači mejno vrednost, kar sproži alarm. Kot smo omenili že zgoraj, se alarm sproži, ko ena izmed statistik prekorači mejno vrednost. Hkrati se faktor pozabljanja postavi na 1, dokler se proces ponovno ne vrne v normalno delujoče stanje. Pri uporabi adaptacije nimamo napačnih alarmov, saj se model PCA prilagaja spreminjanju procesa. Vendar pa je z opisanim rekurzivnim postopkom mogoče odkriti samo napake, ki nastanejo mnogo hitreje, kot je dinamika prilagajanja modela PCA. Omenjeni problem bomo poskušali rešiti v prihodnjih raziskavah. 0 500 1000 1500 2000 2500 0 1 2 3 4 5 6 7 N H 4- N (m g/ L) v 2. ae r. re ak .i n na pa ka se nz or ja vzorec napaka senzorja Slika 3: Koncentracija amonijevega dušika v drugem aerobnem reaktorju Figure 3: Ammonia concentration in the second aerobic reactor 0 500 1000 1500 2000 2500 0 1 napa ni alarmi č 0 500 1000 1500 2000 2500 0 50 100 0 500 1000 1500 2000 2500 0 5 T st at is tik a 2 al ar m vzorec S P E st at is tik a Slika 4: Analiza glavnih komponent (statistika T2 in ustrezna meja, označena s črtkano črto; Statistika SPE in ustrezna meja, označena s črtkano črto; alarm) Figure 4: PCA analysis (T2 statististics and the threshold; SPE statistics and the threshold; alarm) T st at is tik a 2 al ar m vzorec S P E st at is tik a 0 500 1000 1500 2000 2500 0 50 100 0 500 1000 1500 2000 2500 0 5 0 500 1000 1500 2000 2500 -0.5 0 0.5 1 1.5 Slika 5: Adaptivna analiza glavnih komponent (statistika T2 in ustrezna meja, označena s črtkano črto; statistika SPE in ustrezna meja označena s črtkano črto; alarm) Figure 5: Adaptive PCA analysis (T2 statististics and the threshold; SPE statistics and the threshold; alarm) 6. Sklep V prispevku smo obravnavali odkrivanje napak senzorjev v biološki čistilni napravi z metodo analize glavnih komponent. Pri tem smo se omejili zgolj na odkrivanje napak, kar pomeni ugotavljanje prisotnosti napake, ne pa tudi njeno lokalizacijo. Proces čiščenja odpadnih voda je zaradi vremenskih motenj časovno spremenljiv. Poleg tega pri odkrivanju napak nastane problem ločevanja vpliva motnje od vpliva napak senzorjev na statistiki SPE in T2. Omenjeni problem smo rešili z adaptivnim postopkom analize glavnih komponent. Le-ta omogoča sprotno prilagajanje statističnega modela počasnim spremembam procesa, s čimer se zmanjša število napačnih alarmov. Pri simulacijskih poskusih z nelinearnim modelom čistilne naprave smo senzorju koncentracije amonijevega dušika v drugem aerobnem reaktorju umetno dodali napako. Izkazalo se je, da se v primeru izbrane napake s primerno izbiro faktorja pozabljanja pri rekuzivni analizi glavnih komponent lahko znebimo napačnih alarmov. V prispevku je prikazan le prvi delni rezultat širše naloge, katere glavni cilj je sinteza in uporaba algoritma za nadzor delovanja senzorjev v Čistilni napravi Domžale- Kamnik. 7. Literatura [1] N.B. Gallagher, B.M. Wise, S.W. Butler, D. White, G.G. Barna, Development and benchmarking of multivariate statistical process control tools for a semiconductur etch process: Improving robustness through model updating. IFAC ADCHEM'97, str. 7883, Banff, Canada, June 1997. [2] Hydromantis (2001). GPS-X – Technical Reference, GPS-X Version 4. Ontario, Canada. [3] J. E. Jackson, G. S. Mudholkar, Control procedures for residuals associated with principal component analysis. Technometrics, Vol. 21, No. 3, str. 341-349, 1979. [4] D. R. Jensen, H. Solomon, A gaussian approximation to the distribution of a definite quadratic form, Journal of the American Statistical Assocition, Vol 67, No.340, str. 898-902, 1972. [5] J. V. Kresta, J. F. MacGregor, T. E. Marlin, Multivariate statistical monitoring of process operating performance. The Canadian Journal of Chemical Engineering, Vol. 69,str. 35-47, 1991. [6] W. Ku, R. H. Storer, C. Georgakis, Disturbance detection and isolation by dynamic principal component analysis, Chemometrics and Intelligent Laboratory Systems, Vol. 30, str. 179-196, 1995. [7] W. Li, H. H. Yue, S. Valle-Cervantes, S. J. Quin, Recursive PCA for adaptive process monitoring. Journal of Process Control, Vol. 10, str. 471-486, 2000. [8] A. Negiz and A. Cinar, Statistical monitoring of multivariable dynamic processes with state-space models. AIChE Journal, Vol. 43, No. 8, str. 2002-2020, 1997. [9] C. Rosen, A Chemometric Approach to Process Monitoring and Control With Application to Wastewater Treatment Operation, PhD Thesis, Lund University, Sweden, 2001. [10] C. Rosen, J. Röttorp and J. Jeppsson, Multivariate on- line monitoring: challenges and solution for modern wastewater treatment operation, Water Science & Technology, Vol. 47, No.2, str. 171-181, 2003. [11] M. J. Wade, R. Katebi, K. Gernaey, Improved monitoring of wastewater treatment plants using recursive principal component analysis, submitted to Water Research. Mina Žele je diplomirala leta 1993, magistrirala leta 1996 in doktorirala leta 1998, vse na Fakulteti za elektrotehniko Univerze v Ljubljani. Trenutno je zaposlena na Institutu Jožef Stefan v Ljubljani. Ukvarja se z modeliranjem, identifikacijo in odkrivanjem napak. Darko Vrečko je diplomiral leta 1998 in doktoriral leta 2003, oboje na Fakulteti za elektrotehniko Univerze v Ljubljani. Trenutno je zaposlen na Odseku za sisteme in vodenje na Institutu Jožef Stefan. Področje njegovega raziskovanja so vodenje, optimizacija in modeliranje bioloških čistilnih naprav za čiščenje odpadnih voda. Đani Juričić je sodelavec Odseka za sisteme in vodenje Instituta Jožef Stefan. Ukvarja se predvsem z raziskavami in razvojem postopkov za zgodnje odkrivanje napak v sistemih. Zanimajo ga še številne druge teme, ki se nanašajo na vodenje v širšem pomenu, zlasti sinteza (poenostavljenih) modelov procesov.