1 UVOD Prometna omrežja imajo pomembno vlogo v ekonomiji, zato so potrebni natančni in posodobljeni podatki o lokaciji cest. Pridobivanje podatkov o njihovi lokaciji je lahko izvedeno s pomočjo daljinskega zaznavanja na satelitskih in letalskih posnetkih zemeljskega površja, ki Prejet 15. april, 2015 Odobren 3. maj, 2015 omogoča izdelavo in posodabljanje digitalnih katastrov cestnega omrežja [1]. Lahko pa je zaznavanje cest upo- rabljeno kot prvi korak za določitev primernih značilnih točk za neposredno registracijo satelitske slike v lokalni zemeljski koordinatni sistem [2]. Vizualno določanje cest na letalskih ali satelitskih posnetkih je za človeka dokaj preprosto, saj imajo te prepoznavno geometrijsko obliko in značilno svetlost oziroma barvo. Izgled cest na posnetkih je odvisen od ločljivosti posnetka, na srednjeločljivih (velikost slikov- nega elementa nekaj metrov) vidimo ceste kot svetle črte, na visokoločljivih posnetkih (pod 2 m) ločimo rob ceste in posamezne prometne pasove. 2 POSTOPKI ZAZNAVANJA CEST NA SATELITSKIH POSNETKIH Postopki zaznavanja cest na satelitskih slikah so se razvili za avtomatizirano popolnjevanje digitalnih po- datkovnih baz prostorskih podatkov (GIS), pri čemer je Mena [1] predstavil pregled več kot 250 relevantnih člankov, ki jih je glede na namen razvrstil v kategorije splošnih metod detekcije cest, rekonstrukcije cestnega omrežja, segmentacijskih metod, vektorizacijskih metod, optimizacijskih metod in evaluacijskih metod. Upora- bljene metode je razvrstil v kategorije od nizkonivojskih do visokonivojskih glede na uporabljene vhodne po- datke in raven znanja. Še natančnejši pregled predvsem 118 ZALETELJ, ČOTAR nižjenivojskih metod je predstavil Auclair Fortier [3]. Metode je razvrstil po uporabljenih tehnikah v zapo- rednih stopnjah obdelave, torej pri predobdelavi slike, detekciji robov, sledenju ceste in združevanju cestnih primitivov. Wang [4] na multispektralnem posnetku uporabi algo- ritem nenadzorovano klasifikacije. Z analizo robov na pankromatskem posnetku nato odpravi napake klasifi- kacije, na primer odstrani osamljene objekte, ki imajo drugačno obliko, kot je pričakovati za ceste. Poullis [5] predlaga uporabo različno usmerjenih in širokih Gaborjevih filtrov. Na podlagi vseh odzivov, zbranih v obliki tenzorjev, izvede segmentacijo na posamezna za- nimiva območja. Zaznavanje cestnih odsekov z metodo antiparalelnih robov predlaga Doucette [6]. Kot ceste določi mesta, kjer sta zaznana robova razmaknjena za pričakovano širino ceste in smeri gradientov v teh mestih različni za približno 180◦. Algoritem z učenjem, ki ga predlaga Ziemsa [7], za vsako digitalno cesto v sistemu GIS izdela njeno pripadajoče območje na satelitskem po- snetku in na tem območju odčita spektralne lastnosti. Za vsako cesto izdela tudi obmejni pas na obeh straneh, kjer prav tako odčita spektralne lastnosti. Zbrane lastnosti in njihova razmerja so nato uporabljeni za iskanje cest na drugih posnetkih. V članku bomo primerjali rezultate klasifikacije cest na satelitskem posnetku za štiri različne metode zazna- vanja. Slika 1 prikazuje diagram z osnovnimi elementi vseh štirih metod, katerih cilj je generirati čim na- tančnejšo binarno masko cestnega omrežja. Vse metode kot vhodni podatek uporabljajo satelitske posnetke Rapi- dEye, ki jih sestavlja 5 spektralnih kanalov, od modrega do bližnje infrardečega. Na splošno imajo vsi upora- bljeni postopki štiri osnovne korake: a) predobdelavo in normalizacijo vhodnega posnetka, b) izračun značilk (npr. odziv Top-Hat filtra), c) klasifikacijo slikovnih elementov in d) strukturno analizo za odstranjevanje napak. 2.1 Postopek Top-Hat z adaptivnim pragom Cilj spektralne normalizacije vhodnih slik je odstraniti vpliv pogojev zajema (čas, osvetlitev, naklon satelita ipd.) ter izboljšati kontrast cest glede na ozadje. Za to smo uporabili postopek linearnega raztega histograma vhodnega posnetka v določenem območju slikovnih vrednosti, pri čemer so bile meje raztega določene adaptivno z analizo histograma vhodnega kanala. Spekralno normaliziran posnetek nato obdelamo z morfološko operacijo Top-Hat, ki poudari območja, sve- tlejša od okolice in manjša od uporabljenega struktur- nega elementa, torej poudari svetle linije na sliki. Upo- rabljen okrogli strukturni element je konstantne velikosti in prilagojen ločljivosti senzorja na satelitu. Ceste, ki jih želimo zaznati, so na posnetkih srednje ločljivosti široke do tri slikovne elemente, izstopajo le avtoceste, ki so lahko tudi trikrat širše od navadnih cest in pomenijo problem pri zaznavanju. Klasifikacija slikovnih elementov v razreda cest in okolice poteka na podlagi upragovljanja odziva filtra Top-Hat. Pri tem postopek A (adaptivni prag) za klasifi- kacijo cest uporablja adaptivno določen prag, s katerim se izvede binarizacija. Svetlostni prag za binarizacijo ne sme biti postavljen prenizko, kar bi vodilo v zaznavo cest z veliko šuma. Previsok prag pa bi odstranil veliko cest z manjšim kontrastom glede na okolico. Zato se prag določi na podlagi analize histograma odziva filtra Top-Hat, kjer se poišče koleno histograma, ki loči manjši del slik. elementov z visokim odzivom od večjega dela z nizkim. S pomočjo strukturne analize oblike povezanih ce- stnih segmentov poskušamo v zadnjem koraku popraviti napake oziroma odstraniti objekte z lastnostmi, ki se razlikujejo od tipičnih cestnih odsekov. V prvem koraku odstranimo vse nepovezane strukture s površino, manjšo od predvidene, nato izračunamo objemajočo elipso in njeno sploščenost ter odstranimo preveč okrogle se- gmente. 2.2 Postopek s Houghovo transformacijo Postopek B (Houghova transformacija) se od po- stopka A razlikuje v metodi klasifikacije odziva fil- tra Top-Hat. Za vse točke z dovolj velikim odzivom izrežemo okolico velikosti 19×19 elementov ter na njej izračunamo Houghovo transformacijo, s čimer dobimo seznam in parametre nekaj premic, ki opisujejo izbrano okolico. Kot cestni segment klasificiramo samo točke, ki ležijo na premici, ki povezuje svetle točke v okolici. S tem zagotovimo, da končne točke ležijo na daljših svetlih segmentih, in odstranimo naključne posamezne svetle točke, npr. hiše ali kratke cestne odseke. 2.3 Postopki s strojnim učenjem Prvi dve metodi uporabljata kot značilko za detekcijo cest odziv filtra Top-Hat s fiksno velikim strukturnim elementom. V nadaljevanju pa nas zanima, ali lahko z več atributi in s pomočjo strojnega učenja klasifikatorja dobimo natančnejše rezultate segmentacije. V našem primeru so bili za opis slikovnega elementa izbrani štirje atributi svetlosti in robov. Ti vključujejo vrednosti slikovnega elementa v prvem in petem spek- tralnem kanalu, v katerih obstaja velik kontrast med cesto in neposredno okolico, ter odziva filtra Top-Hat v dveh velikostih okolice (5 in 7 slikovnih elementov). Kot metoda razvrščanja podatkov je uporabljena metoda podpornih vektorjev (SVM). Dve metodi s strojnim učenjem se razlikujeta glede na način generiranja učne množice. Postopek D (ročno določena učna množica) uporablja ročno izbiro točk cest in njihove okolice, za vsakega od obeh razredov (ceste, okolica) je bilo ročno izbranih 200 točk iz celotnega satel. posnetka. Za vsak vzorec (točko) so bili izračunani štirje atributi, ki so značilka točke v postopku učenja. Postopek C (avtomatsko določena učna množica) pa izbere vzorce učne množice na podlagi referenčnih po- OCENJEVANJE USPEŠNOSTI POSTOPKOV ZAZNAVANJA CEST NA SATELITSKIH POSNETKIH 119 (D) Klasifikacija SVM Spektralna normalizacija Refer. maska M1 (Ročna) Kanal S1 , S5 Top-Hat š=5 Top-Hat š=7 Binarizacija Analiza histograma Morfol. filtr. napak Izračun 1 P C Q Izračun 2 P C Q Hough. tr. okolic točk Klasifikacija točk S1(x,y) S5(x,y) (C) Klasifikacija SVM (C) Avtom. izbrane točke učne množice (D) Ročno izbrane točke učne množice Refer. maska M2 (Avtom.) (A) (B) (C) (D) Slika 1: Diagram postopkov zaznavanja cest (A)..(D) in dveh primerjanih načinov evalvacije rezultatov s pomočjo referenčne maske cest. datkov o cestnem omrežju. Pripravili smo ročno porav- nane maske cest, ki so bile generirane na podlagi vek- torske baze cestnega omrežja. Na tej referenčni maski pa imajo ceste širino večjo od dejanske širine vidnih cest, da lahko kompenziramo napake pri poravnavi. Zato določen delež točk iz učne množice razreda cest dejansko pripada razredu okolice, kar je težava tega postopka. 3 OVREDNOTENJE USPEŠNOSTI ZAZNAVE Rezultati zaznavanja so za posamezne metode podani v obliki binarnih mask zaznanih cest DA, DB , DC , DD. Uspešnost posameznih metod bomo ovrednotili s primerjavo binarne maske zaznanih cest z referenčnimi podatki o cestah, ki jih lahko dobimo iz različnih virov ter povedo pravilno lokacijo in širino cest na opazova- nem območju, podani pa so z referenčno masko cest M. Slika 2 prikazuje isto območje satelitskega posnetka, na katerem so združeni podatki o zaznanih in referenčnih cestah. Z belo barvo so označena območja, ki jih je algoritem zaznal kot ceste, siva območja pa označujejo referenčne cestne podatke. Glavni izvori napačno za- znanih cestnih segmentov so ozka polja in hiše ob cestah. Na sivih območjih pa iz posnetka ni bilo mogoče razpoznati cest. 3.1 Merila uspešnosti zaznavanja cest Za učinkovito primerjavo različnih metod zaznavanja cest je treba definirati jasna merila primerjave, pri čemer Slika 2: Prikaz zaznanih (bela) in referenčnih cest (siva barva) pri uporabi ročno označenih referenčnih cest (leva slika) ter maske digitalnih cest (desna slika) je Wiedemann [8] poudaril probleme evalvacije ter defi- niral šest računskih kriterijev na podlagi primerjave vek- torskih podatkov ročno definiranih sredinskih linij ce- stnih segmentov z vektorji detektiranih segmentov cest. Ključna kriterija sta kompletnost zaznanih segmentov (completness), ki odgovarja na vprašanje, kolikšen delež dejanskih cest je bil zaznan, ter pravilnost zaznanih segmentov (correctness), ki pove delež pravilnih (uje- majočih se) zaznanih segmentov. Kriterija sta definirana na podlagi dolžin ujemajočih se zaznanih in referenčnih segmentov, pri čemer pri ujemanju upoštevajo določena 120 ZALETELJ, ČOTAR morebitna odstopanja smeri cestnih segmentov, problem pa je tudi vektorizacija. Tretji skupni kriterij kvalitete pa kombinira oba zgornja kriterija. Omenjene kriterije bomo definirali v diskretnem sli- kovnem koordinatnem sistemu, tako da bo mogoč poe- nostavljen izračun na podlagi binarnih mask brez vek- torizacije. Zaznane in referenčne ceste lahko predsta- vimo kot množice koordinat slikovnih elementov (x, y). Množico slikovnih elementov referenčnih cest označimo z R = {(x, y)}. Množico slikovnih elementov zaznanih cest pa označimo z D = {(x, y)}. Za zdaj predposta- vljamo, da so vse ceste široke 1 slikovni element in da sta obe maski idealno poravnani. Pravilnost P zaznave definiramo kot delež zaznanih slikovnih elementov cest, ki se ujemajo z referenčnimi cestami P = N(D ∩R) N(D) , (1) kompletnost C pa definiramo kot delež slikovnih ele- mentov referenčnih cest, ki jih je algoritem pravilno razpoznal kot ceste, in je podana z enačbo C = N(D ∩R) N(R) . (2) Oba kriterija vračata vrednost med 0 in 1. Za medse- bojno primerjavo uporabljenih metod izračunamo sku- pno merilo uspešnosti Q zaznave, ki upošteva obe zgoraj navedeni meri, Q = CP C − CP + P . (3) 3.2 Metode določanja referenčnih cest Najpogosteje kot vir referenčnih cest uporabljajo ročno označene ceste na satelitskem posnetku [8], [9], vendar gre večinoma za majhne izseke celotnega sate- litskega posnetka. Tako označimo človeku vidne ceste, ki imajo možnost, da jih podani algoritem sploh lahko zazna. Tako označene ceste imajo lego in širino, ki se skladata z zaznanimi cestami, in ne vsebujejo odsekov, ki so zakriti z gozdom ali drugimi objekti, saj ti niso vidni na posnetku. Obenem v podatke vključimo vse na novo zgrajene odseke in izločimo vse zelo ozke ceste, ki niso vidne pri dani ločljivosti posnetka. Za potrebe evalvacije algoritmov smo ročno označili ceste na štirih izsekih velikosti 9,7 km x 6,5 km, pridobljenih iz štirih satel. posnetkov, posnetih od maja do septembra. Drugi vir referenčnih cest so digitalne baze cestnih podatkov (GIS - geografski informacijski sistemi). Re- ferenčne maske cest je mogoče generirati na avtomatski način, zato lahko pokrijemo poljubno velike izseke. Generiranje binarnih referenčnih mask vključuje raste- rizacijo vektorskih podatkov cest ter georeferenciranje referenčne maske in maske zaznanih cest. V našem primeru smo za štiri izseke referenčne maske ter zaznane ceste poravnali ročno. Avtomatizirano generirane refe- renčne maske pa imajo tudi pomanjkljivosti, ki izhajajo iz napak v digitalnih podatkih, med drugim so prisotne naslednje težave: • Manjkajoče ceste, največkrat avtoceste in avtoce- stni priključki. • Oblika dejanskih odsekov cest na posnetku se raz- likuje od oblike digitaliziranih cest. • Izbira širine pasu okrog referenčne ceste vpliva na izračunane mere uspešnosti. Preširok pas povzroči, da med pravilno zaznane štejemo tudi napačno zaznane objekte tik ob cesti. • Odstopanja med referenčnimi in realnimi podatki zaradi napak v postopku georeferenciranja satelit- skega posnetka. 3.3 Postopki izračuna kriterijev Za izračun kriterijev uspešnosti algoritmov zaznavanja cest potrebujemo primerjavo z referenčnimi cestami. Množico slikovnih točk, ki pripadajo referenčnim ce- stam, označimo zR. Vse točke iz množice točk zaznanih cest D, ki sovpadajo s točkami iz množice referenčnih točk, obravnavamo kot pravilno zaznane, ostale pa kot nepravilno zaznane točke. Ker nam različni algoritmi vračajo različno debele zaznane ceste, kompletnosti zaznave ne moremo računati preprosto kot delež pokritosti pasu okrog referenčnih cest z zaznanimi točkami. Zato namesto pokritosti pri- merjamo dolžine odsekov. Zaznane točke, za katere smo ugotovili, da ustrezajo referenčnim cestam, s postopkom tanjšanja spremenimo v krivulje debeline 1 slikovni element. Njihovo število zdaj pomeni dolžino odsekov. Enako naredimo tudi s podatki o referenčnih cestah, torej kompletnost izračunamo kot kvocient števila točk v teh dveh množicah. 3.4 Primerjava ocen meril uspešnosti po obeh načinih V tabeli 1 podajamo rezultate izračunov meril uspešnosti zaznave cest po prvi metodi z adaptivnim pragom (A), ki smo jo preizkusili na štirih manjših iz- sekih vzetih iz štirih različnih satelitskih slik. Parametri uspešnosti so izračunani glede na ročno in avtomatsko generirane referenčne ceste. Mesec Ročno označene Avtom. gener. refer. ceste refer. ceste PA,1 CA,1 QA,1 PA,2 CA,2 QA,2 mar.(1) 0,50 0,39 0,28 0,64 0,32 0,27 maj(2) 0,47 0,52 0,33 0,60 0,43 0,33 jul.(3) 0,56 0,48 0,35 0,67 0,49 0,39 sep.(4) 0,54 0,41 0,30 0,62 0,35 0,29 Povpr. 0,52 0,45 0,32 0,62 0,35 0,32 Tabela 1: Ovrednotenje kvalitete zaznavanja po metodi A na posnetkih iz različnih mesecev. Primerjava, podana v tabeli 1, je bila narejena za manjše izseke celotnega satelitskega posnetka. Primer- java mer pokaže, da so vrednosti pravilnosti P višje za OCENJEVANJE USPEŠNOSTI POSTOPKOV ZAZNAVANJA CEST NA SATELITSKIH POSNETKIH 121 avtom. določene referenčne ceste, ker so te širše kot ročno označene, ter zato zajamejo v svoje območje več nepravilno zaznanih točk tik ob cesti (glej primer na sliki 2 desno). Kompletnost C pa je višja za ročno označene referenčne ceste, saj so bile pri tem označene le ceste, ki jih tudi človek lahko razpozna na danem posnetku. Prav tako vidimo, da opisani algoritem zaznave najbolje deluje za posnetke, narejene v poletnih mesecih. 3.5 Primerjava uspešnosti metod zaznavanja cest Na podlagi podanih meril uspešnosti zaznavanja cest želimo primerjati različne metode zaznavanja. Ker pa je ročna izdelava referenčne maske cest zelo zamudna, je mogoča le za manjše izseke satelitske slike. Če želimo ovrednotiti kakovost na celotnem posnetku ali več po- snetkih, potrebujemo avtomatizirano metodo evalvacije. V poskusu želimo oceniti, ali je mogoče z avtomatizi- rano evalvacijo na podlagi digitalnih podatkov o cestnem omrežju učinkovito in zanesljivo primerjati različne me- tode detekcije cest na satelitskih slikah. V ta namen smo pripravili štiri manjše izseke iz štirih različnih sa- telitskih posnetkov (različni meseci), ki tudi prikazujejo vsebinsko različna območja pokrajine. Za vse štiri izseke sta bili pripravljeni po dve maski referenčnih cest, prva (oznaka 1) z ročnim označevanjem, druga (oznaka 2) pa na podlagi rasterizacije GIS vektorjev in poravnave mask. Za vsak izsek (1)..(4) smo izvedli detekcijo po štirih metodah ter za vsako masko cest izvedli evalvacijo glede na obe referenčni maski, s čimer smo dobili rezultate P (1) A,1, C (1) A,1, P (1) A,2, C (1) A,2, itd. Za vsako metodo smo izračunali še povprečno pravilnost P̄A,1, P̄A,2 in kom- pletnost C̄A,1, C̄A,2 prek vseh štirih izsekov. Rezultati so izrisani v sliki 3, kjer so s svetlimi črtkanimi črtami izrisane krivulje za posamezne izseke po obeh načinih evalvacije. Dve debeli krivulji pa povezujeta točke pov- prečnih rezultatov posameznih metod detekcije, in sicer si metode sledijo od leve proti desni: C, D, B, A. Črtkana debela črta pomeni povprečne rezultate štirih metod na podlagi ročne evalvacije, neprekinjena črta pa na podlagi avtomatske evalvacije. Tabela 2 pa prikazuje izračunano skupno kakovost zaznavanja cest za posamezne metode, in sicer glede na ročno in avtomatsko generirano refe- renčno masko. P̄1 P̄2 C̄1 C̄2 Q̄1 Q̄2 ∆ % B 0,54 0,63 0,50 0,44 0,349 0,347 -0,61 A 0,52 0,63 0,45 0,40 0,317 0,323 1,87 D 0,38 0,52 0,51 0,46 0,278 0,323 16,1 C 0,23 0,38 0,70 0,65 0,207 0,317 52,7 Tabela 2: Ovrednotenje uspešnosti detekcije cest za posamezne metode glede na ročno referenčno masko (Q1) in glede na avtomatsko refer. masko (Q2) 3.6 Primerjava rezultatov obeh načinov evalvacije Primerjava rezultatov ročne in avtomatske evalvacije na sliki 3 pokaže, da sta obliki obeh krivulj zelo po- dobni, sta pa med seboj premaknjeni. V primerjavi z ročno metodo označevanja cest, za katero menimo, da je natančnejša (v okviru zmožnosti operaterja in vidljivosti cest na posnetku), nam avtomatsko generirane maske cest v povprečju pokažejo preveliko pravilnost metod. Vzrok je v večji širini referečne ceste, potrebni zaradi nenatančnosti poravnave, kar pomeni, da se tudi cestam bližnji objekti (hiše) klasificirajo kot pravilna zaznava. Po drugi strani je izmerjena kompletnost cest nekoliko nižja. Zanimivo je, da je skupna kakovost (tabela 2) pri metodah A in B kljub tem razlikam tako rekoč enaka, pri C in D pa je izračunana kakovost boljša pri avtomatskih maskah. Za zanesljivejšo primerjavo obeh načinov evalvacije pa bi bilo treba generirati več vzorcev ročnih mask. Kljub slabostim avtomatskega načina evalvacije nam ta lahko pomaga za primerjavo posameznih metod. Po obeh merilih izstopa metoda B s Houghovimi krivuljami, ki kot kriterij ceste vpeljuje lego slikovnega elementa na daljšem ravnem odseku. Metoda A (adapt. prag odziva Top-Hat) pri klasifikaciji točke upošteva veliko manjšo okolico, kar pomeni več nepravilnih manjših odsekov. Metoda D z ročno določeno učno množico se po uspešnosti približa metodi A, saj je ena bistvenih značilk tudi odziv Top-Hat. Metoda C je slabša zaradi nenatančne učne množice, v kateri se nahajajo v ra- zredu cest tudi točke bližnje okolice cest, kar pripelje do najvišje vrednosti kompletnosti, vendar s tem tudi najslabše pravilnosti. 4 ZAKLJUČEK V članku smo predstavili način avtomatiziranega oce- njevanja uspešnosti algoritmov zaznavanja cestnega omrežja na satelitskih slikah, ki vključuje standardne kriterije pravilnosti in kompletnosti zaznanega cestnega omrežja. Avtomatizirani način ocenjevanja smo primer- jali s standardnim na podlagi ročno generirane refe- renčne maske cestnih odsekov. Primerjava ocen uspešnosti po obeh načinih izračuna nam pokaže, da metoda avtomatiziranega generiranja re- ferenčnih cestnih mask kljub svojim slabostim omogoča dobro relativno primerjavo uspešnosti posameznih me- tod detekcije, ne pa še izračuna absolutnih vrednosti kriterijev. Za odpravo napak pa bi bilo treba izboljšati način poravnavanja referenčne maske in detektirane ma- ske cest ter s tem zmanjšati sistematično napako pri ocenjevanju pravilnosti in kompletnosti zaznanih cest. Dodatna pomanjkljivost avtomatizirane metode pa je vpliv nenatančnosti in neažurnosti samih podatkovnih baz cestnega omrežja, ki smo jo opazili tudi pri delu v praksi.