1 Uvod
Obstaja veliko postopkov analiziranja slike, ki uspešno
delujejo na slikah, zajetih z namenskimi kamerami. Te
omogočajo zajemanje zelo kakovostne slike, vendar je
cena takšnih naprav nedosegljiva za nizkocenovne
aplikacije. Zato nas zanima možnost uporabe splošno-
namenskih nizkocenovnih kamer za namene analiziranja
slike. Vpliv kakovosti slike na uspešnost postopka
analize je najpogosteje zanemarjen, saj je kakovost slike
težko določljiva veličina [1]. Pri analizi slike se s
kakovostjo slike srečamo pri postopku razčlenjevanja.
Razčlenjevanje nam služi za določanje področij v sliki,
potrebnih pri nadaljnji analizi, zato je kakovost slike
zelo pomembna za uspešno razčlenjevanje. V članku
bomo opisali postopek razčlenjevanja slike, ki temelji
na določanju področij v sliki samo s pomočjo barvne
informacije. Prednost takšnega postopka razčlenjevanja
je v preprostem procesiranju, kjer iskane objekte
določamo le na podlagi barve posameznega slikovnega
elementa v sliki. Poseben pomen za barvno
razčlenjevanje slike ima strojna oprema za zajemanje in
digitalizacijo slike, kajti potreben pogoj za uspešno
barvno razčlenjevanje je dovolj kakovostno spektralno
zajemanje barvne slike. Kakovost zajemanja spektra
barvne slike je povezana s ceno naprave za zajemanje –
kamere. Visokocenovne specializirane kamere
omogočajo zajemanje spektralnih slik v več spektralnih
pasovih; od infrardečega do ultravijoličnega spektra.
Takšne kamere omogočajo zelo učinkovito
razčlenjevanje slike in se uporabljajo na področjih, kot
je npr. analiziranje terena s pomočjo fotografij iz zraka
[2]. Nizkocenovne, splošnonamenske barvne kamere
zajemajo tri pasove v vidnem spektru: rdeči, zeleni in
modri. Najpogosteje se uporabljajo za zajemanje slike,
ki služi za prikaz na elektronskih medijih in papirju,
temu ustrezna je spektralna kakovost barvnih slik,
zajetih s takšnimi napravami.
V članku se bomo posvetili razčlenjevanju barvne
slike, zajete z nizkocenovnimi, splošnonamenskimi
barvnimi kamerami. Primerjali bomo razčlenjevanje
barvnih slik, zajetih s kamerami, ki za zajemanje slike
uporabljajo slikovna tipala CMOS in CCD. Definirali
bomo postopek razčlenjevanja barvne slike, ki omogoča
uspešno razpoznavanje iskane barve, tudi v slikah, ki so
zajete z manj kakovostnimi napravami. Pri
razčlenjevanju se bomo osredotočili na izločanje
objektov v sliki, ki so barve človeške kože, čeprav je
postopek mogoče uporabiti za izločanje objektov
poljubnih barv. Postopek bomo uporabili na
percepcijsko uniformnem in percepcijsko
neuniformnem barvnem prostoru. Postopek bomo tudi
primerjali s podobnimi obstoječimi postopki
razčlenjevanja slike.
Raziskave o možnostih razčlenjevanja barvne slike s
splošnonamenskimi kamerami spadajo v širši okvir
prizadevanj za definiranje novih informacijskih
paradigem v sodobnih telekomunikacijskih storitvah, s
pomočjo vizualnih komunikacijskih vmesnikov.
2 Sorodne raziskave
Postopke razčlenjevanja barvne slike najpogosteje
delimo glede na barvni prostor, v katerem se izvaja
razvrščanje barvnih slikovnih elementov. Različni
barvni prostori so bolj ali manj percepcijsko uniformni,
kar pomeni, da je zaznavanje barvnih sprememb bolj ali
manj enakomerno ne glede na položaj v barvnem
prostoru. Zaradi enakomernega zaznavanja sprememb
dajejo percepcijsko uniformni barvni prostori pogosto
boljše rezultate pri barvnem razčlenjevanju slike [4].
Vendar slikovnih elementov nimamo vedno na voljo v
percepcijsko uniformnem barvnem prostoru. Pretvorba
slikovnih elementov v takšen prostor zahteva dodatno
procesiranje, kar vpliva na večjo računsko zahtevnost
postopkov. Večina slik je na voljo v standardnem
prostoru RGB, imenovanem sRGB (IEC 61966-2-1),
kjer so slikovni elementi prirejeni za izris na monitorju.
V članku se bomo osredotočili na prostor sRGB. Ker je
postopek razčlenjevanja, ki ga bomo opisali mogoče
uporabiti v poljubnem barvnem prostoru, bomo poleg
prostora sRGB uporabili še pogosto uporabljeni
percepcijsko bolj uniformni barvni prostor YCbCr [5], v
nadaljevanju pisan kot YCC. Pri tem bomo primerjali
rezultate razčlenjevanja obeh barvnih prostorov.
Razčlenjevanje barvne slike bomo izvajali z
rojenjem slikovnih elementov v barvnem prostoru, ki na
splošno poteka v dveh ločenih korakih. V prvem
ugotavljamo lastnosti rojev slikovnih elementov iskane
barve v ustreznem barvnem prostoru, v drugem koraku
pa z izbrano metriko v barvnem prostoru prirejamo
posamezne slikovne elemente določenim rojem.
Postopke rojenja za razčlenjevanje barvne slike,
opisane v literaturi, lahko delimo na mehke in trde [3].
Razčlenjevanje barvne slike, zajete s splošnonamenskimi barvnimi kamerami   119
Mehki načini rojenja omogočajo hkratno razvrščanje
slikovnih elementov k več različnim rojem, kar nam
omogoča prenos procesa razvrščanja na višje nivoje
procesiranja slike. Pri trdih načinih rojenja razvrstimo
posamezni slikovni element k samo enemu roju.
Uporabili bomo trdi način rojenja, ker želimo slikovne
elemente razvrščati glede na iskano barvo neposredno
na nizkem nivoju procesiranja slike.
Splošno za razčlenjevanje barvne slike uporabljamo
različne metrike, za različne barvne prostore. Zaradi
preprostega izračuna bomo uporabili taksistovo metriko.
Različne variacije kožne barvne bomo dobili s pomočjo
učnih vzorcev, ki jih bomo ročno določili na različnih
učnih slikah za vsak tip kamere posebej.
3 Formalizacija problema
Barvni prostor bomo definirali kot tridimenzionalni
metrični prostor nad obsegom realnih števil ),( dB .
Slikovni element p je vektor metričnega prostora
Bp∈ , zapisan kot
),,( bgrp = , ,,, ℜ∈bgr (1)
kjer so , g in b vrednosti rdeče zelene in modre
komponente slikovnega elementa. V metričnem
prostoru RGB  bomo za določanje razdalj med
vektorjema 1p in 2p uporabili taksistovo razdaljo d :
21212121 ),( bbggrrppd −+−+−= , (2)
kjer so 111 ,, bgr komponente prvega vektorja in
222 ,, bgr komponente drugega vektorja.
Postopek razčlenjevanja barvne slike poteka v dveh
ločenih korakih. V prvem koraku določamo roje ciljne
barve. V drugem koraku s pomočjo najdenih rojev
slikovne elemente razvrstimo v dva razreda: razred
ciljne barve in razred drugih barv.
Roje ciljne barve določamo s pomočjo množice učnih
slikovnih elementov ,U ki jih dobimo z ročnim
določanjem področij ciljne barve v učnih slikah.
BU ⊆ , )( 10 −= NppU K . (3)
Število slikovnih elementov je označeno z .N
Variacije ciljne barve želimo opisati z več različnimi
roji. Vsak roj naj bo predstavljen s prototipom roja in
vsi slikovni elementi roja naj bodo od prototipa
oddaljeni za neko največjo razdaljo. Ob upoštevanju teh
zahtev vidimo, da je število rojev odvisno od izbrane
največje razdalje. Opisane zahteve bomo izpolnili z
definiranjem postopka določanja rojev, ki združuje ideje
hierarhičnega in delitvenega iskanja rojev [6, 7].
Postopek rojenja poteka po petih korakih:
1. V prvem koraku vsakemu učnemu slikovnemu
elementu določimo vsoto obratnih vrednosti   razdalj do
vseh drugih učnih slikovnih elementov po enačbi:
∑
−=
= +
=
2
0 ),(1
1Nj
j ji
i ppd
r , ji ≠ . (4)
Učni slikovni elementi, ki se nahajajo na enakih
položajih v barvnem prostoru imajo isto  vrednost vsote
obratnih vrednosti razdalj.
2. Odstranimo večkratne slikovne elemente tako, da na
mestih v barvnem prostoru, kjer se nahaja več slikovnih
elementov hkrati, ohranimo samo en slikovni element s
pripadajočo vsoto obratnih vrednosti razdalj.
3. Slikovne elemente razvrstimo glede na velikost vsote
obratnih vrednosti razdalj od največje do najmanjše.
4. V razvrščanem nizu slikovnih vrednosti določimo
prvi slikovni element. Določenemu slikovnemu
elementu izračunamo razdaljo do vseh naslednjih
slikovnih elementov v nizu po enačbi (2). Slikovne
elemente, katerih razdalja do izbranega slikovnega
elementa je znotraj določenega pragu ,δ odstranimo iz
tabele.
5. Ponavljamo korak 4, dokler ne pridemo do konca
niza. Na koncu ostanejo v nizu prototipi rojev. Slikovni
elementi, ki pripadajo posameznemu roju, so od roja
oddaljeni največ za vrednost pragu δ .
Postopek iskanja rojev je ob večjem naboru učnih
slikovnih elementov računsko precej zahteven. Vendar
lahko veliko računsko zahtevnost zanemarimo, saj
postopek iskanja rojev za določeno učno barvo
izvedemo samo enkrat.
Slikovne elemente razvrstimo v dva razreda s pomočjo
najdenih rojev. Prvi razred predstavlja ciljno barvo,
drugi predstavlja vse druge barve. Razvrščanje
izvedemo tako, da slikovnemu elementu določimo
razdalje do vseh prototipov rojev po enačbi (2). Slikovni
element razvrstimo v razred ciljne barve, če je
najmanjša razdalja manjša od pragu .δ
δ<)min(d , (5)
sicer slikovni element razvrstimo v razred drugih barv.
4 Rezultati
Opisani postopek razčlenjevanja barvne slike bomo
preizkusili na slikah, zajetih z različnimi splošno-
namenskimi barvnimi kamerami. Namen raziskave je
proučiti uspešnost razčlenjevanja barvnih slik, zajetih s
splošnonamenskimi barvnimi kamerami in primerjati
uspešnost razčlenjevanja barvnih slik z različnimi
postopki razčlenjevanja.
Rulić, Kramberger, Kačič120
Postopke bomo preizkusili s pomočjo slik, zajetih z
dvema različnima splošnonamenskima, nizko-
cenovnima kamerama. Prva kamera (ZT-803T) vsebuje
slikovno tipalo CMOS, medtem ko druga kamera
(MIRON MTV-63W1P) vsebuje slikovno tipalo CCD.
Kot referenco bomo uporabili še tretjo kamero, ki
vsebuje kakovostnejši sistem za zajemanje barve s tremi
slikovnimi tipali CCD (Cannon XL1S). V nadaljevanju
bomo kamere označevali glede na tipala s kraticami
CMOS, CCD in 3CCD.  Slike smo zajemali v
nenadzorovanih scenah, ki so zaradi prisotnosti motečih
objektov in nenadzorovane osvetlitve za razčlenjevanje
zelo zahtevne. Osvetlitev je bila sestavljena delno iz
neonskih svetil, delno iz dnevne svetlobe. Slike vseh
kamer smo zajemali z razločljivostjo 352 stolpcev in
288 vrstic. Digitalizacijo in procesiranje smo izvedli na
osebnem računalniku s kartico za zajemanje BT878.
Barvo smo zajemali v barvnem prostoru RGB z 8 biti za
vsako barvno komponento.
Definirani postopek bomo izvedli v barvnem
prostoru sRGB in YCC z namenom primerjave uporabe
neuniformnega in uniformnega barvnega prostora. Poleg
tega bomo definirani postopek primerjali s tremi
postopki za razčlenjevanje barvne slike, opisanimi v
[10], [11] in [12]. Vsem postopkom bomo določili
odstotek pravilno razpoznane kožne barve, nepravilno
razpoznane kožne barve in računsko zahtevnost. Pri
vseh postopkih, razen pri postopku [11], bomo uporabili
enake učne vrednosti slikovnih elementov. Učne
vrednosti so določene za vsako kamero posebej. Pri tem
smo imeli za kamero 3CCD 15608 učnih vrednosti, za
kamero CCD 15641 učnih vrednosti in za kamero
CMOS 15620 učnih vrednosti. Pogoje za klasifikacijo
slikovnih elementov bomo določili iz vseh učnih
vrednosti posameznega nabora. Zato bodo na rezultate
razčlenjevanja vplivale vse učne vrednosti pri vseh
postopkih, razen pri postopku [11], ki za delovanje ne
potrebuje učnih vrednosti. Odstotek pravilno p in
nepravilno n razvrščenih slikovnih elementov bomo
določali po enačbah
%100×=
m
r
p , (6)
%100×
−
−
=
ms
rv
n , (7)
pri tem je število slikovnih elementov, ki so bili
razvrščeni v razred kožne barve in ki se nahajajo na
pričakovanih območjih kožne barve v sliki, m je
število slikovnih elementov pričakovanih območij
kožne barve v sliki, s je število slikovnih elementov v
sliki in v pomeni število vseh slikovnih elementov, ki
so bili razvrščeni v razred kožne barve. Vidimo, da se
enačba (6) nanaša le na slikovne elemente območij
pričakovane kožne barve, kjer ugotavljamo odstotek
pravilno razvrščenih elementov tega barvnega razreda.
Z enačbo (7) ugotavljamo odstotek elementov na
območjih pričakovane nekožne barve, ki so nepravilno
razvrščeni v razred kožne barve. Posamezen slikovni
element se ne more hkrati nahajati na pričakovanih
območjih kožne in nekožne barve, zato enačbi določata
uspešnost razvrščanja neodvisno za vsak barvni razred
posebej (obeh odstotkov ne moremo seštevati, da bi
dobili 100 odstotkov).
4.1 Učne množice vzorcev
Kameri CMOS in CCD uporabljata slikovno tipalo za
zajemanje barvnega spektra z razporejenimi barvnimi
filtri (ang. Color Filter Array), kjer posamezen slikovni
element predstavlja barvni filter ene od treh spektralnih
komponent. Rdečo, zeleno in modro spektralno vrednost
slikovnega elementa dobimo z interpolacijo vrednosti
sosednjih barvnih filtrov [8]. Takšen sistem zajemanja
barve je cenovno najugodnejši, vendar je pri tem
zmanjšana kakovost barvnega spektra. Kakovostnejši in
dražji sistem za zajemanje barve ima kamera 3CCD,
kjer se vsaka barvna komponenta preslika na ločeno
slikovno tipalo CCD.
Učne vrednosti slikovnih elementov smo pridobili z
ročnim določanjem območij ciljne barve v več slikah,
zajetih z isto kamero. Pri tem smo izbirali vizualno
različna območja v slikah, ki predstavljajo kožno barvo.
Več slik smo uporabili zato, da so območja ciljne barve
predstavljena z različnimi osvetlitvami scene. Na slikah
od 1a) do 1f) so prikazani učni slikovni elementi barve
kože v barvnem prostoru sRGB. Učni slikovni elementi
so prikazani iz dveh različnih smeri v barvnem prostoru
sRGB. Iz slik 1a) do 1f) vidimo, da so položaji
slikovnih elementov kožne barve vseh treh kamer dokaj
podobni, vendar istih rojev za razčlenjevanje slik,
zajetih z različnima kamerama, ne moremo uporabiti.
Vidimo tudi, da so slikovni elementi kamere 3CCD v
barvnem prostoru najmanj razpršeni. Nekoliko večja je
razpršenost učnih slikovnih elementov kamere CCD.
Največja je razpršenost učnih slikovnih elementov
kamere CMOS. Iz tega lahko sklepamo, da daje kamera
3CCD najkakovostnejšo sliko za razčlenjevanje,
medtem ko daje kamera CMOS za razčlenjevanje
najmanj kakovostno sliko. Vzrok za različno
razpršenost ciljne barve pri različnih tipih slikovnih
tipal gre iskati v zmožnostih pravilnega zajemanja barve
različnih tipih slikovnih tipal [9],  kot tudi v različnih
možnostih krmiljenja oziroma nadzora slikovnih tipal,
kot je čas osvetlitve, avtomatski nadzor ojačenja,
nastavitev ravnotežja bele barve (ang. white balance)
ipd.
4.2 Določanje rojev
Učne slikovne elemente, prikazane na slikah 1a) do 1f),
razvrstimo v roje. Število rojev posamezne množice
učnih slikovnih elementov je odvisno od vrednosti
pragu δ . V tabeli 1 je prikazana odvisnost števila rojev
od razdalje za učne slikovne elemente testnih kamer.
Razčlenjevanje barvne slike, zajete s splošnonamenskimi barvnimi kamerami   121
a)  b)
c)  d)
e)  f)
Slika 1: Učni slikovni elementi kožne barve v prostoru sRGB
prikazani iz različnih perspektiv. Perspektive so izbrane tako,
da omogočajo vpogled v različno razpršenost slikovnih
elementov.  a), b) slikovni elementi kamere 3CCD. c), d)
slikovni elementi kamere CCD. e) f) slikovni elementi kamere
CMOS.
Figure 1: Learning pixels of the skin color from different
perspectives in the sRGB color space. Perspectives are chosen
so that different spreads of pixels can be seen. a), b) pixels of
3CCD camera. c), d) pixels of CCD camera. e), f) pixels of
CMOS camera.
δ CMOS
sRGB
CMOS
YCC
CCD
sRGB
CCD
YCC
3CCD
sRGB
3CCD
YCC
6 1458 654 885 217 540 119
9 665 294 390 85 232 54
12 345 159 218 48 128 31
15 225 93 130 33 77 22
18 145 67 87 23 58 15
21 104 47 61 17 40 12
Tabela 1: Odvisnost števila rojev od razdalje δ za učne
slikovne elemente kamer CMOS = K1, CCD = K2 in 3CCD =
K3, za barvna prostora sRGB in YCC
Table 1: Dependence of the number of clusters on distance δ
for pixels of cameras CMOS = K1, CCD = K2 and 3CCD =
K3, for sRGB and YCC color spaces
Iz tabele 1 je razvidno, da se število rojev veča z
manjšanjem razdalje. To je pričakovani rezultat, saj
manjša razdalja omogoča natančnejši opis ciljne barve.
Natančnost opisa barve je odvisna od razdalje. Večja ko
je razdalja od ciljne barve, večja je verjetnost, da so
znotraj te razdalje slikovni elementi drugih barv. Izbira
razdalje δ je ključna za uspešno razčlenjevanje slike po
opisanem postopku. Pri izbiri vrednosti δ se moramo
soočiti s kompromisom, saj manjše vrednosti δ
omogočajo natančnejše razvrščanje slikovnih
elementov, vendar se ob manjšanju δ povečuje število
rojev, kar povečuje računsko zapletenost postopka. Iz
poskusov smo določili uporabne vrednosti δ, ki se
gibljejo od 6 do 21. Uporabljene vrednosti δ v tabeli 1
so večkratniki števila tri. Takšne vrednosti nismo izbrali
zaradi pravila, ampak zaradi lažjega prikaza (za
vrednosti δ lahko izberemo poljubna števila).
V tabeli 1 lahko vidimo, da je število rojev v
barvnem prostoru YCC veliko manjše pri enaki
vrednosti δ kot v barvnem prostoru sRGB. Vzroka za to
sta lahko dva. Prvi je kompaktnejša porazdelitev
slikovnih elementov kožne barve v barvnem prostoru
YCC. Drugi je nekoliko manjši obseg barvnega prostora
YCC, zaradi česar je v tem prostoru izbrana razdalja
sorazmerno večja.
Iz tabele 1 lahko sklepamo, da je barvni prostor
YCC primernejši od barvnega prostora sRGB zaradi
manjšega števila rojev.
4.3 Razčlenjevanje barvne slike
Uspešnost razčlenjevanja barvnih slik, zajetih s tremi
kamerami, smo določali s pomočjo enačb (6) in (7). Z
vsako od opisanih kamer smo zajeli barvno sliko scene
z naključnimi objekti. V to sceno smo postavili roko, ki
predstavlja objekt kožne barve. Pri tem smo poskušali z
vsemi kamerami narediti kar se da podobne slike. Slike,
ki smo jih zajeli, so prikazane na slikah 2a) do 2c). Tem
slikam smo ročno določili območja s pričakovano barvo
kože. Tako smo dobili območja potrebna za določanje
uspešnosti postopka po enačbah (6) in (7). Ker je ročno
določanje območij pričakovane kožne barve časovno
zamudno, smo se omejili na samo eno sliko za vsako
kamero. Rezultati razčlenjevanja so prikazani v tabeli 2.
V njej so podani odstotki pravilno in nepravilno
razvrščenih slikovnih elementov, določeni z enačbama
(6) in (7). V idealnem primeru razvrščanja bi bil
odstotek pravilno razvrščenih slikovnih elementov enak
100% in nepravilno razvrščenih slikovnih elementov
0% Rezultati kažejo, da je v vseh primerih pravilno
razvrščenih slikovnih elementov blizu 100%. Odstotek
nepravilno razvrščenih slikovnih elementov je različen.
Odstotek nepravilno razvrščenih slikovnih elementov
tako dejansko kaže uspešnost postopka. Vidimo, da je
razčlenjevanje po opisanem postopku uspešnejše v
sRGB barvnem prostoru.
Rulić, Kramberger, Kačič122
Kamera
Camera
Barvni prostor
Color Space
δ Pravilno
Correct
Nepravilno
Incorrect
3CCD sRGB 6 91% 7%
CCD sRGB 6 86% 16%
CMOS sRGB 6 85% 12%
3CCD YCC 6 96% 25%
CCD YCC 6 92% 25%
CMOS YCC 6 92% 22%
3CCD sRGB 9 93% 9%
CCD sRGB 9 89% 18%
CMOS sRGB 9 89% 14%
3CCD YCC 9 97% 31%
CCD YCC 9 92% 26%
CMOS YCC 9 93% 24%
3CCD sRGB 12 94% 11%
CCD sRGB 12 91% 20%
CMOS sRGB 12 91% 16%
3CCD YCC 12 97% 24%
CCD YCC 12 93% 30%
CMOS YCC 12 94% 26%
3CCD sRGB 15 96% 13%
CCD sRGB 15 92% 22%
CMOS sRGB 15 92% 19%
3CCD YCC 15 98% 45%
CCD YCC 15 94% 32%
CMOS YCC 15 96% 36%
3CCD sRGB 18 96% 19%
CCD sRGB 18 92% 23%
CMOS sRGB 18 93% 20%
3CCD YCC 18 98% 49%
CCD YCC 18 95% 34%
CMOS YCC 18 96% 41%
3CCD sRGB 21 96% 20%
CCD sRGB 21 92% 24%
CMOS sRGB 21 93% 24%
3CCD YCC 21 99% 51%
CCD YCC 21 95% 32%
CMOS YCC 21 97% 43%
Tabela 2: Rezultati razčlenjevanja barvnih slik, zajetih z
različnimi kamerami, pri različnih vrednostih δ, v barvnih
prostorih sRGB in YCC
Table 2: Segmentation results for images captured with
different cameras, for different values of δ, in the sRGB and
YCC color spaces
Definirani postopek smo pri najmanjši računski
zahtevnosti primerjali tudi s podobnimi postopki za
barvno razčlenjevanje slike, ki so opisani v [10], [11] in
[12]. Uspešnost razvrščanja slikovnih elementov smo
določali z opisanim postopkom po enačbah (6) in (7).
Rezultati razčlenjevanja so prikazani v tabeli 3, kjer
vidimo, se je najbolje odrezal definirani postopek, saj
nudi najmanjši odstotek nepravilno razvrščenih
slikovnih elementov pri velikem odstotku pravilno
razvrščenih slikovnih elementov. Postopek [10]
omogoča najmanjši odstotek nepravilno razvrščenih
slikovnih elementov vendar je odstotek pravilno
razvrščenih slikovnih elementov zelo majhen. Pri
postopku [11] ne uporabljamo učnih vrednosti, zato so
rezultati zelo odvisni od uporabljene kamere. Najboljši
so pri sliki najkakovostnejše kamere, ki najbolj
verodostojno opisuje barve objektov v sceni. Pri slikah
ostalih kamer so rezultati slabi. Najslabši so rezultati
postopka [12], kjer je delež nepravilno razvrščenih
slikovnih elementov zelo velik.
P Kamera
Camera
Barvni prostor
Color space
Pravilno
Correct
Nepravilno
Incorrect
1 3CCD sRGB 35% 1%
1 CCD sRGB 27% 2%
1 CMOS sRGB 11% 1%
2 3CCD sRGB 84% 23%
2 CCD sRGB 98% 67%
2 CMOS sRGB 26% 30%
3 3CCD YCC 99% 33%
3 CCD YCC 96% 60%
3 CMOS YCC 99% 54%
4 3CCD sRGB 96% 20%
4 CCD sRGB 92% 24%
4 CMOS sRGB 93% 24%
Tabela 3: Rezultati razčlenjevanja slik, zajetih z različnimi
kamerami, za postopke: P=1 postopek [10], P=2 postopek
[11], P=3 postopek [12], P=4 definirani postopek (δ=21)
Table 3: Segmentation results for images captured with
different cameras for methods: P=1 method [10], P=2 method
[11], p=3 method [12], P=4 observed method (δ=21)
Postopek
Method
Barvni  prostor
Color space
Št. pogojev
No. conditions
definiran postopek
defined method
sRGB 40 - 1458
definiran postopek
defined method
YCC 12 - 654
postopek [10]
method [10]
sRGB 5
postopek [11]
method [11]
YCC 4
postopek [12]
method [12]
sRGB 13
Tabela 4: Število pogojev, potrebnih za razvrstitev slikovnega
elementa pri različnih postopkih
Table 4: Number of conditions needed for classification of
pixel in different methods
Vse postopke barvnega razčlenjevanja slike smo
primerjali tudi po računski zahtevnosti. Računsko
zahtevnost smo izrazili kot število pogojev potrebnih za
razvrstitev enega slikovnega elementa v razred kožne
barve. Rezultati so prikazani v tabeli 4, ki nam kaže, da
so vsi postopki računsko manj zahtevni od definiranega
postopka, katerega računska zahtevnost je različna za
različne vrednosti δ. Čeprav je pri največji vrednosti δ
Razčlenjevanje barvne slike, zajete s splošnonamenskimi barvnimi kamerami   123
računska zahtevnost definiranega postopka najmanjša,
in pri tem še vedno večja kot pri ostalih postopkih, je
definirani postopek računsko hitro izvedljiv na sodobni
strojni opremi, ki omogoča vzporedno vektorsko
procesiranje podatkov.
Za boljši vpogled v rezultate razčlenjevanja smo na
slikah 2d) do 2s) prikazali izhodne slike za vse postopke
razčlenjevanja.
a)  b)  c)
d)  e)  f)
g)  h)  i)
j)   k)  l)
m) n)  o)
p)  r) s)
Slika 2: a), b), c) vhodne slike, zajete s kamerami 3CCD, CCD
in CMOS. Pod posamezno vhodno sliko so v stolpcu prikazani
rezultati razčlenjevanja te slike z različnimi postopki. Bela
območja pomenijo razpoznano barvo kože, temna območja pa
druge barve. d), e), f) rezultati definiranega postopka v
barvnem prostoru sRGB (δ=6). g), h), i) rezultati definiranega
postopku v barvnem prostoru YCC (δ=6). j), k), l) rezultati
postopka [10]. m), n), o) rezultati postopka [11]. p), r), s)
rezultati postopka [12].
Figure 2: a), b), c) input images captured with 3CCD, CCD
and CMOS camera. The results of segmentation with different
methods, for each input image, are presented in the column
under the input image. White segments in resulting images
represent the skin color, black segments represent other colors.
d), e), f) results of the observed method in the sRGB color
space (δ=6). g), h), i) results of the observed method in the
YCC color space (δ=6). j), k), l), results of method [10]. m),
n), o), results of method [11]. p), r), s), results of method [12].
5 Sklep
Eksperimentalni rezultati so pokazali, da uporaba
percepcijsko uniformnega prostora YCC z definiranim
postopkom razčlenjevanja slike ne daje boljših
rezultatov od uporabe percepcijsko manj uniformnega
prostora sRGB. Barvni prostor YCC omogoča manjšo
računsko zahtevnost glede na prostor sRGB pri enaki
vrednosti parametra δ. Vendar je razčlenjevanje v
barvnem prostoru YCC pri enaki vrednosti δ manj
uspešno kot v barvnem prostoru sRGB. Uspešnost
razčlenjevanja v prostoru YCC lahko povečamo z
manjšanjem vrednosti δ, vendar se pri tem poveča tudi
računska zahtevnost. Ob izenačitvi uspešnosti
razčlenjevanja ali računski zahtevnosti prostorov YCC
in sRGB ni bistvene razlike v uporabi barvnega
prostora.
Iz rezultatov tudi vidimo, da lahko z definiranim
postopkom dokaj uspešno barvno razčlenjujemo tudi
slike, zajete s cenenimi kamerami, ki so barvno slabše
kakovosti, česar ne moremo storiti pri primerjanih
postopkih.
Na splošno lahko rečemo, da definirani postopek daje
boljše rezultate razčlenjevanja, vendar ob nekoliko večji
računski zahtevnosti.
6 Literatura
[1] Z. Wang, A. C. Bovik, L. Lu, Why is image quality
assessment so difficult?, Proc. of Int. Conf. on
Acoustics, Speech and Signal Processing, vol. IV,
(2002), 3313–3316.
[2] G. Petrie, Airborne digital frame cameras,
GeoInformatics 7(6), October/November (2003), 18-27.
[3] W. Skarbek, A. Koschan, Colour Image
Segmentation – A Survey, Tehnical Report 94-32,
Tehnical University Berlin, October 1994.
[4] V. Vezhnevets, V. Sazonov, A. Andreeva, A survey
on pixel-based skin color detection techniques,
Graphicon 2003, 13th International Conference on the
Computer Graphics and Vision, (2003), 85-92.
[5] R. Queiroz, Compression of color images, Digital
Color Imaging Handbook, G. Sharma, Ed., CRC Press,
2003.
[6] N. Pavešić, Razpoznavanje vzorcev: Uvod v analizo
in razumevanje vidnih in slušnih signalov – 2. razširjena
izd., Založba FE in FRI Ljubljana, 2000.
[7]  A. K. Jain, M. N. Murty, P. J. Flynn, Data
Clustering: A Review, ACM Computing Surveys, Vol.
31, No 3. (1999), 264-323.
[8] K. Parulski, K. Spaulding, Color image processing
for digital cameras, Digital Color Imaging Handbook,
G. Sharma, Ed., CRC Press, 2003.
Rulić, Kramberger, Kačič124
[9] N. Blanc, CCD versus CMOS – has CCD imaging
come to an end?, Fritsch/Spiller (eds.) Photogrammetric
Week Wichmann Verlag, Heidelberg, (2001),  131-137.
[10] I. Kramberger, Real-time skin feature identification
in a time-sequential video stream, Optical engineering
(Bellingham. Print),Vol. 44, No. 4,  (2005),  047201-1 -
047201-10.
[11] J. Kovač, P. Peer, F. Solina, Human skin colour
clustering for face detection, The IEEE Region 8
EUROCON 2003 : computer as a tool, (2003), vol. 2,
144-148.
[12] D. Chai, K. N. Ngan, Face Segmentation Using
Skin Color Map in Videophone Applications, IEEE
Transactions on Circuits and Systems for Video
Technology, (1999), Vol  9, No 4, 551-564.
Peter Rulić je diplomiral leta 2000 na Fakulteti za
elektrotehniko, računalništvo in informatiko (FERI) v
Mariboru. Je študent podiplomskega študija na
omenjeni fakulteti. Njegovo raziskovano področje
vključuje procesiranje slike in komunikacijo človek–
stroj.
Iztok Kramberger je diplomiral leta 1997 na FERI v
Mariboru. Leta 2000 je magistriral in leta 2003
doktoriral na isti ustanovi, kjer je tudi zaposlen kot
asistent. Njegovo raziskovalno področje vključuje
procesiranje slike in komunikacijo človek–stroj.
Zdravko Kačič je diplomiral leta 1986 na FERI v
Mariboru. Leta 1989 je magistriral, leta 1992 pa
doktoriral na isti ustanovi, kjer je zaposlen kot redni
profesor. Je vodja laboratorija za digitalno procesiranje
signalov na FERI. Njegovo raziskovalno področje
vključuje področje multimodalnih komunikacijskih
vmesnikov in sodobne načine komunikacije med
človekom in strojem.