IpariKepfeldolgozasEllenorzo05

A VIK Wikiből
A lap korábbi változatát látod, amilyen (vitalap) 2012. október 21., 20:38-kor történt szerkesztése után volt. (Új oldal, tartalma: „{{GlobalTemplate|Infoszak|IpariKepfeldolgozasEllenorzo05}} __TOC__ ==Ipari képfeldolgozás és megjelenítés Ellenőrző kérdések - 5. hét== ====1. Képek szegm…”)
(eltér) ← Régebbi változat | Aktuális változat (eltér) | Újabb változat→ (eltér)
Ugrás a navigációhoz Ugrás a kereséshez

Ez az oldal a korábbi SCH wiki-ről lett áthozva. Az eredeti változata itt érhető el.

Ha úgy érzed, hogy bármilyen formázási vagy tartalmi probléma van vele, akkor kérlek javíts rajta egy rövid szerkesztéssel.

Ha nem tudod, hogyan indulj el, olvasd el a migrálási útmutatót


Ipari képfeldolgozás és megjelenítés Ellenőrző kérdések - 5. hét

1. Képek szegmentálásának fő csoportosítása

Két alapvető tulajdonság analízisére alapul:

szintek hasonlósága:

  • küszöbözés
  • régió növelés
  • régió szeletelés és növesztés

diszkontinuitás:

  • pontok,
  • vonalak,
  • élek detektálása

Statikus és dinamikus képeken egyaránt értelmezhető a szegmentálás


2. Küszöbözés fogalma, globális lokális és dinamikus küszöbözés

  • f(x,y) - a kép x,y koordinátáknál mért intenzitása
  • p(x,y) - pont lokális tulajdonsága (pl x,y központú szomszédság átlaga)
  • g(x,y) a küszöbözött kép: g(x,y) = { 1 ha f(x,y) > T, 0 ha f(x,y) <= T }.
  • Ha T csak f(x,y)-tól függ: globális küszöbözés
  • Ha T csak f(x,y)-tól és p(x,y)-tól akkor lokális
  • Ha T függ x,y-tól is akkor dinamikus

Globális küszöbözés lehet az is, ha pl. egy globális hisztogram tulságai (medián stb.) alapján határozzuk meg a később felhasználandó küszöbértéket. (Ez csak akkor működik jól, ha mi befolyásoljuk a megvilágítás körülményeit.)

3. Magyarázza meg a megvilágítás hatását a képek szegmentálására

Az f(x,y) képet r(x,y) reflexió és i(x,y) világítás szorzata állítja elő. Ebből jellemzően csak a reflexió hordoz értékes információt, azonban a hisztogram "tisztaságát" megzavarja a megvilágítás, ha nem egyenletes.

4. Optimális küszöb meghatározása kétmódusú hisztogramon Gauss eloszlás esetén

Lépései:

  • unimodális részek elnyomása
  • normális eloszlás közelítése
  • binarizálás

Vesszük a képnek tehát egy hisztogramját, ami két csúcsot tartalmaz: az egyik az objektumnak (előtér), a másik a háttérnek felel meg. Modellezzük ezek eloszlását Gauss-eloszlással! Így aztán bárhol húzzuk meg a határt, lesznek olyan esetek, amikor objektumot háttérnek vagy fordítva: hátteret objektumnak kategorizálunk, a gauss-ok ugyanis átlógnak egymásba. Célunk a félrekategorizálás összvalságének csökkentése.

Legyen a hisztogram p(z), ami az előtér és a háttér eloszlásának összegeként keletkezik:

[math] p(z) = P_f p_f(z) + P_b p_b(z) [/math]

ahol [math] P_f [/math] annak a valószínűsége, hogy egy pont az előtérbe tartozik, [math] P_b [/math] pedig azé, hogy a háttérbe. A kisbetűs p-k pedig az ezekhez tartozó sűrűségfüggvények:

[math] p_f(z) = \frac{1}{\sqrt{2 \pi} \sigma_f} e^{\frac{- (z - \mu_f)^2}{ 2 \sigma_f}} [/math]

ugyanígy a háttérre is.

Legyen T a küszöbértékünk úgy, hogy ez a két eloszlás átlaga, [math]\mu_f[/math] és [math] \mu_b[/math] között helyezkedjen el (és legyen az előtér átlaga nagyobb, mint a háttéré). Annak a valsége, hogy objektumot háttérnek kategorizálunk:

[math] P_{fn}(T) = \int_{\infty}^{T} p_b(z) dz [/math]

Mindez hasonlóan a másik esetre (false positive) is kiszámítható (ha pozitívnak az objektumot vesszük). Ha mindkét irányú hiba azonosan rossz, akkor az összvalséget akarjuk minimalizálni:

[math] \frac{d(P_{fn} + P_{fp})}{dT} = 0 [/math]

Ebből aztán ocsmány dolgok állhatnak elő, mindenesetre ha feltesszük, hogy háttérből ugyanannyi van, mint előtérből (azonosak a valségeik), akkor pont kijön, hogy az átlagok középértéke a jó.


5. Többváltozós (színes) képek küszöbözése, alkalmazási példák

???

6. Régióorientált szegmentálás matematikai modellje

  • [math]\bigcup_{\forall i}(R_{i}) = R[/math] => azaz a szegmentálás teljes
  • [math]R_{i}[/math] összefüggő minden i-re
  • minden i-re [math]P(R_{i})[/math] => azaz a régiók homogének (a homogenitási kritérium szempontjából)
  • minden [math]i \neq j[/math]-re [math]not(P(R_{i} U R_{j})[/math] => azaz régiók nem vonhatók össze

7. Régiónövelés módszere

Algoritmus-vázlat:

  • 0. Kitüntetett gyökérpont kiválasztása és hozzáadása a régióhoz
  • 1. A (még vizsgálatlan) szomszédos pontok vizsgálata a homogenitási kritérium segítségével
    • a. Ha teljesül a kiegészített régióban is a homogenitási kritérium� új pont felvétele a régióba
    • b. Ha nem teljesül --> pont eldobása
  • 2. Ha volt újonnan felvett pont --> rekurzív folytatás a 1. lépéstől

Ha minden pontot megvizsgáltunk, vagy nem tudtuk új ponttal kiegészíteni a régiót, akkor az adott régió elkészült.

Ha van még jelöletlen (egy régióhoz sem tartozó pont)  új gyökérpont választásával az algoritmus elölről kezdődik


8. Split and merge szegmentálás

Algoritmus vázlat:

  • 0. Init:� Kezdetben egy nagy régió
  • 1. Split: �Homogén a régió?
    • TRUE: A régió készen van
    • FALSE: A régiót felosztjuk 4 részre, majd rekurzíven az 1. lépés minden új régióra
  • 2. Merge: �Ha Ri és Rj szomszédos régió és (Ri U Rj) homogén, akkor a két régió összevonásra kerül


9. Nagyfrekvenciás tulajdonságokra épülő szegmentálás

  • Az objektumokat azért tudjuk megkülönböztetni a környezetétől, mert éles átmenet határolja őket
  • A régióorientált módszerek esetén a „kitöltő-algoritmus” nem tudott áthatolni ezeken az átmeneteken --> így keletkeztek a régiók
  • „Fordított hozzáállás” --> keressük meg közvetlenül ezeket a határátmeneteket és ebből következtessünk az objektumokra
  • Ezek az éles átmenetek: az élek


10. Hough transzformáció

  • Feladata: egyszerű formák keresése, mint egyenesek, körök, ellipszisek
  • Egyeneseket illeszt, nem szakaszokat
  • Előkészítő lépések:
    • Élkeresés
    • Binarizálás
    • Szűrés

Egyenesekre a legegyszerűbb: a (2D-s) képet egy "paramétertérbe" transzformáljuk, ahol minden pont az eredeti képen egy egyenesnek felel meg. A transzformált koordináták az egyenesek meredekségét (m) és eltolását (b) mérik. Ez a reprezentáció nem szerencsés függőlegest közelítő egyenesekhez, inkább például az irányszög (theta) és az origótól való távolság (r) paraméterek használandók.

A (binarizált) kép előterének egy pontja potenciálisan része lehet (végtelen) sok, rajta átmenő egyenesnek. Meghatározott darabszámú (pl. fokonként, összesen 360 darab) ilyen egyenes paramétereinek megfelelő pont (m és b, vagy r és theta) értékét növeljük a paramétertérben. Miután az összes előtérpont leszavazott, azok a legvalószínűbb egyenesek, amelyek paramétereire a legtöbb szavazat érkezett: hiszen a képen lévő 'valódi' egyenesek paramétereire optimális esetben minden ráeső pont szavazott.

Képpel, szépen elmagyarázva: Wikipédia cikk.


-- OBrien - 2009.03.24.