Számítógépes látórendszerek - Ellenőrző kérdések: Bináris képek

A VIK Wikiből
A lap korábbi változatát látod, amilyen Horváth Gábor (vitalap | szerkesztései) 2015. április 14., 19:03-kor történt szerkesztése után volt. (/* Mit jelent az erózió és a dilatáció? Hogyan végzünk nyitást és zárást? Mire jók ezek a műveletek, mitől függ, hogy melyiket alkalmazzuk? Hogyan tudunk e műveletekkel kontúrt keresni? Mi az olvasztásmentes dilatáció? Szürke…)
Ugrás a navigációhoz Ugrás a kereséshez
← Vissza az előző oldalra – Számítógépes látórendszerek

Mit jelent a bináris kép? Mit jelent a küszöbözés? Milyen lehetőségeink vannak? Mit jelent a dupla-küszöbözés?

Bináris kép

Minden pixel csak két értéket vehet fel (megjelenítés tipikusan fekete/fehér színnel). A pixelekhez hozzárendelendő értéket valamilyen képi tulajdonság (fényerő, színintenzitás stb.) küszöbözésével határozzuk meg.

Küszöbözés (thresholding)

A legegyszerűbb eljárás, aminek segítségével egy szegmentálást (objektum(ok) és a háttér szétválasztása) végezhetünk. Egy tulajdonsághoz hozzárendelünk küszöbértéket, majd a vizsgálandó kép minden pixelén végigmegyünk és összehasonlítjuk az értékeket. A végeredmény egy bináris kép.

Hisztogram

Hisztogram egy kép egy adott tulajdonságáról (előfordulás: az adott értékkel ennyi számú pixel rendelkezett):

Hiba a bélyegkép létrehozásakor: Nem lehet a bélyegképet a célhelyre menteni

Szegmentálási lehetőségek

  • Hisztogram alapú KÜSZÖBÖZÉS
  • Osztályozás alapú
    • Színek
    • Formák: pl.:egyenes, gömb
  • Környezetfüggő
    • Lokális: inhomogén háttér esetén

Dupla-küszöbözés

Más néven hiszterézises küszöbözés. A probléma az, hogy elkülönítendő objektumok mellett más hasonló (kinézetű, színű stb) objektumok is vannak, melyek küszöbözés után megmaradnak. Ezért kettő küszöb használatával létrehozunk két képet, melyet aztán ÉS kapcsolatba helyezünk.
Példa

  1. Eredeti kép
  2. Eredeti kép küszöbözése
  3. Eredeti képen élkeresés
  4. Élkeresett kép küszöbözése
  5. „4” maszkolása „2”-vel
Hiba a bélyegkép létrehozásakor: Nem lehet a bélyegképet a célhelyre menteni

Ismertesse a bináris képen végezhető logikai műveleteket és azok fontosabb feladatait. Ismertesse az objektum alapú logikát és felhasználási lehetőségeit.

Adott két kép: A, B

  • Negálás: például kontúrkeresésnél
  • AND: főleg képek maszkolásánál van jelentősége, két kép átfedésének megjelenítése
  • OR:
  • XOR:

Fájl:Számítógépes látórendszerek - Ellenőrző kérdések: Logika 1.jpg

Mit jelent az erózió és a dilatáció? Hogyan végzünk nyitást és zárást? Mire jók ezek a műveletek, mitől függ, hogy melyiket alkalmazzuk? Hogyan tudunk e műveletekkel kontúrt keresni? Mi az olvasztásmentes dilatáció? Szürkeárnyalatos képen hogy lehet értelmezni ezeket a műveleteket?

Erózió

Csökkentés (fehér területek csökkentése fekete-fehér átmeneteknél)

Dilatáció

Szélesítés (fehér területek növelése fekete-fehér átmeneteknél) A változás mértéke függ a felhasznált kernel nagyságától. Nagy számításigény.

Példa: 1D-s eset

Hiba a bélyegkép létrehozásakor: Nem lehet a bélyegképet a célhelyre menteni

Nyitás

Dilatáció + erózió: nullzajok kiszedése (fekete pöttyök, fekete vonalak)

Zárás

Erózió + dilatáció: fehér pixelhibák kiszedésére (Gyakran együtt használják a kettőt.)

Felhasználás

  • pixelhibák, pixelszerű zajok eltüntetése bináris képről
  • kontúrkeresés: Img AND INVERSE( dilate(Img) )
  • élkeresés és lyukak kitöltése

Olvasztásmentes dilatáció

Egymással érintkező objektumok éldetektálásánál segít ez a módszer.
Fájl:Számítógépes látórendszerek - Ellenőrző kérdések: Olvasztasmentes Dil 1.jpg
Szürkeárnyalatos képen: erózió – sötétít, dilatáció - világosít

Mit jelent a 4- és 8-szomszédú távolság? Mik az előnyei és hátrányai az euklideszi távolsághoz képest?

Kernelek esetén a kernel középpontjától a pixelekben mért távolság a szélek felé haladva.

Fájl:Számítógépes látórendszerek - Ellenőrző kérdések: 4 8 szomszed 1.jpg

  • 4/8 szomszéd: gyors, pontatlan
  • EDM: pontos, számításigényesebb

Ismertesse a csontváz definícióját és a csontvázasítás egy lehetséges megvalósítását.

Definíció: Maximális körök origója mely egy adott objektumba helyezhető.

Fájl:Számítógépes látórendszerek - Ellenőrző kérdések: csontvaz 1.jpg

Megvalósítás:

Fájl:Számítógépes látórendszerek - Ellenőrző kérdések: csontvaz 2.jpg

Felhasználás: ujjlenyomat ellenőrzés

Hogyan tudunk bináris képen objektumokat keresni és megszámlálni? Ismertesse az eljárásokat.

Objektumkeresés: Egy 2x2-es ablakkal végigpásztázunk minden pixelt és indexeljük az egyes pixeleket.

Fájl:Számítógépes látórendszerek - Ellenőrző kérdések: szamlal 1.jpg

Objektumszámlálás: Egy 2x2-es ablakkal végigpásztázunk minden pixelt és növeljük, vagy csökkentjük (hogy az algoritmus ne számoljon egy objektumot többször) a számlálónk értékét.

Fájl:Számítógépes látórendszerek - Ellenőrző kérdések: szamlal 2.jpg