„Számítógépes látórendszerek - Ellenőrző kérdések: Mérések” változatai közötti eltérés

A lap jelenlegi, 2017. július 12., 14:09-kori változata

← Vissza az előző oldalra – Számítógépes látórendszerek

Tartalomjegyzék

1 Hogyan definiálhatjuk egy objektum pozícióját? Ismertesse a pozíciómérés lehetőségeit. Mutassa meg, hogy lehet a pozíció értékét meghatározni bináris és maszkolt szürkeárnyalatos képeken.
- 1.1 Tömegközéppont [math](x_c,y_c)[/math] meghatározása
  - 1.1.1 Bináris képekre
  - 1.1.2 Szürkeárnyalatos képekre
- 1.2 Geometriai középpont [math](x_g,y_g)[/math] meghatározása
  - 1.2.1 Meghatározás a befoglaló téglalap alapján
  - 1.2.2 Meghatározás a befoglaló kör alapján
2 Hogyan definiálhatjuk egy objektum orientációját? Sorolja fel az orientációmérés lehetőségeit, illetve röviden ismertesse ezek alapelvét.
3 Mit jelent az Euler szám? Mire használható? Adja meg a mellékelt ábra Euler számát.
4 Mit jelent a lánckód? Mire használható? Mi a különbség a 4-szomszádos és 8-szomszédos lánckód között? Mik az előnyei és a hátrányai az így ábrázolt objektumoknak? Hogyan tudunk segítségével kerület- és hossz-számítást végezni? Milyen problémák adódnak?
- 4.1 Kerület = kódhossz
5 Ismertessen szubpixeles eljárásokat. Hogyan tudunk pozíciót, kerületet, ill. területet mérni segítségükkel?
6 Ismertesse az egyenesekre vonatkozó Hough-transzformáció működését.

Hogyan definiálhatjuk egy objektum pozícióját?
Ismertesse a pozíciómérés lehetőségeit.
Mutassa meg, hogy lehet a pozíció értékét meghatározni bináris és maszkolt szürkeárnyalatos képeken.

Egy 2D-s képet ábrázolhatunk egy derékszögű koordinátarendszerben, ahol az egyes pixelekhez hozzárendelhetünk egy (x,y) egész koordinátapárt. A koordinátarendszer középpontja tetszőlegesen, feladattól függően megválasztható, de általában a bal felső sarokban lévő pixelhez rendeljük hozzá a (0,0)-t. Egy objektum pozíciója az objektum egy jellegzetes koordinátapárjával jellemezhető. Ez a koordinátapár lehet:

geometriai középpont – az objektumot befoglaló téglalap/kör középpontja

tömegközéppont

Tömegközéppont [math](x_c,y_c)[/math] meghatározása

A kép mérete: [math] M \cdot N [/math] pixel ([math]M[/math] az oszlopok száma, [math]N[/math] a soroké)

[math] p_x(x) = [/math] az [math] x[/math] koordinátájú oszlopban a vizsgált objektum pixeleinek száma
[math] p_y(y) = [/math] az [math]y[/math] koordinátájú sorban a vizsgált objektum pixeleinek száma

Bináris képekre

Hiba a bélyegkép létrehozásakor: Nem lehet a bélyegképet a célhelyre menteni

Szürkeárnyalatos képekre

[math]I(x,y) [/math]: intenzitásfüggvény

Hiba a bélyegkép létrehozásakor: Nem lehet a bélyegképet a célhelyre menteni

Geometriai középpont [math](x_g,y_g)[/math] meghatározása

Meghatározás a befoglaló téglalap alapján

[math] x_{min}, x_{max}, y_{min}, y_{max} [/math] : az objektum legszélső pixeleinek koordinátái

[math] x_g = \frac{x_{min} + x_{max}}{2} [/math] és [math] y_g = \frac{y_{min} + y_{max}}{2} [/math]

[math] (x_g, y_g) [/math] a téglalap középpontja, azaz a geometriai középpont.

Meghatározás a befoglaló kör alapján

egyértelmű, ha 3 ponton érinti a kört
kör átlójáig egyértelmű, ha 2 ponton érinti a kört.

Hogyan definiálhatjuk egy objektum orientációját?
Sorolja fel az orientációmérés lehetőségeit, illetve röviden ismertesse ezek alapelvét.

Objektum orientációján egy objektum egy olyan 1D-s jellemzését értjük, mely irány-, szöginformációkat szolgáltat az adott objektumról. Objektum orientációja megadható a

befoglaló téglalap arányaival és méreteivel
legnagyobb távolsággal az objektumon belül
középponttól vett legnagyobb távolsággal
rá illeszthető legkisebb nyomatékú tengellyel

Mit jelent az Euler szám?
Mire használható?
Adja meg a mellékelt ábra Euler számát.

Az Euler-szám egyike a topológiai tulajdonságoknak, melyek egy kép geometriai leírását segítik elő. Fontos része az ilyen tulajdonságoknak, hogy rubber-sheet jellegű transzormációkra invariáns. Az ilyen jellegű tulajdonságok jól használhatók formák keresésére, objektumok felismerésére, adatbázisbeli keresésre. Euler-szám fontos szerepet játszik például orvosi képfeldolgozásban, fertőzött sejtek felismerésében.

Euler-szám = (egybefüggő régiók száma) – (lyukak száma)

Mit jelent a lánckód? Mire használható?
Mi a különbség a 4-szomszádos és 8-szomszédos lánckód között? Mik az előnyei és a hátrányai az így ábrázolt objektumoknak?
Hogyan tudunk segítségével kerület- és hossz-számítást végezni? Milyen problémák adódnak?

A lánckód egy veszteségmentes tömörítési algoritmus bináris képekhez. Lánckód segítségével alakfelismerést, sarokdetektálást végezhetünk. (A kódból egyértelműen látszik, hol vannak pl.: dudorok, bemélyedések.) Az objektum egy szélső pixelétől elindulva szomszédos, határ menti pixelekre lépkedünk. Attól függően, hogy milyen irányba lépünk tovább a pixelhez egy számot rendelünk hozzá. Ez a számsorozat alkotja a lánckódot.

4-szomszédos: csak azok a pixelek számítanak szomszédosnak, amiknek van közös élük
8-szomszédos: közös él, vagy közös csúcs

4-szomszédos lánckód maximális hiba: 41% (45°-os átlós egyenes)
8-szomszédos lánckód maximális hiba: 7.9% (~18-27°-os átlós egyenes)

Kerület = kódhossz

Hossz számításnál kerül elő az a probléma, hogy négyzetes pixelek esetén egy átlós lépés valóságos hossza [math]sqrt(2)[/math] egység. 4-szomszédos lánckód 2 egység hosszúnak, míg a 8-szomszédos esetben 1 egység hosszúnak veszi alapból. Ha szükséges akkor ezt kompenzálni kell.

Hiba a bélyegkép létrehozásakor: Nem lehet a bélyegképet a célhelyre menteni

Forrás

Ismertessen szubpixeles eljárásokat. Hogyan tudunk pozíciót, kerületet, ill. területet mérni segítségükkel?

Interpoláció alapú eljárás, mely segítségével pixel alatti pontossággal illeszthetünk görbét egy objektumra. Megfelelő algoritmussal akár 0.1% pontosság is elérhető.

Eljárás szürkeárnyalatos képekhez

Szürkeárnyalatos képeket először is binarizáljuk.
Visszatérve az eredeti képhez (fekete-fehér kép alapján) az átmeneteknél lévő pixelekhez egy súlytényezőt (értéke lehet tört, megadja az interpoláció finomságát) rendelünk attól függően, hogy mennyire világos/sötét az adott pixel.
Megfelelő ablakozással (pl.: 2x2) végigpásztázzuk a határokat és súlyozásoknak megfelelően felbontjuk (kijelöljük a határpontot/határpontokat) a két szomszédos fekete-fehér pixel középpontját összekötő szakaszt.

Pozíciószámítás során a 3. lépésben meghatározott határpontok koordinátáit használjuk fel a képletekben. Kerület, területnél hasonlóan.

Ismertesse az egyenesekre vonatkozó Hough-transzformáció működését.

Hough-transzformáció

A Hough-transzformáció segítségével a képen általában az [math] f (x, y ; a_1 , a_2 ,…, a_n)=0 [/math] ahol [math] a_1, a_2,…, a_n [/math] paraméterekkel explicit alakban megadható görbéket keressük. A Hough-transzformáció alkalmazása célravezető, ha ismert alakú (és méretű) objektumokat keresünk a képen. Akkor is célszerű, ha az egyenesek részben takartak vagy zajosak.

Áttérés a Hough-térbe

Az input (kép)tér egy [math](x_i,y_i)[/math] pontjának az [math] r=x_i·\cosφ+y_i·\sinφ [/math] szinuszos görbe felel meg a Hough-térben. Az egy egyenesbe eső pontokhoz tartozó szinuszos görbék egy pontban metszik egymást.

Egyenesek meghatározása

Egy (él)pont a képtérben megfelel egy szinuszos görbének a Hough-térben.
Két pontnak két görbe felel meg.
Két (vagy több) ilyen görbe metszéspontja által reprezentált egyenesre ekkor kettő (vagy több) szavazat esett.
Az így kapott egyenes valamennyi rá szavazó ponton átmegy a képtérben.
A Hough-tér küszöbölésével megkapjuk a képtér egyeneseit.

Hiba a bélyegkép létrehozásakor: Nem lehet a bélyegképet a célhelyre menteni

@@ 1. sor: / 1. sor: @@
 {{Vissza|Számítógépes látórendszerek}}
-== Hogyan definiálhatjuk egy objektum pozícióját? Ismertesse a pozíciómérés lehetőségeit. Mutassa meg, hogy lehet a pozíció értékét meghatározni bináris és maszkolt szürkeárnyalatos képeken. ==
+== Hogyan definiálhatjuk egy objektum pozícióját? <br/> Ismertesse a pozíciómérés lehetőségeit.<br/> Mutassa meg, hogy lehet a pozíció értékét meghatározni bináris és maszkolt szürkeárnyalatos képeken. ==
 Egy 2D-s képet ábrázolhatunk egy derékszögű koordinátarendszerben, ahol az egyes pixelekhez hozzárendelhetünk egy (x,y) egész koordinátapárt. A koordinátarendszer középpontja tetszőlegesen, feladattól függően megválasztható, de általában a bal felső sarokban lévő pixelhez rendeljük hozzá a (0,0)-t.
 Egy objektum pozíciója az objektum egy jellegzetes koordinátapárjával jellemezhető.
 Ez a koordinátapár lehet:
 geometriai középpont – az objektumot befoglaló téglalap/kör középpontja
 tömegközéppont
 === Tömegközéppont <math>(x_c,y_c)</math> meghatározása ===
-A kép mérete: M ∙ N pixel
+A kép mérete: <math> M \cdot N </math> pixel (<math>M</math> az oszlopok száma, <math>N</math> a soroké)
-*<math> p_x(x) = </math>  az <math> x</math>  koordinátájú sorban a vizsgált objektum pixeleinek száma
+*<math> p_x(x) = </math>  az <math> x</math>  koordinátájú oszlopban a vizsgált objektum pixeleinek száma
-*<math> p_y(y) = </math>  az  <math>y</math>  koordinátájú oszlopban a vizsgált objektum pixeleinek száma
+*<math> p_y(y) = </math>  az  <math>y</math>  koordinátájú sorban a vizsgált objektum pixeleinek száma
 ==== Bináris képekre ====
+[[File:Számítógépes_látórendszerek_bináris_kép_1.jpg]]
 ==== Szürkeárnyalatos képekre ====
 <math>I(x,y) </math>: intenzitásfüggvény
+[[File:Számítógépes_látórendszerek_szürkeárnyalatos_kép_1.png]]
 === Geometriai középpont <math>(x_g,y_g)</math> meghatározása ===
+====Meghatározás a befoglaló téglalap alapján====
 <math> x_{min}, x_{max}, y_{min}, y_{max} </math> : az objektum legszélső pixeleinek koordinátái
-== Hogyan definiálhatjuk egy objektum orientációját? Sorolja fel az orientációmérés lehetőségeit, illetve röviden ismertesse ezek alapelvét. ==
+<math> x_g = \frac{x_{min} + x_{max}}{2} </math> és <math> y_g = \frac{y_{min} + y_{max}}{2} </math>
+<math> (x_g, y_g) </math> a téglalap középpontja, azaz a geometriai középpont.
+====Meghatározás a befoglaló kör alapján====
+* egyértelmű, ha 3 ponton érinti a kört
+* kör átlójáig egyértelmű, ha 2 ponton érinti a kört.
+== Hogyan definiálhatjuk egy objektum orientációját? <br/>Sorolja fel az orientációmérés lehetőségeit, illetve röviden ismertesse ezek alapelvét. ==
 Objektum orientációján egy objektum egy olyan 1D-s jellemzését értjük, mely irány-, szöginformációkat szolgáltat az adott objektumról.
 Objektum orientációja megadható a
@@ 26. sor: / 40. sor: @@
 *rá illeszthető legkisebb nyomatékú tengellyel
-== Mit jelent az Euler szám? Mire használható? Adja meg a mellékelt ábra Euler számát. ==
+== Mit jelent az Euler szám?<br/> Mire használható?<br/> Adja meg a mellékelt ábra Euler számát. ==
 Az Euler-szám egyike a topológiai tulajdonságoknak, melyek egy kép geometriai leírását segítik elő. Fontos része az ilyen tulajdonságoknak, hogy rubber-sheet jellegű transzormációkra invariáns.
 Az ilyen jellegű tulajdonságok jól használhatók formák keresésére, objektumok felismerésére, adatbázisbeli keresésre.
 Euler-szám fontos szerepet játszik például orvosi képfeldolgozásban, fertőzött sejtek felismerésében.
-<math> Euler-szám = (egybefüggő régiók száma) – (lyukak száma)</math>
+'''Euler-szám = (egybefüggő régiók száma) – (lyukak száma)'''
-== Mit jelent a lánckód? Mire használható? Mi a különbség a 4-szomszádos és 8-szomszédos lánckód között? Mik az előnyei és a hátrányai az így ábrázolt objektumoknak? Hogyan tudunk segítségével kerület- és hossz-számítást végezni? Milyen problémák adódnak? ==
+[[File:Számítógépes látórendszerek Euler-szám példa.png|600px]]
+== Mit jelent a lánckód? Mire használható?<br/> Mi a különbség a 4-szomszádos és 8-szomszédos lánckód között? Mik az előnyei és a hátrányai az így ábrázolt objektumoknak?<br/> Hogyan tudunk segítségével kerület- és hossz-számítást végezni? Milyen problémák adódnak? ==
 A lánckód egy veszteségmentes tömörítési algoritmus bináris képekhez. Lánckód segítségével alakfelismerést, sarokdetektálást végezhetünk. (A kódból egyértelműen látszik, hol vannak pl.: dudorok, bemélyedések.)
 Az objektum egy szélső pixelétől elindulva szomszédos, határ menti pixelekre lépkedünk. Attól függően, hogy milyen irányba lépünk tovább a pixelhez egy számot rendelünk hozzá. Ez a számsorozat alkotja a lánckódot.
@@ 43. sor: / 59. sor: @@
 === Kerület = kódhossz ===
-Hossz számításnál kerül elő az a probléma, hogy négyzetes pixelek esetén egy átlós lépés valóságos hossza sqrt(2) egység. 4-szomszédos lánckód 2 egység hosszúnak, míg a 8-szomszédos esetben 1 egység hosszúnak veszi alapból.  Ha szükséges akkor ezt kompenzálni kell.
+Hossz számításnál kerül elő az a probléma, hogy négyzetes pixelek esetén egy átlós lépés valóságos hossza <math>sqrt(2)</math> egység. 4-szomszédos lánckód 2 egység hosszúnak, míg a 8-szomszédos esetben 1 egység hosszúnak veszi alapból.  Ha szükséges akkor ezt kompenzálni kell.
+[[File:Számítógépes_látórendszerek_lánckód_1.jpg]]
+[http://cs.haifa.ac.il/hagit/courses/ip/Lectures/Ip13_Binary.pdf Forrás]
 == Ismertessen szubpixeles eljárásokat. Hogyan tudunk pozíciót, kerületet, ill. területet mérni segítségükkel? ==
 Interpoláció alapú eljárás, mely segítségével pixel alatti pontossággal illeszthetünk görbét egy objektumra.
-Megfelelő algoritmussal akár 0.1% pontosság is elérhető
+Megfelelő algoritmussal akár 0.1% pontosság is elérhető. <br/><br/>
-=== Eljárás szürkeárnyalatos képekhez ===
+''' Eljárás szürkeárnyalatos képekhez '''
 #Szürkeárnyalatos képeket először is binarizáljuk.
 #Visszatérve az eredeti képhez (fekete-fehér kép alapján) az átmeneteknél lévő pixelekhez egy súlytényezőt (értéke lehet tört, megadja az interpoláció finomságát) rendelünk attól függően, hogy mennyire világos/sötét az adott pixel.
@@ 55. sor: / 75. sor: @@
 Pozíciószámítás során a 3. lépésben meghatározott határpontok koordinátáit használjuk fel a képletekben.
 Kerület, területnél hasonlóan.
 == Ismertesse az egyenesekre vonatkozó Hough-transzformáció működését. ==
 === Hough-transzformáció ===
 A Hough-transzformáció segítségével a képen általában az
-<math> f (x, y ; a_1 , a_2 ,…, a_n)=0 </math> <br/>
+<math> f (x, y ; a_1 , a_2 ,…, a_n)=0 </math> ahol
-<math> a_1, a_2,…, a_n </math> <br/>
+<math> a_1, a_2,…, a_n </math>
 paraméterekkel explicit alakban megadható görbéket keressük.
 A Hough-transzformáció alkalmazása célravezető, ha ismert alakú (és méretű) objektumokat keresünk a képen.
 Akkor is célszerű, ha az egyenesek részben takartak vagy zajosak.
 === Áttérés a Hough-térbe ===
@@ 76. sor: / 97. sor: @@
 *Az így kapott egyenes valamennyi rá szavazó ponton átmegy a képtérben.
 *A Hough-tér küszöbölésével megkapjuk a képtér egyeneseit.
+[[File:Számítógépes_látórendszerek_egyenes_1.jpg]]

„Számítógépes látórendszerek - Ellenőrző kérdések: Mérések” változatai közötti eltérés

A lap jelenlegi, 2017. július 12., 14:09-kori változata

Tartalomjegyzék

Hogyan definiálhatjuk egy objektum pozícióját?
Ismertesse a pozíciómérés lehetőségeit.
Mutassa meg, hogy lehet a pozíció értékét meghatározni bináris és maszkolt szürkeárnyalatos képeken.

Tömegközéppont [math](x_c,y_c)[/math] meghatározása

Bináris képekre

Szürkeárnyalatos képekre

Geometriai középpont [math](x_g,y_g)[/math] meghatározása

Meghatározás a befoglaló téglalap alapján

Meghatározás a befoglaló kör alapján

Hogyan definiálhatjuk egy objektum orientációját?
Sorolja fel az orientációmérés lehetőségeit, illetve röviden ismertesse ezek alapelvét.

Mit jelent az Euler szám?
Mire használható?
Adja meg a mellékelt ábra Euler számát.

Mit jelent a lánckód? Mire használható?
Mi a különbség a 4-szomszádos és 8-szomszédos lánckód között? Mik az előnyei és a hátrányai az így ábrázolt objektumoknak?
Hogyan tudunk segítségével kerület- és hossz-számítást végezni? Milyen problémák adódnak?

Kerület = kódhossz

Ismertessen szubpixeles eljárásokat. Hogyan tudunk pozíciót, kerületet, ill. területet mérni segítségükkel?

Ismertesse az egyenesekre vonatkozó Hough-transzformáció működését.

Hough-transzformáció

Áttérés a Hough-térbe

Egyenesek meghatározása

Navigációs menü

Személyes eszközök

Névterek

Változatok

Nézetek

Több

Keresés

Navigáció

Egyetem

Eszközök