ZH felkészítést segítő kvíz

A VIK Wikiből
A lap korábbi változatát látod, amilyen Csia Klaudia Kitti (vitalap | szerkesztései) 2022. december 15., 11:16-kor történt szerkesztése után volt. (Javítás.)
Ugrás a navigációhoz Ugrás a kereséshez
← Vissza az előző oldalra – Beszéd-információs_rendszerek

Ez a kvíz a ZH felkészülést segíti elő, tanulást viszont nem helyettesít. A kérdések javarészt, általam kitaláltak, gyakorlatból kiszedették vagy épp KZH kérdések. Amelyik kérdés végén (*) van, annak a válasza nem 100%, hogy helyes. Jó felkészülést kívánok!


ZH felkészítő
Statisztika
Átlagteljesítmény
-
Eddigi kérdések
0
Kapott pontok
0
Alapbeállított pontozás
(-)
-
Beállítások
Minden kérdés látszik
-
Véletlenszerű sorrend
-
-


Tartalomjegyzék

A felharmonikusok és az alapfrekvencia között milyen összefüggés van?

Típus: egy. Válasz: 2. Pontozás: -.

  1. Az alapfrekvenciát a felharmonikusokkal maradék nélkül tudjuk osztani.
  2. A felharmonikusok az alapfrekvencia egész számú többszörösei.
  3. A felharmonikusok az alapfrekvenciának mindig a kétszerese.
  4. Az alapfrekvencia (mely 100 vagy 200 Hz), 3-mal szorozva kapjuk meg az első felharmonikust.

A súrlódási zörej időtartama szerint hallott hangok alapján egy zárhang:

Típus: egy. Válasz: 1. Pontozás: -.

  1. t < 50 ms
  2. t = 50 ms
  3. 50 < t < 100 ms
  4. 100 ms < t

A súrlódási zörej időtartama szerint hallott hangok alapján egy affrikáta:

Típus: egy. Válasz: 3. Pontozás: -.

  1. t < 50 ms
  2. t = 50 ms
  3. 50 < t < 100 ms
  4. 100 ms < t

A súrlódási zörej időtartama szerint hallott hangok alapján egy réshang:

Típus: egy. Válasz: 4. Pontozás: -.

  1. t < 50 ms
  2. t = 50 ms
  3. 50 < t < 100 ms
  4. 100 ms < t

Igaz vagy hamis? A szegmentálás a kérdéses részek elkülönítése jelzésekkel/eseményhatárokkal a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik.

Típus: egy. Válasz: 1. Pontozás: -.

  1. Igaz
  2. Hamis

Az annotálás...

Típus: egy. Válasz: 2. Pontozás: -.

  1. a hangfelvétel tartalmával kapcsolatos általános információkat adunk meg, melyeket egy fix gyűjtési szempont szerinti hanganyag tartalmaz.
  2. a hangfelvétel tartalmával kapcsolatos általános információkat adunk meg, melyeket egy címkefájl tartalmaz.
  3. a kérdéses részek elkülönítése jelzésekkel/eseményhatárokkal a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik.
  4. a kérdéses részek összekapcsolása jelzésekkel a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik.

Átalpolódásmentesítő szűrő nélkül 10 kHz-en mintavételezve a beszédjelet, majd a 4,5 kHz-es aluláteresztővel visszaállítva...

Típus: egy. Válasz: 4. Pontozás: -.

  1. 9 kHz körüli beszédkomponens biztosan kiszűrthető.
  2. átlapolódást (aliasing) kivédtük.
  3. a hangminőség a telefonosnál biztosan jobb lesz.
  4. többnyire érthető, de zajos lesz a jel.
  5. biztosan érthetetlen, használhatatlan lesz a kimenet.

A kvantálás(t)...

Típus: egy. Válasz: 2. Pontozás: -.

  1. lépésköze függ a mintavételi frekvenciától.
  2. lépésköze nem függ a mintavételi frekvenciától.
  3. veszteségmentesen visszaállítható.
  4. lépésköze nem befolyásolja a hangminőséget.
  5. csak egyenletes közökkel használják beszédre.
  6. függ a beszéd alapfrekvenciájától.

Melyik mai módszerhez áll legközelebb a Kempelen Farkas beszédkeltő gépe?

Típus: egy. Válasz: 3. Pontozás: -.

  1. Korpusz alapú elem összefűzős rendszer.
  2. Diád építőelemes beszédszintetizáló rendszer.
  3. Formás szintézis.
  4. Beszéddetektáló rendszer.

Melyik mai módszerhez áll legközelebb a Bánó Miklós tetszőleges szöveg reprodukálására alkalmas beszélőgépe?

Típus: egy. Válasz: 2. Pontozás: -.

  1. Korpusz alapú elem összefűzős rendszer.
  2. Diád építőelemes beszédszintetizáló rendszer.
  3. Formás szintézis.
  4. Beszédhang adaptáló rendszer (HMM alapú adaptálásos TTS).

Melyik módszert alkalmazná egy kellemes női hang pályaudvaron használandó utastájékoztató rendszerhez?

Típus: egy. Válasz: 1. Pontozás: -.

  1. Korpusz alapú elem összefűzős rendszer.
  2. Diád építőelemes beszédszintetizáló rendszer.
  3. Formás szintézis.
  4. Beszéddetektáló rendszer.

Mik a jellemzők a Korpusz alapú elem összefűzős rendszerre?

Típus: több. Válasz: 1,2,3. Pontozás: -.

  1. Szép, természetes hangzás.
  2. Biztosítja a hanszínezet megtartását új hanfelvételnél.
  3. Nagy szakértelmet kíván mind az elkészítéshez, mind a működtetéshez.
  4. Minden hangkapcsolódást jó akusztikai formában elő tud állítani.

Melyik módszert alkalmazná egy jó minőségű gépi hang előállításához, ha kevés hanganyag áll rendelkezésre, korábbi bemondó meg nem elérhető, továbbfejlesztett rendszernek hasonló hangúnak kell lennie?

Típus: egy. Válasz: 4. Pontozás: -.

  1. Korpusz alapú elem összefűzős rendszer.
  2. Diád építőelemes beszédszintetizáló rendszer.
  3. Formás szintézis.
  4. Beszédhang adaptáló rendszer (HMM alapú adaptálásos TTS).

Mik a jellemzők a HMM alapú beszédhang adaptálásos TTS rendszerre?

Típus: több. Válasz: 3,4. Pontozás: -.

  1. Szép, természetes hangzás.
  2. Biztosítja a hanszínezet megtartását új hanfelvételnél.
  3. Nagy szakértelmet kíván mind az elkészítéshez, mind a működtetéshez.
  4. Minden hangkapcsolódást jó akusztikai formában elő tud állítani.

Adja meg egy beszédadatbázis elkészítési műveletsorának lépéseit Korpuszos beszédszintetizátorhoz!

Típus: több. Válasz: 1,2,4. Pontozás: -.

  1. Szöveg gyűjtése.
  2. Hang felvétele mester mondattal.
  3. Szótagokra vágás.
  4. Fonetikai átirat és hanghatár bejelölése minden mondatra.

Mi hangnyomás mértékegysége?

Típus: egy. Válasz: 2. Pontozás: -.

  1. W/m2
  2. N/m2
  3. m/s2
  4. Mértékegység nélküli.

Mi az akusztikai dB mértékegysége?

Típus: egy. Válasz: 4. Pontozás: -.

  1. W/m2
  2. N/m2
  3. m/s2
  4. Mértékegység nélküli.

Melyik nem játszik közvetlen szerepet a hallásban?

Típus: egy. Válasz: 3. Pontozás: -.

  1. Eustach-kürt
  2. Kalapács
  3. Patkó
  4. Dobhártya

Melyik nem játszik közvetlen szerepet a hallásban?

Típus: egy. Válasz: 3. Pontozás: -.

  1. Eustach-kürt
  2. Kalapács
  3. Kasza
  4. Üllő

Egy 60 dB intenzitású hangforrást megkettőzünk. Mennyi lesz az eredő intenzitás?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 120 dB
  2. 63 dB
  3. 60 dB
  4. 90 dB

Egy beszédhullám nyomás-amplitúdóját felezzük. Ez dB-ben mennyi növekedést jelent?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 6 dB
  2. -6 dB
  3. 3 dB
  4. -3 dB

Hogy hívják az egyenlő hangosság érzetű görbét?

Típus: egy. Válasz: 1. Pontozás: -.

  1. phon
  2. phön
  3. schön
  4. decibel

Melyik szinusz jelnek a legnagyobb az intenzitása?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 40 Hz-es 45 dB
  2. 1 kHz-es 50 dB
  3. 2 kHz-es 49 dB
  4. 10 kHz-es 51 dB

Melyik szinusz jelnek legkisebb az intenzitása?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 40 Hz-es 45 dB
  2. 1 kHz-es 50 dB
  3. 2 kHz-es 49 dB
  4. 10 kHz-es 51 dB

Melyik szinusz jelet halljuk a leghangosabbnak?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 40 Hz-es 45 dB
  2. 1 kHz-es 50 dB
  3. 2 kHz-es 49 dB
  4. 10 kHz-es 51 dB

Egy 60 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás?

Típus: egy. Válasz: 1. Pontozás: -.

  1. Normál beszéd 1 m-ről.
  2. Sugárhajtású gép hajtóműve 5 m-ről.
  3. Haladó kamion 2 m-ről.
  4. Papírlap susogása 1 m-ről.

Hogyan nevezzük a hangszalagok rezgése által keltett, a gégefőben létrejövő gerjesztőjelet?

Típus: egy. Válasz: 1. Pontozás: -.

  1. Zönge
  2. Zengő
  3. Vokál
  4. Spektrál

Milyen típusú spektrumot figyelhetünk meg zöngés gerjesztésű hangok esetén?

Típus: egy. Válasz: 2. Pontozás: -.

  1. Folytonos
  2. Vonalas
  3. Elkent
  4. Felkent

Hogyan nevezzük a zöngés jel spektruma burkolójának csúcsait?

Típus: egy. Válasz: 3. Pontozás: -.

  1. Felharmonikus
  2. Alapfrekvencia
  3. Formáns
  4. Oktáv

Hogy viszonyulnak a formánsok középfrekvenciái a zöngeképzés során létrejövő alapfrekvenciákhoz?

Típus: egy. Válasz: 2. Pontozás: -.

  1. Személyfüggő kapcsolat van.
  2. Függetlenek tőle.
  3. Az alapfrekvencia egészszámú többszöröseinél vannak.
  4. Az alapfrekvencia páratlan egészszámú többszöröseinél vannak.

Miben tér el a 'b' hang a 'p' hang akusztikai megjelenésétől?

Típus: egy. Válasz: 1. Pontozás: -.

  1. A 'p' zöngétlen hang, a 'b' zöngés.
  2. Csak a ’p’-nek vannak zajkomponensei.
  3. A ’b’ időben összetett szerkezetű, a ’p’ nem.
  4. Csak a zajkomponensek frekvenciahelyei térnek el.

A felharmonikusok definíció szerint…

Típus: egy. Válasz: 2. Pontozás: -.

  1. megegyeznek a formánsok középfrekvenciáival.
  2. az alapfrekvencia egész számú többszörösei.
  3. a rezonátorüreg által felerősített felhangnyalábok.
  4. az alapfrekvencia páratlan, egészszámú többszörösei.

Az alábbiak közül melyik segít a beszédhangok határainak jelölésében?

Típus: egy. Válasz: 4. Pontozás: -.

  1. Spektogram.
  2. Intenzitás-idő függvény.
  3. Felvétel meghallgatása.
  4. Mindegyik segít benne.

Melyiket használjuk az alábbiak közül betű-hang átalakításra?

Típus: egy. Válasz: 2. Pontozás: -.

  1. PAMPA
  2. SAMPA
  3. PUMPA
  4. SAMBA

Az alábbi hangok közül melyiknél fordul elő fojtott zönge képzése?

Típus: egy. Válasz: 4. Pontozás: -.

  1. sz
  2. k
  3. t
  4. d

Az alábbi fogalompárok közül melyik kapcsolható közvetlenül beszédadatbázisok feldolgozásához?

Típus: egy. Válasz: 1. Pontozás: -.

  1. Annotálás és szegmentálás.
  2. Szupraszegmentálás és koartikuláció.
  3. Koartikuláció és annotálás.
  4. Egyik sem.

Egy beszédszintetizáló rendszerhez milyen adatbázist érdemes használni?

Típus: egy. Válasz: 1. Pontozás: -.

  1. Profi bemondó, változatos hanganyag.
  2. Több beszélő, szavak felolvasása.
  3. Egy bemondó, egy hang kitartása.
  4. Egyik sem.

A formáns paramétereket milyen modell alapján lehet beszédszintézisre használni?

Típus: egy. Válasz: 1. Pontozás: -.

  1. Forrás-szűrő.
  2. Jel-szűrő.
  3. Frekvencia-szűrő.
  4. Intenzitás-szűrő.

A “sás” szót kiejtve milyen rész található a beszédjelben?

Típus: egy. Válasz: 3. Pontozás: -.

  1. Pergő rész
  2. Nazális
  3. Zöngés rész
  4. Zöngés zárhang

A “hasát” szóban milyen hang található?

Típus: egy. Válasz: 3. Pontozás: -.

  1. Pergő rész
  2. Nazális
  3. Réshang
  4. Zöngés zárhang

Mi igaz az F0, F1, F2 értékekre?

Típus: egy. Válasz: 1. Pontozás: -.

  1. F1 és F2 gyakorlatilag független F0-tól.
  2. F1 kétszerese az F0 értéknek. F2 háromszorosa F0 értékének.
  3. F0-t Hz-ben, F1-et és F2-őt meg dB-ben mérjük.
  4. F0 a nulladik formáns, F1 az első, F2 pedig a második.

Mi történik tipikusan egy kijelentő mondat végén lévő zöngés hanggal?

Típus: egy. Válasz: 1. Pontozás: -.

  1. Alapfrekvenciája alacsonyabb lesz, mint a mondat kezdetén.
  2. Alapfrekvenciája magasabb lesz, mint a mondat kezdetén.
  3. A zöngés hang zöngétlenedik.
  4. A zöngés hang felhangosodik.

Hogyan változik meg egy felpattanó zárhang nyújtáskor?

Típus: egy. Válasz: 3. Pontozás: -.

  1. Az energiája megnő.
  2. Megismétlődik a felpattanó rész.
  3. Zárrész megnyúlik.
  4. Megnő az alapfrekvenciája.

Miben különbözik egy mondat kiejtése, ha kérdőjel van a végén, vagy ha pont?

Típus: egy. Válasz: 2. Pontozás: -.

  1. Más lesz a felharmonikusok menete a mondat közepén.
  2. Más az alapfrekvencia menete.
  3. Változatlan marad.
  4. Formánsok megváltoznak.

Melyik hangnak a legmagasabb az F2 értéke?

Típus: egy. Válasz: 1. Pontozás: -.

  1. i
  2. a
  3. u
  4. e

A „Hajókázunk?” kérdő mondat melyik hangjában a legmagasabb az alapfrekvencia?

Típus: egy. Válasz: 1. Pontozás: -.

  1. á
  2. Záró „k”
  3. u
  4. a

Férfi bemondás esetén mennyi lehet az utolsó magánhangzó alapfrekvenciája: „Holnap érkezem.”

Típus: egy. Válasz: 4. Pontozás: -.

  1. 10 Hz
  2. 100 Hz
  3. 20 Hz
  4. 70 Hz

A „baba” szóból hogyan lehet hangsebészettel papa szót készíteni?

Típus: egy. Válasz: 3. Pontozás: -.

  1. A b felpattanás elé szünetet kell beiktatni.
  2. A zöngés zár + a felpattanás részt is cserélni kell egy másik minta alapján.
  3. A b előtti zár szakaszt csendre kell cserélni.
  4. Nem megvalósítható.

Egy 3 kHz-es szinuszt szűrés nélkül mintavételezünk 5 kHz-en. Mi lesz a mintavételezett jel?

Típus: egy. Válasz: 3. Pontozás: -.

  1. 0,5 kHz-es szinuszjel.
  2. 2 kHz-es szinuszjel.
  3. 3 kHz-es szinuszjel.
  4. 1 kHz-es szinuszjel.

Egy 3,1 kHz-es szinuszt anti-alias szűrés nélkül mintavételezünk 4,8 kHz-en. A kimeneten 100-3400 Hz sávszűrő. Mi lesz a kimenő jel?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 3,1 kHz-es szinuszjel.
  2. 1,7 kHz-es szinuszjel.
  3. 3 kHz-es szinuszjel.
  4. 1,7 és 3,1 kHz-es szinuszjel.

Milyen aluláteresztő szűrő és mintavételi frekvencia kell a “sóstó” szó torzításmentes átviteléhez?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 5 kHz-es ideális szűrő, 9 kHz-es mintavételi frekvencia.
  2. 9 kHz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.
  3. 18 kHz-es ideális szűrő, 9 kHz-es mintavételi frekvencia.
  4. 9 kHz-es ideális szűrő, 4.5 kHz-es mintavételi frekvencia.

Milyen sáváteresztő szűrő és mintavételi frekvencia kell a „hószóró” szó kiváló minőségű átviteléhez férfi bemondásnál?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 10 – 10 000 Hz-es ideális szűrő, 10 kHz-es mintavételi frekvencia.
  2. 9 – 9 000 Hz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.
  3. 50 – 50 000 Hz-es ideális szűrő, 10 kHz-es mintavételi frekvencia.
  4. 0,9 – 90 00 Hz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.

Milyen mintavételi frekvencia kell a „szekerce” szóhoz, hogy a szó hangjai jól érthető legyenek?

Típus: egy. Válasz: 1. Pontozás: -.

  1. 16 kHz
  2. 8 kHz
  3. 1 kHz
  4. 2 kHz

Egy másodpercnyi beszéd mennyi helyet foglal 44 kHz, 16 bites tömörítetlen tárolás esetén?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 88 Byte
  2. 44 kByte
  3. 176 kByte
  4. 88 kByte

Egy másodpercnyi beszéd mennyi helyet foglal 44 kHz, 23 bites tömörítetlen tárolás esetén?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 88 Byte
  2. 44 kByte
  3. 88 kByte
  4. 132 kByte

Hány bites a lineáris kvantáló, ha a max kivezérlésű jel és a kvantálási zaj viszonya 72 dB?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 8 bites
  2. 12 bites
  3. 4 bites
  4. 16 bites

Hány bites a lineáris kvantáló, ha a max kivezérlésű jel és a kvantálási zaj viszonya 48 dB?

Típus: egy. Válasz: 1. Pontozás: -.

  1. 8 bites
  2. 12 bites
  3. 4 bites
  4. 16 bites

Mi idézhet elő átlapolódást (aliasing) a digitálisan feldolgozott beszédjelben?

Típus: egy. Válasz: 1. Pontozás: -.

  1. A jel tulajdonságaihoz képest alacsony mintavételi frekvencia.
  2. A jel tulajdonságaihoz képest alacsony bitmélységű kvantálás.
  3. Lineáris predikciós kódolás.
  4. Erős háttérzaj a beszéd felvétele közben.

Mi idézhet elő átlapolódást (aliasing) a digitálisan feldolgozott beszédjelben?

Típus: egy. Válasz: 4. Pontozás: -.

  1. A jel tulajdonságaihoz képest túl magas mintavételi frekvencia.
  2. A jel tulajdonságaihoz képest alacsony bitmélységű kvantálás.
  3. Lineáris predikciós kódolás.
  4. A bemeneti aluláteresztő szűrő hiánya.

Minimum hány fajta paraméter kell egy formáns alapú beszédszintetizátor vezérléséhez?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 32
  2. 20
  3. 3
  4. 7

Hány fajta diád kellhet egy magyar nyelvű gépi szövegfelolvasó működtetéséhez?

Típus: egy. Válasz: 1. Pontozás: -.

  1. 1600
  2. 10 000
  3. 256
  4. 64

Hány fajta diád kellhet egy magyar nyelvű gépi szövegfelolvasó működtetéséhez?

Típus: egy. Válasz: 3. Pontozás: -.

  1. 39 * 39 * 39
  2. 25 + 14
  3. 39 * 39
  4. 25 * 25 * 14 + 25 * 25

Melyik TTS technológia használ beszédkódolót a szintetizált hullámforma előállításához?

Típus: egy. Válasz: 1. Pontozás: -.

  1. HMM statisztikai TTS.
  2. WaveNet TTS.
  3. Kempelen gépe.
  4. Diád alapú hullámforma.

Hány hullámforma elemmel készíthető ember szerű gépi számfelolvasó 1 milliárdig?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 1000
  2. 9
  3. 25
  4. 250

Hány hullámforma elemmel készíthető ember szerű gépi telefonszám-felolvasó magyar nyelvre? pl: +36-30-123-4567?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 1000
  2. 9
  3. 25
  4. 250

Milyen elvű TTS-ben működik jellemzően szabály alapú prozódia megvalósítás?

Típus: egy. Válasz: 2. Pontozás: -.

  1. HMM alapú statisztikai parametrikus TTS.
  2. Diád alapú hullámforma összefűzéses TTS.
  3. LPC alapú TTS.
  4. Kempelen beszélő gépe.

Milyen alapon tervezzük meg a prozódiai modellt egy kötött szótáras beszédszintetizátornál?

Típus: egy. Válasz: 3. Pontozás: -.

  1. Jel-idő függvény alapon.
  2. LPC alapú TTS-en.
  3. Időtengely alapon.
  4. Frekvencia-jel függvény alapon.

Mennyi a magyar magánhangzók formánsainak jellemző frekvencia tartománya?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 20 – 20 000 Hz
  2. 30 – 3400 Hz
  3. 6000 – 10 000 Hz
  4. 300 – 4000 Hz
  5. 1000 – 7000 Hz

Legalább hány beszédhangot definiáljunk egy magyar diádos szövegfelolvasó fejlesztéséhez?

Típus: egy. Válasz: 3. Pontozás: -.

  1. 168
  2. 10
  3. 40
  4. 2

Számfelolvasóhoz hány elemet készítünk, ha 1 milliárdig kell bármilyen számot felolvasni?

Típus: egy. Válasz: 3. Pontozás: -.

  1. 180
  2. 200
  3. 256
  4. 25

Milyen paraméterek kellenek egy formáns alapú beszédszintetizátor vezérléséhez?

Típus: egy. Válasz: 3. Pontozás: -.

  1. F0, F1, F2, F3
  2. B1, B2, B3, F0, F1, F2, F3
  3. zönge, zörej, F0, F1, F2, F3, hangerő
  4. zönge, zörej, F1, F2, F3, F4, hangerő

Milyen paramétereket használnak a formánsokhoz definiált formánssávszélességhez? (Formánssávszélesség = a rezonenciafrekvencia-görbe maximumától visszaszámolt –3 dB-es pontok közötti frekvenciatávolság)

Típus: egy. Válasz: 2. Pontozás: -.

  1. F0, F1, F2, F3
  2. B1, B2, B3, B4, B5
  3. zönge, zörej, F0, F1, F2, F3, hangerő
  4. zönge, zörej, F1, F2, F3, F4, hangerő

Miért fontos, hogy a hangok egymáshoz viszonyított intenzitása helyesen legyen beállítva?

Típus: egy. Válasz: 2. Pontozás: -.

  1. Hogy a magánhangzók érthetőbbek legyenek.
  2. Hogy ne legyen „huppogós” a beszéd.
  3. Hogy a zárhangok érthetőbbek legyenek.
  4. Hogy a réshangok érthetőbbek legyenek.

A hangkapcsolatok spektrális illeszkedése mely beszédhangokban lényeges az egymás után fűzött elemeknél?

Típus: egy. Válasz: 2. Pontozás: -.

  1. C-k
  2. V-k
  3. Nazálisok
  4. Zárhangok

Melyik komponenseit érdemes megtartani az amplitudóspektrumnak, ha az ablak hossza 256 minta?

Típus: egy. Válasz: 2. Pontozás: -.

  1. Az első 226 komponensét.
  2. Az első 128 komponensét.
  3. Az első 256 komponensét.
  4. Az első 512 komponensét.

Egy akusztikus jellemzővektor…

Típus: egy. Válasz: 1. Pontozás: -.

  1. egy adott hosszúságú hangrészletet jellemez.
  2. egy teljes bemondást jellemez.
  3. egy teljes hangot jellemez.
  4. egy teljes szót jellemez.

Mire jó a Gaussian Mixture Model (GMM)?

Típus: egy. Válasz: 4. Pontozás: -.

  1. Mindenre, amire a HMM is.
  2. Csak a HMM-mel kiegészítésben használható.
  3. Időillesztésre.
  4. Hasonlósági mérték számítására.

A rejtett Markov modelleket (HMM)...

Típus: egy. Válasz: 3. Pontozás: -.

  1. minden esetben helyettesíthetjük Markov láncokkall.
  2. a Viterbi-algoritmussal taníthatjuk be.
  3. a GMM-ekkel együtt lehet beszédfelismerésre használni.
  4. csak a GMM-mel kiegészítésben használhatjuk bármi is.

A Viterbi-algoritmus…

Típus: egy. Válasz: 4. Pontozás: -.

  1. a GMM paraméterek gyors közelítő számítására használható.
  2. a HMM paraméterek gyors közelítő számítására használható.
  3. adja meg a beszédfelismerésnél a helyes eredményt.
  4. a HMM legjobb illeszkedésű útvonalát mindig megtalálja.

Melyik állítás(ok) igaz(ak)?

Típus: több. Válasz: 5. Pontozás: -.

  1. Beszédre csak lineáris kvantálást használunk.
  2. LPC-10 kódoló csak a zöngés részt kódolja.
  3. MP3 kódolás veszteségmentesen visszaállítható beszéd esetén.
  4. A-törvényű (A-law) kvantálás lineáris.
  5. A beszédkódolók minősége nem csak a bitsebességtől függ.
  6. Logaritmikus kvantálás veszteségmentesen visszaállítható.

Mely beszélőszerv(ek) szükséges(ek) zönge képzéshez?

Típus: több. Válasz: 1,5. Pontozás: -.

  1. Hangszalagok
  2. Szájüreg
  3. Orrüreg
  4. Garat
  5. Tüdő
  6. Nyelv

A "Novemberben havazott." mondatot szeretnénk elemösszefűzéses szövegefelolvasóval előállítani. Hány diád és/vagy CVC triád elem felhasználásával valósítható ez meg?

Típus: több. Válasz: 3,4. Pontozás: -.

  1. 7 triád
  2. 15 diád
  3. 19 diád
  4. 5 diád + 7 triád
  5. 10 diád + 10 triád
  6. 3 diád + 8 triád

Melyik koszinusz jelnek a legkisebb az intenzitása?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 7000 Hz / 65 phon
  2. 1 kHz / 60 db
  3. 1000 Hz/ 61 phon
  4. 20 Hz / 59 phon
  5. 500 Hz / 120 dB
  6. 18 kHz / 99 dB

PSOLA eljárással módosítjuk a "túsz" szó alapfrekvenciáját 250 Hz-ről 200 Hz-re. A szó 100 + 100 + 100 = 300 ms hosszú. Mennyi lesz a módosított szó időtartama, ha az időváltozást nem kompenzáljuk?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 375 ms
  2. 280 ms
  3. 350 ms
  4. 325 ms
  5. 200 ms
  6. 240 ms

Egy beszédrészlet elemzésekor vonalas spektrumot látunk. Melyik állítás(ok) lehet(nek) biztosan igaz(ak)?

Típus: több. Válasz: 6. Pontozás: -.

  1. Magánhangzót látunk.
  2. Zajt látunk.
  3. Zöngétlen hangot látunk.
  4. Zárhangot látunk.
  5. Mássalhangzót látunk.
  6. Zöngés hangot látunk.

Egy 100 Hz-es alapfrekvenciájú férfi beszélő esetén melyek NEM lehetnek az első két formáns értékei?

Típus: több. Válasz: 3,6. Pontozás: -.

  1. 1670 Hz
  2. 600 Hz
  3. 2980 Hz
  4. 500 Hz
  5. 550 Hz
  6. 100 Hz

Egy magánhangzó hangnyomás-idő függvényének amplitúdóját egységesen felére csökkenti a számítógéppel. Hány dB-lel fog változni a hang intenzitása?

Típus: több. Válasz: 3. Pontozás: -.

  1. -1
  2. -2
  3. -6
  4. -3
  5. -4
  6. -5

Jelölje meg, hogy melyik hanghármasban van összetett szerkezetű beszédhang és ezzel egyidőben ugyanabban a hangban fojtott zönge?

Típus: több. Válasz: 1. Pontozás: -.

  1. egó
  2. lás
  3. sen
  4. átp
  5. csók
  6. rak

Milyen időközönként helyez el a PSOLA algoritmus zöngeszinkron jeleket az Én! hangsorban, ha azt egy nő ejti ki?

Típus: több. Válasz: 4. Pontozás: -.

  1. 200 ms
  2. 1 ms
  3. 100 μs
  4. 4 ms
  5. 40 ms
  6. 400 μs


LPC analízisnél előállított maradékjelre mi jellemző?

Típus: egy. Válasz: 4. Pontozás: -.

  1. Kinyerhetők belőle a formánsfrekvencia értékek.
  2. Több biten kvantálható, mint az eredeti jel.
  3. Az a jel a maradékjel, ami nem fért bele az analízisablakba.
  4. LPC szintézis megvalósítható az eredeti maradékjel nélkül is.
  5. Eldobható az eredeti jel enélkül is visszaállítható.
  6. Nagyobb az energiája az eredeti jelnél.

Mely hang(ok) zöngétlen(ek)?

Típus: több. Válasz: 2. Pontozás: -.

  1. d
  2. cs
  3. l
  4. dz
  5. v
  6. g

60 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás?

Típus: több. Válasz: 2. Pontozás: -.

  1. Benzinmotoros fűnyíró 1,5m-ről.
  2. Normál beszéd 1m-ről.
  3. Sugárhajtású repülő hajtóműve 15m-ről.
  4. Suttogó beszéd 10m-ről.
  5. Elhaladó vonat 2m-ről.
  6. Erős közúti forgalom 1m-ről.

Mi a Tacotron 2? (*)

Típus: egy. Válasz: 5. Pontozás: -.

  1. Egy beszédátvitelt szabványosító szervezet.
  2. Egy mély neurálisháló alapú rendszer.
  3. Beszédalapú helymeghatározási megoldás.
  4. Egy beszédfelismerő eszköz.
  5. Egy HMM alapú hullámforma generáló rendszer.
  6. End-to-end rendszer.

Mi a WaveGlow?

Típus: egy. Válasz: 4. Pontozás: -.

  1. Egy beszédátvitelt szabványosító szervezet.
  2. Egy mély neurálisháló alapú rendszer.
  3. Beszédalapú helymeghatározási megoldás.
  4. Egy folyamat alapú beszédgeneráló rendszer.
  5. Egy HMM alapú hullámforma generáló rendszer.
  6. End-to-end rendszer.

A magyar beszéd dallamformáira bemutatott modellben milyen frekvencián van a kijelentés végén az alapfrekvencia, ha a beszélő egy átlagos hangmagasságú nő?

Típus: több. Válasz: 1. Pontozás: -.

  1. kb. 135 Hz
  2. kb. 320 Hz
  3. kb. 65 Hz
  4. kb. 200 Hz
  5. kb. 220 Hz
  6. kb. 35 Hz

Milyen hosszú a következő mondat, ha egy átlagos beszédtempójú ember mondja ki? "A beszéd egy bonyolult jelenség."

Típus: több. Válasz: 5. Pontozás: -.

  1. 1800 μs
  2. 45 s
  3. 30 s
  4. 900 ms
  5. 2000 ms
  6. 5800 μs

Egy nyelv ábécéje 24 hangot (6 magánhangzó és 18 mássalhangzó) tartalmaz. Minimum hány diád és CVC triád elem kell a nyelv minden hangkapcsolatának lefedéséhez?

Típus: egy. Válasz: 6. Pontozás: -.

  1. 6 * 6 + 18 * 18
  2. 24 * 24 + 18 * 5 * 5
  3. 24 * 24 * 24
  4. 6 * 18 * 24
  5. 24 * 24
  6. 24 * 24 + 6 * 18 * 18

Egy telefonos jelnél 2400 Hz-es F2-őt mértünk. Mennyi az F0?

Típus: több. Válasz: 6. Pontozás: -.

  1. 2400 Hz
  2. 200 kHz
  3. 12 Hz
  4. 120 Hz
  5. 25 Hz
  6. Nem tudjuk megállapítani.

Egy nyelv ábécéje 36 hangot (10 magánhangzó és 26 mássalhangzó) tartalmaz. Minimum hány diád és CVC triád elem kell a nyelv minden hangkapcsolatának lefedéséhez?

Típus: egy. Válasz: 3. Pontozás: -.

  1. 26 * 26 * 26 + 10 * 10 * 10
  2. 36 * 36 + 26 * 10 * 10
  3. 36 * 36 + 10 * 26 * 26
  4. 36 * 36 * 36
  5. 36 * 36
  6. 10 * 10 + 26 * 26

Egy nyelv ábécéje 26 hangot (7 magánhangzó és 19 mássalhangzó) tartalmaz. Minimum hány diád kell a nyelv minden hangkapcsolatának lefedéséhez?

Típus: egy. Válasz: 3. Pontozás: -.

  1. 7 * 19 * 26
  2. 19 * 19 * 19 + 7 * 7 * 7
  3. 26 * 26
  4. 26 * 26 + 7 * 19 * 19
  5. 26 * 26 + 26 * 26 * 26
  6. 26 * 26 * 26

Folyamatos, nagyszótáras, beszélőfüggetlen beszédfelismerő betanításához készülő beszédadatbázist készítünk. Mi igaz ebben az esetben?

Típus: több. Válasz: 3,5. Pontozás: -.

  1. Csak CVC hangkapcsolatokat tartalmaz az adatbázis.
  2. Azonos életkorú beszélőkkel készítjük a felvételeket.
  3. Változatos körülmények (mikrofon, emberek) között rögzítjük a beszédadatbázist.
  4. Kevés jól megválasztott szó felolvasása is elegendő.
  5. Különböző korú és nemű emberrel is érdemes felvételt készíteni
  6. Csak studió körülmények között felvett beszédet lehet használni.

Nagyságrendileg hány felharmonikus komponens van egy férfi által előállított normálisan ejtett zöngehangban a 2000 Hz-es frekvenciáig?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 40
  2. 20
  3. 100
  4. 200
  5. 8
  6. 4

Nagyságrendileg hány felharmonikus komponens van egy nő által előállított normálisan ejtett zöngehangban a 4000 Hz-es frekvenciáig?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 40
  2. 20
  3. 100
  4. 200
  5. 8
  6. 4

Nagyságrendileg hány felharmonikus komponens van egy férfi által előállított normálisan ejtett zöngehangban a 4000 Hz-es frekvenciáig?

Típus: egy. Válasz: 1. Pontozás: -.

  1. 40
  2. 20
  3. 100
  4. 200
  5. 8
  6. 4

Milyen intenzitással hallgatható zene tartósan és élvezhetően, halláskárosodás nélkül?

Típus: egy. Válasz: 1. Pontozás: -.

  1. 78 dBA
  2. 800 dBA
  3. 18 dBA
  4. 138 dBA
  5. 8 dBA
  6. -18 dBA

Mi a WaveNet?

Típus: több. Válasz: 3,5,7. Pontozás: -.

  1. Ultrahangos beszédrögzítő készülék.
  2. Egy beszédátvitelt szabványosító szervezet.
  3. Egy hullámforma generáló rendszer, amely gépi tanuláson alapul.
  4. Beszéd alapú helymeghatározási megoldás.
  5. Egy DNN alapú hullámforma generáló rendszer.
  6. Egy HMM alapú hullámforma generáló rendszer.
  7. Egy mély neurális háló alapú hullámforma generáló rendszer.

Milyen frekvenciatartományban legintenzívebb az "ő" hang spektruma?

Típus: egy. Válasz: 5. Pontozás: -.

  1. 20 Hz - 30 Hz
  2. 20 kHz- 30 kHz
  3. 10 Hz - 20 Hz
  4. 15 kHz - 20 kHz
  5. 50 Hz - 5 kHz
  6. 5 kHz - 10 kHz

Milyen frekvenciatartományban legintenzívebb az "sz" hang spektruma?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 20 Hz - 30 Hz
  2. 20 kHz- 30 kHz
  3. 10 Hz - 20 Hz
  4. 3 kHz - 10 kHz
  5. 50 Hz - 5 kHz
  6. 5 kHz - 10 kHz

A "képpont" szó átlagos köznyelvi kiejtésben a "p" hangra milyen tulajdonságok jellemzőek?

Típus: több. Válasz: 1,6. Pontozás: -.

  1. A "p" hang megváltozik a szó közepén a rövid verzióhoz képest.
  2. Nagy energiájú hang lesz.
  3. Felpattanás a hang elejére kerül.
  4. Több mint 100 ms hosszú a "p" hang.
  5. A némafázisa nem hosszabb mint 100 μs.
  6. Fojtott zönge legalább 100 ms lesz.

A "kéttannyelvű" szó átlagos köznyelvi kiejtésben a "t" hangra milyen tulajdonságok jellemzőek?

Típus: egy. Válasz: 6. Pontozás: -.

  1. A "p" hang nem változik meg a szó közepén a rövid verzióhoz képest.
  2. Nagy energiájú hang lesz.
  3. Felpattanás a hang elejére kerül.
  4. Több mint 100 ms hosszú a "p" hang.
  5. A némafázisa nem hosszabb mint 100 μs.
  6. Fojtott zönge legalább 100 ms lesz.

Mi jellemző a formánsokra?

Típus: több. Válasz: 3,4. Pontozás: -.

  1. A néma fázisoknál is megmérhető.
  2. Értékük független a beszélő nemétől.
  3. Az F2 meghatározza a magánhangzó hangrendjét.
  4. Az alapfrekvenciánál nagyobb az értékük.
  5. A magánhangzóknak 1440 db formánsa van.
  6. Vonalas spektrum esetén nem meghatározható.

Mi jellemző a formánsokra?

Típus: több. Válasz: 2,4. Pontozás: -.

  1. Női beszélőknél jellemzően alacsonyabb értékeket vesz fel.
  2. Nem csak az F0 egész számú többszöröse lehet.
  3. A magánhangzók 1140 db formánsa van.
  4. A hang spektrumából meghatározható.
  5. Nem függ a beszédhangtól.
  6. Vonalas spektrum esetén nem meghatározható.

Egy telefonos rendszerben a következő felharmonikusokat sikerült kimérnünk: 750 Hz, 1000 Hz, 1500 Hz. Mennyi lehet az alapfrekvencia?

Típus: több. Válasz: 5,6. Pontozás: -.

  1. 200 Hz
  2. 25 Hz
  3. 400 Hz
  4. 100 Hz
  5. 125 Hz
  6. 250 Hz

A magyar beszéd dallamformáira bemutatott modellben milyen frekvencián van a kijelentés végén az alapfrekvencia, ha a beszélő egy átlagos hangmagasságú nő?

Típus: egy. Válasz: 1. Pontozás: -.

  1. kb. 140 Hz
  2. kb. 200 Hz
  3. kb. 70 Hz
  4. kb. 220 Hz
  5. kb. 320 Hz
  6. kb. 35 Hz

Milyen hosszú a következő mondat, ha egy átlagos beszédtempójú ember mondja ki? "A beszéd bonyolult jelenség, noha ezt nem érzékeljuk, hiszen mindannyian tudunk beszélni."

Típus: egy. Válasz: 6. Pontozás: -.

  1. 5900 μs
  2. 900 ms
  3. 2500 μs
  4. 30 s
  5. 45 s
  6. 5800 ms

Melyik állítás(ok) igaz(ak) a PSOLA algoritmusra?

Típus: több. Válasz: 1,3. Pontozás: -.

  1. Módosíthatja a hangidőtartamot.
  2. MFCC paramétereket számolunk vele.
  3. Pitch Synchronous Overlap and Add-nek a rövidítése.
  4. Megszünteti a frekvenciaelfedés jelenséget.
  5. Módosítható vele a mintavételi frekvencia.
  6. Beszédfelismerésben használt.

Mely hang(ok) zöngétlen(ek)?

Típus: több. Válasz: 6. Pontozás: -.

  1. g
  2. zs
  3. d
  4. dz
  5. z
  6. k

10 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás?

Típus: egy. Válasz: 4. Pontozás: -.

  1. Benzinmotoros fűnyíró 1,5m-ről.
  2. Normál beszéd 1m-ről.
  3. Sugárhajtású repülő hajtóműve 15m-ről.
  4. Suttogó beszéd 10m-ről.
  5. Elhaladó vonat 2m-ről.
  6. Erős közúti forgalom 1m-ről.

Beszédet tömörítünk LPC-10 kódolóval: ehhez az F0 értékeket 10 biten, a maradékjel energiáját és az LP együtthatókat 10-10 biten tároljuk 25 ms-os szegmensenként. Mekkora lesz a bitsebesség?

Típus: egy. Válasz: 3. Pontozás: -.

  1. 10 000 bsp
  2. 480 bps
  3. 4800 bps
  4. 1000 bps
  5. 48 bps
  6. 48 000 bps

Mi jellemzőa a μ-law kódolásra?

Típus: egy. Válasz: 5. Pontozás: -.

  1. A HMM beszédfelismerés előfeldolgozója.
  2. μ meredekségű lineáris kvantálás.
  3. Négyzetes kvantálású.
  4. 8 bites lineáris kvantálás.
  5. Nagy amplitúdó esetén ritkább a kvantálás.
  6. MFCC paraméterei.

Mi jellemző a "p" hangra?

Típus: több. Válasz: 2. Pontozás: -.

  1. Zöngés.
  2. Zárhang.
  3. Felpattanás a hang elején található.
  4. F2 értéke magas.
  5. Nazális.
  6. Fojtott zöngét tartalmaz.

Melyik állítás igaz az alábbiakból a dinamikus idővetemítésre (DTW)?

Típus: egy. Válasz: 5. Pontozás: -.

  1. Két, egymásnak megfelelő összesített bemondás összehasonlítására szolgál kizárólagosan, azaz vagy az "alma" és "alma" vagy a "körte" és "körte" bemondáspárok hasonlósága számítható, de ezek nem keverhetőek.
  2. A beszéd gépi generálásánál a természetes beszédritmikát állítja elő.
  3. Az einsteini általános relativitás elméletének megfelelően a gyorsabb beszélők számára lassabban telik az idő.
  4. Ha már tudjuk, mi a helyes beszédfelismerési eredmény, csak akkor használható az időbeli illesztés elvégzésére.
  5. Két tetszőleges hangszakasz közötti összesített távolságminimum meghatározására szolgál, azaz pl. az "alma" és a "körte" bemondások hasonlósága számítható.

16 kHz-en mintavételezek 8 kHz-es ideális aluláteresztő szűrővel egy beszédjelet. Mi lesz a jellel?

Típus: egy. Válasz: 6. Pontozás: -.

  1. Érthetetlen lesz az átlapolódás miatt.
  2. Csak a mássalhangzók maradnak meg.
  3. Veszteségmentesen tárolható.
  4. Alig érhető marad a beszéd.
  5. Csak az alapfrekvencia marad meg.
  6. Majdnem tökéletesen megmarad a beszéd.

Milyen hosszú egy szó, amely egy diád, 2 triád és még egy diádból áll? A szüneteket nem számoljuk.

Típus: egy. Válasz: 4. Pontozás: -.

  1. 4 hang
  2. 9 hang
  3. 3 hang
  4. 6 hang
  5. 5 hang
  6. 10 hang

Mely állítás(ok) igaz(ak) a kvantálási zajra?

Típus: több. Válasz: 5,6. Pontozás: -.

  1. Csak 6 bit alatti kvantálásnál létezik.
  2. Értéke nem meghatározható, mert a használt mikrofontól függ.
  3. Függ a mintavételi frekvenciától.
  4. Csak logaritmikus kvantálásnál jelentkezik.
  5. Függ a kvantálási lépcsők számától.
  6. Lineáris kvantálásnál is létezik.

Egy átlagos női beszélőnél hány zöngeperiódius mérhető meg egy hosszabb mondat "milyen" szavában? (*)

Típus: egy. Válasz: . Pontozás: -.

  1. 1000
  2. 5
  3. 13
  4. 200
  5. 16 000
  6. 80

Egy beszédrészlet spektogrammját látjuk, aminek egy szakaszán 3 kHz alatt nincs komponens. Miért lehet ez? (*)

Típus: több. Válasz: 2, 5. Pontozás: -.

  1. MP3 kódolás.
  2. Egy réshang részletét látjuk.
  3. Fojtott zöngét látunk.
  4. A zaj kimaszkolta a jelet.
  5. Hibás frekvenciája vagy nincs bemeneti szűrő a mintavételnél.
  6. Mivel női beszélő esetén nincs a beszédnek itt frekvenciakomponense.

Melyik hang(ok)nak van periodikus szakasza?

Típus: több. Válasz: 1,2. Pontozás: -.

  1. l
  2. m
  3. sz
  4. f
  5. s
  6. h

Melyik hang(ok)nak van periodikus szakasza?

Típus: több. Válasz: 2,4. Pontozás: -.

  1. f
  2. j
  3. h
  4. ny
  5. s
  6. sz

Egy 7 kHz-es szinusz jelet szűrés nélkül mintavételezünk 16 kHz-en. A mintavett jelben hol jelenik meg a bemeneti szinusz jel?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 8 kHZ-en
  2. 4 kHz-en
  3. 3,5 kHz-en
  4. 7 kHz-en
  5. 1 kHz-en
  6. Sehol, mert kiszűrésre kerül.

Egy 9 kHz-es szinusz jelet szűrés nélkül mintavételezünk 16 kHz-en. A mintavett jelben hol jelenik meg a bemeneti szinusz jel?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 8 kHZ-en
  2. 4 kHz-en
  3. 3,5 kHz-en
  4. 7 kHz-en
  5. 1 kHz-en
  6. Sehol, mert kiszűrésre kerül.

Egy beszédrészlet spektogrammját látjuk, aminek egy szakaszán 1 kHz alatt nincs komponens. Miért lehet ez? (*)

Típus: több. Válasz: 2. Pontozás: -.

  1. Fojtott zöngét látunk.
  2. Egy réshang részletét látjuk.
  3. Túl kvantálási szint van.
  4. A zaj kimaszkolta a jelet.
  5. MP3 kódolás hibája.
  6. Mivel női beszélő esetén nincs a beszédnek itt frekvenciakomponense.