Médiainformációs technológiák és eszközök

A VIK Wikiből
A lap korábbi változatát látod, amilyen (vitalap) 2012. október 21., 21:42-kor történt szerkesztése után volt. (Új oldal, tartalma: „{{GlobalTemplate|Infoszak|MedInfTechEszk}} __TOC__ ==Órai jegyzet (friss, update-elt)== [https://wiki.sch.bme.hu/pub/Infoszak/MedInfTechEszk/mitesz.pdf Mitesz jegy…”)
(eltér) ← Régebbi változat | Aktuális változat (eltér) | Újabb változat→ (eltér)
Ugrás a navigációhoz Ugrás a kereséshez

Ez az oldal a korábbi SCH wiki-ről lett áthozva. Az eredeti változata itt érhető el.

Ha úgy érzed, hogy bármilyen formázási vagy tartalmi probléma van vele, akkor kérlek javíts rajta egy rövid szerkesztéssel.

Ha nem tudod, hogyan indulj el, olvasd el a migrálási útmutatót


Órai jegyzet (friss, update-elt)

Mitesz jegyzet 2006.12.17. 15:24

Volt egy modulációkról szóló előadás is, ami ebben a jegyzetben nincs benne, de szerintem nem is olyan fontos a vizsgára.

-- GV - 2006.12.17.

Óravázlat

1. Hét

Hétfő 09.11

Bevezető óra, kedvcsináló.

Csütörtök 09.14

Hangok világa
  • Érzeti tulajdonságok (Hangosság, hangmagasság, szinezet) - Fizikai tulajdonság (Intenzitás, Spektrum: teljesítmény eloszlása a frekvencia tengelyen)
  • Intenzitás - Teljesítmény, hangmagasság, decibel, akusztikus decibel, "hallásküszöb" alatt is hallunk
  • hallás tartomány frekvencia
  • nem minden frekvencián ugyanolyan jó a hallásunk: hallásgörbék, ISO R226 1961-ben szabványosított,
  • phone, 40phone: nagyott hallok, 80phone siketek, de őnáluk is eltérhet, hogy milyen frekvenciára hall rosszabul így a készüléket személyre kell állítani
  • hang elfedés jelensége és fajtái (időben van elő és utó elfedés); frekvencia elfedés, loudness áramkör (Metallica koncert és a kínai magnó esete), iránytartománybeli elfedés, Haas hatás (szikla mögé bújt ősember az oroszlánnal), első hang iránya, második hang intenzitása (teremakusztikusok terepe)
Linkek:
Következmények, mintavételezés
  • feldolgozandó információ, agy felfogó képessége kb 100bit/s, (entrópia)
  • Shannon: Ha van egy SÁVKORLÁTOS jelünk, akkor a sávszél kétszeresével mintavételezve elvileg is pontosan visszaállítható az erdeti jel.
  • Sávszűrás az A/D átalakítás első lépése
  • Ember 20kHz-ig hall, ezt kell tehát megduplázni és mivel nincs tökéletes sávszűrő hagyjunk rá "mérnöki" 10%-ot, így jön ki 44Khz (ami majd 44,1kHz lesz végül valamiért)


2. Hét

Csütörtök 09.21 (2 óra egyben)

Mintavételezés váltás (resampling)

Pl. szeretnénk egy 20kHz-en mintavételezett hangot 30kHz-esre alakítani.

  • 1. lépés Minta sűrítés. Veszük a legkisebb közös többszörösüket (60) és ennyire felsűrítjük a mintákat 0-kkal.
  • 2. lépés Aluláteresztő szűrő
  • 3. lépés Mintaritkitás. Mivel 30 kell és nekünk 60 van, ezért kihagyjuk minden második mintát.

(Házi volt a fordított írány amit nagyon emlegetett ZH-val kapcsolatban.)

A DAT kazetta 48kHz-es előírása onnan jön, hogy félt a zenezipar, hogy a CD-ket jó minőségben lehet majd másolni, ézért előírtak egy 10%-os eltérést. (Mivel ebben az esetben a legkisebb közös többszörös a resampling során írtó nagy lenne, ez nem megvalósítható.)

Kvantálás
  • Fehér zaj: mintáink tipikusan nem esnek egybe a kvantálási lépcső értékeivel, így valamerre döntenünk kell, keletkezik egy kis hiba. Ez a hiba jelen lesz minden frekvencián ezért hívjuk - a fehér fényhez hasonlóan, amiben minden szín benne van - fehér zajnak. A fehér zaj nem szűrhető ki visszafelé mert hozzáadódik az eredeti hanghoz (mert Fourier lineáris)
  • itt valahonnan kihoztuk, hogy minden bit kb 6db-t javít a jel/zaj arányon és hogy innen jön a CD 96db-je mert az 16biten kvantál.
  • kvantálni lehet lineárisan meg nem lineárisan is. A nem lineárisnál azt használjuk ki, hogy tipikusan nem ordítjuk végig pl a telefonbeszélgetést, a jelek nagy része kisebb intenzitású.
  • másik trükk: pl 11bites kvantálás is átvihető 8biten, ha a mintáknak egy hosszab szakaszon megviszgáljuk az intenzitását és aszerint kódolunk. Ha nagy intenzitású a hang, akkor nem tudunk mit csinálni, egyszerűen elhagyjuk az utolsó 3 bitet és úgy küldjük át. Ugyis jó nagy szám kicsi lesz az eltérés. Ha az adott szakaszon a minták csak fele intenzitásúak max, akkor trüközhetünk. (Kettes komplemens számábrázolást használunk, ahol az első bitek megegyeznek. Annál több bit egyezik meg minél közelebb kerülünk a nullához.) Tehát ha csak fele intervallumba vehetnek fel értékeket, akkor tudjuk, hogy az első két bit ugyis ugyanaz, ezért a második bitet fogjuk elhagyni és az utolsó három helyett csak kettőt. Ezzel nyerünk 1 bitet, pontosabbak leszünk és csökken a jel/zaj arány 6dB-lel! Pont ahol halkabb dolgot kell átvinni, ott tudunk javítani igazán az arányon! (Nicam rendszer használja például ezt. Ott 1ms alatt 32 minta van és 14biten mintavételeznek, de 10-en küldik át.)

3. Hét

Csütörtök 09.28 (2 óra egyben)

Kapcsolt sztereo és 2 utas hang

Kapcsolt sztereonál (joint stereo) megengedett az áthallás. Pl egy helységben beszélget 2 ember 2 mikrofonnal és nincsenek hangszigetelten elválasztva.

2 utas megoldás pl. az Eurosportnál a két nyelvű adás. (Ekkor mindkettő mono)

Sztereo rádióadó
  • Fontos volt a kompatibilitás, ezért nem lehetett azt csinálni, hogy felhúznak 2 antennát és 1-1 oldalt adnak rajta.
  • Ehelyett az eddigi sávon a két csatorna összege, másikon 2 csatorna különbsége jön.
  • Ez a megoldás csak (kapcsolt) sztereonál műkődik, mert nem garantálható, hogy átvitel közben nem csökken egyik komponens (összeg vagy különbség). Kis csökkenés is hallhatóvá vállik, áthallás keletkezik.
Álsztereo ("digitally remastered")

A bejövő mono jelből szűrővel egy bizonyos sávot az egyik oldalra, komplementerét másik oldalra teszük. A szűrőnek késleltetése van ezért párhuzamosan a másik oldalon egy mindent át eresztő szűrő kell.

Digitális álsztereo

TV-k már jó 15 éve digitális hangcsatornát hazsnálnak, kell egy digitális szűrő. Egy késleltetővel megoldható. A bemenő jelet az egyik irányba összeadjuk a késleltett jellel, másik oldalon különbséget képezünk és kész. Az időbeli késleltető a frekvencia tartományban alul és felül áteresztő szűrővé válik (N=1). Ha növeljük N-et (N=2), akkor sávzáró és sáv áteresztő szűrő jön létre. N-et növelve fésűszerűen ahol egyik max, ott másik minimum lesz.

Bázis távolság állítás

TV-n, magnón közel vannak egymáshoz hangfalak, hiába sztereo, ha messze ülünk ugyanonnan jön a hang. Trükk kell, hogy valahogy mégis térszerűbb legyen a hangzás.

Megoldás: a sztereo sávokból vonjuk ki a másikat egy sáváteresztőn visszacsatolva.

4. Hét

Hétfő 10.02

Zainkó Csaba tartotta. PPT-ket vetített a beszéd jellemzőiről és óra végén különféle beszédszintetizáló programokkal demózott.

Beszéd

Nyelvfüggő, hogy mennyi és milyen hang. Zöngés és zöngétlenek, magán- és mássalhangzók. Magánhangzók energiája nagyobb. Speciális hang például kapj el végén j zöngétlen. Magyarban 33 hang amibe nincsen beleszámolva a hosszú változatok.

Zöngés hangok képzése

Vonalas spektrum jellemzőjük. Csúcspontok elhelyezkedése jellemző egy-egy hangra (pl i kb:270Hz-2350Hz-3150). Suttogás nem zörög, zaj. Nagyon megeröltető a hangszálaknak.

Zöngétlen hangok

Gerjesztés zürej, artikulációs csatorna más és más, nincs alapfrekvencia, "locus"

Egymásra hatás

Beszédben nincsenek szünetek hangok, szavak között. A hangok hatnak egymásra. tíz/tűz, honvéd(n nazális)/támfal, kaptár(1 felpattanás 2 helyett)/kapcsol, rakj/lopj említett furcsa j.

Hasonulások, rövidülések, nyúlások,

hat bíróság/hadbírosád t és d zöngés-zöngétlen párok, színpad, hiátus töltés: 2 magánhangzó közé j. Birtokos ragban régebben nem volt j.

Szintézis

1982 MTA Multivox, 1999 tovább fejlesztett (profivox??)

Egysége

beszéd hangok sorozata, dallammenet, hangidők, energiabemenet, szünetek, prozodia-mátrix

Folyamat
  • Írott szöveg
  • graféma (betű) szintű feldolgozás [ szöveg elemzés kezdete]
  • graféma beszédhang átalakítás
  • beszédhang szintű feldolgozás [szöveg elemzés vége]
  • prozódiai mátrix
  • beszédhang hullámforma
  • hullámforma szintű feldolgozás
  • beszéd
Hanghullám összefésülés

diád, triád (hangot kettő vagy három részre bontjuk és előtte vagy utána levővel igazítjuk), időtartományban módosítás, Szinuszos modell elvileg fül nem fázisérzékeny, de észreveszük

Korpusz alapú

Előre felvett nagyméretű anyag. Több gigabájt... (Nagy meló:stabilan beszélő ember kell, hogy különböző időpontokban ugyanolyan legyen hang amiből később egymás mellé kerülnek hangok, hangmérnöknek figyelni kell, hogy azt olvassa fel ami le van írva, mert egy-egy betoldott szó teljesen bezavarhat.) Kényszerített felismerés. Főleg kötött témakörnél működhet, pl időjárásjelentés.


Unit alapú

Hangelemeket egymás mellé.

Alakalmazások
  • számszerinti tudakozó
  • számfelolvasó (magyarúl számot kb 26 elemből minimálisan, 220 elemből jó minőség)
  • SMS felolvasó (Symbian)
  • Ezen a helyen volt linkelve a(z) mitesz.pdf nevű fájl ("mitesz.pdf" link szöveggel) a régi wiki http://wiki-old.sch.bme.hu/bin/view/Infoszak/MedInfTechEszk oldaláról. (Ha szükséged lenne a fájlra, akkor a pontos oldalmegnevezéssel együtt küldd el a wiki@sch.bme.hu címre a kérésedet)
Mitesz jegyzet 2006-2007 ősz