16. Analóg és digitális jelek csoportosítása. Az adat és az adatmennyiség egysége. Képek, és hangok digitalizálása.


 

A jelek csoportosítása
A digitális jelfeldolgozás térhódításával szokásos a jeleket két nagy kategóriába sorolni, ezek szerint a jel lehet folytonos vagy diszkrét.
Folytonos jel
»
A makroszkopikus fizikai jel általában folytonos vagy annak tekinthető mennyiség (bármilyen értéket felvehet két határérték között), például idő, energia, hely, távolság, nyomás, erő, áram, feszültség, kitérés, szög, szín, fényerő.
A folytonos jelek nagy többsége folyamatos is, azaz nem szaggatott.
* Az analóg eredetileg arra utal, hogy hasonló. A jel valamilyen értelemben hasonló a jelölt dologhoz. (Például ha a hangot hang- nyomás—idő grafikonnal jellemezzük, ehhez nagyon hasonlónak kell lennie annak a feszültség—idő grafikonnak, amellyel a mikrofon jelét írjuk le. Ha nem az, akkor már a felvétel is torz lesz.)
* Analóg jel: az időbeli analóg jelet legtöbbször egy fizikai mennyiség folytonos időfüggvénye reprezentálja, ilyen mennyiség lehet például az áramerősség.
Diszkrét jel
»
A diszkrét vagy kvantumos (kvantált) jel gyakorlatilag véges sokféle lehet, véges sokféle értéket vehet fel. Ezek az értékek jól elkülönülnek, megkülönböztethetőek egymástól. Ilyenek például a bináris jelek (0 vagy 1, igaz vagy hamis), a karakterek, a számjegyek, véges sok természetes szám. Gyakori diszkrét jelsorozatok, például a szövegek, számadatok, ikonsorok.
» Digitális jel: számjegyekkel leírható jel — azaz binárisan is kódolható (diszkrét jelek halmaza, amelyeket számokkal jelölünk). A digitális jelek nem feltétlenül számtani, algebrai számok, hanem inkább sorszámok, azaz általános jelek. Például nem alkalmazhatóak rájuk a számtani alapműveletek. (Két karakter kódszámát összeadva lehet, hogy egy harmadik karakter kódszámát kapjuk, csak éppen nincs semmi értelme.)
Analóg jel digitalizálása
A gyakorlatban az analóg jelet elegendően sok számmal jóllehet közelíteni — amelyekből nagy pontossággal vissza is állítható az eredeti analóg jel D/A (digitális/analóg), illetve A/D (analóg/digitális) átalakítás, például papír fénykép à digitális kép à nyomtatott kép, vagy zongora hangja à analóg mikrofonjel (hangkártya) à digitális hang (számítógép) à (hangkártya) analóg jel a hangszóróba à a hangszóró hangja — ez elegendően hasonlít az eredeti zongorahanghoz.
Kiegészítés
»
A jelek a használati szabályaikkal együtt jelrendszert alkotnak. » A jelek általában összetett jelenségek, dolgok, más jelekkel együtt újabb (összetett) jelet alkothatnak, külön jelentéssel.
» A jelek elemi jelekre bonthatók. A jelek általában kisebb egységekből, „elemi jelekből” (például pontokból vagy karakterekből) állnak. Az elemi jeleknek — hacsak egyúttal nem jelek is — nincs önmagukon túlmutató jelentésük, tehát értelmetlen elemi jel sorozatot is alkothatnak. Például egy mondatban a karakterek az elemi jelek, a szavak jelek és a mondat egy összetett jel. Egy kép lehet jel (illetve összetett jel), a kép egy képpontja méretével, színével, fényességével együtt pedig elemi jel.

 

 

Minden adat jelek sorozata, halmaza
Az adat valamilyen jelrendszerben ábrázolt jelek vagy elemi jelek sorozata, halmaza. Az adatoknak általában jelentésük, értelmük van. Valamire vonatkoznak, valamit leírunk velük. Az adatok általában információt „hordoznak”, de ezt nem szó szerint kell érteni.
A jelnek mindig van jelentése, különben nem jel, bár lehet, hogy azt nem ismerjük. Az elemi jelek vagy a jelek sorozatai azonban lehetnek értelmetlenek és ellentmondásosak is.
Az adatmennyiség
Az adatmennyiség az adathalmaz méretét, a jelek számát méri, egysége a bit.
Az adatmennyiség mértékegysége a bit (binary digit), amely egy bináris jel adatmennyiségét Jelenti.
8 bit = 1 byte, röviden: B
A byte többszörösei: k (kilo) = 210; M (mega) = 220; G (giga) = 230 Például: 1 kB = 210 B

(Újabb szabvány szerinti elnevezések: ki (kibi) = 210; Mi (mebi) = 220; Gi (gibi) = 230; Ti (tebi) = 240. Például: 1 kiB = 210 B. )

A memóriák és háttértárak kapacitását is bittel, illetve byte-tal mérjük, hiszen a kapacitás a maximálisan tárolható adatmennyiséget jelenti.

Kiegészítés
»
A definícióból adódik, hogy közvetlenül csak a digitális jelek adatmennyisége mérhető. Elvileg beszélhetünk az analóg jelek adatmennyiségéről is, de csak akkor, ha megadjuk a digitalizálás paramétereit, azaz a jel felbontásának jellemzőit (mintavételezés, kvantálás, mérési pontosság) — vagyis digitalizáltnak tekintjük.
» Ha nem bináris jelekről van szó, akkor meg kell adni egy elemi jel adatmennyiségét bitekben — azon az alapon, hogy hány bittel kódolható az összes előforduló elemi jel.

A kép mint analóg vagy digitális összetett vizuális jel
A szem a legnagyobb kapacitású információs csatornánk à a vizuális jelek fontossága

A jel:
» Érzékszerveinkkel vagy műszereinkkel felfogható (mérhető) jelenség, amely más dologra utal, azaz jelentése van — a jelek sokfélesége — egyfajta csoportosításuk: látható, hallható, szagolható, nem érzékelhető.
» Vizuális jel minden, ami látható és jel szerepet tölt be — legtöbbször 2D rajzok, fényképek, mozgóképek, térképek, szimbólumok stb.
» A vizuális jel lehet képszerű (rajz, fénykép, mozgókép stb.), stilizált (térkép, műszaki rajz, tervrajz, ikon stb.) és szimbolikus (karakterek, számok, vonalkód stb.).
» Analóg jel: a makroszkopikus fizikai jel, általában folytonos vagy annak tekinthető (bármilyen értéket felvehet két határérték között, például idő, szín, áram, feszültség, óramutató szöge, ha jel szerepet töltenek be).
» Digitális jel: számjegyekkel leírható — binárisan kódolható (diszkrét jelek halmaza, amelyeket számokkal jelölünk).
» Fontos, hogy a gyakorlatban az analóg jelet elegendően sok számmal jól lehet közelíteni — amelyekből nagy pontossággal vissza is állítható az eredeti analóg jel, például papír fénykép à digitális kép à nyomtatott kép.

Analóg kép digitalizálása
A hagyományos képek analóg jelek, más szempontból jelhalmazok — nagyon nagy lehet például egy fénykép színeinek száma és a kép finomsága, felbontása —‚ ennek csak a kémiai szemcsék mérete és minősége szab határt.
Egy analóg kép digitalizálásának két fő mozzanata:
» A kép felbontása képelemekre (pixel, dot), például gondolatban 800 oszlopos és 600 soros négyzetrácsot helyezünk a képre. Minden négyzet egy pixel; 800 x 600 pixelre bontjuk a képet.
* A pixelek színkódolása — minden pixelhez a színének megfelelő kódszámot rendelünk.
* A digitalizálást automatizálva végezzük, legtöbbször számítógépes szkennerrel.
* Gyakorlati alkalmazás a digitális fényképezőgép és a kamera — az optika által előállított analóg képet automatikusan digitalizálja és tárolja.

Felbontás a részletek finomsága
A négyzetráccsal pixelekre bontott kép szokásos pixelfelbontása
» Monitor: 800 x 600, 1024 x 768, 1600 x 1200
» Mobilkijelző: 96 x 65, 128 x 160
» Tévé: 720 x 640
Ha a képet nagyítjuk, a pixelek mérete is nő — számuk állandó—, szemmel láthatóan Is darabos lehet a kép.
A fizikai felbontás egysége a dpi (dot per inch) egységnyi szakaszra
jutó képpontok száma — a nyomtatásnál használják. Például ez a könyv
2450 dpi felbontással készült.

Színelméleti alapok
A látható fény 380—780 nm hullámhosszú elektromágneses sugárzás,
» a szivárvány — a hullámhossz szerint színeire bontott fehér fény
— rendre a nagyobb hullámhossztól a kisebb felé haladva: vörös, narancs, sárga, zöld, kék, ibolya,

» a szemben körülbelül 126 millió receptor van (pálcikareceptor
— fényesség — 120 millió, csapreceptor — színérzet — 6 millió) és 1 millió idegszál az ingerületek továbbítására,
» a csapok felelősek a színérzékelésért — három típusba sorolhatóak — az egyik a vörösre, a másik a zöldre, a harmadik a kékre a legérzékenyebb,
» a szem mint optikai lencse — változtatni képes a fókusztávolságát, a tárgyról fordított állású kicsinyített és valódi képet alkot a retinán, ahol a receptorok vannak,
» a két szemünkkel két, egymástól kissé különböző képet érzékelünk -÷ térbeli kép az agyban, ez az alapja a látszólag 3D képeknek, filmeknek is,
* a hologram más elven működik.
Egy világító képelem fontosabb jellemzői: színezet (szín), világosság (a szembe érkező fényteljesítménytől függ), telítettség (a fehér fény arányától függ — ha nagyobb a fehér összetevő a fényben, kisebb lesz a telítettség).
Additív színkeverés — három alapszínből a többi kikeverhető — világító képek monitor, tévé stb. esetén alkalmazzák: vörös R (red), zöld G (green) és kék B (blue) színből keverik ki a tetszőleges színt — RGB-színrendszer.
Szubtraktív színkeverés — a fehér fényből egyes színeket kivonva minden szín előállítható — nyomtatásban alkalmazzák, alapszínei: cián- kék C (cyan), bíborvörös M (magenta), sárga V (yellow),
» mivel a fekete nem állítható elő tökéletesen az előző színek
keverésével, 4. színnek felvették és K-val (key) jelölik - CMYKszínrendszer,
» többféle más színrendszer is létezik.

RGB-színkódolás
A bitek számával exponenciálisan nő a (kódolható) színek száma:
» 1 bit tisztán fekete/fehér kódolásra használható,
* 8 bit = 1 byte alkalmas 28= 256 szürkeárnyalat vagy szín kódolására,
» ha RGB-színkeverést alkalmazva minden alapszínt 1 byte-on ábrázolunk, az 3 byte, 24 bit (true color), 256= 16777 216 különböző szín kódolható,
* Például: RGB(0,0,0) fekete, RGB(256,0,0) piros, RGB(256,256,256) fehér,
» gyakori a 2 byte-os színkódolás is, 16 bit (high color) 2562 = 65 536-féle szín kódolható.
Színmélység — jellemezhető a szín kódjában a bitek számával — az ábrázolható színek számának kettes alapú logaritmusa.

Vektor formátumú képek (vektorgrafika)
Az egyes formákat matematikai formulákkal Írja le:
» vonalakkal, pontokkal, geometriai formákkal, vizuális jelekkel dolgozik,
* a matematikai formákhoz (bővíthető) tulajdonságlisták tartoznak, amelyek a képi adathalmaznak részei — a képpel együtt menthetők,
» például egy szakasz megadása: két végpontjának koordinátái, színe, vastagsága.

Korlátlanul nagyítható, a minőség romlása nélkül, nem lesz raszteres (darabos) a kép.

A tárolt kép adatmennyisége
» független a kép fizikai méretétől és dpi felbontásától, illetve a pixelfelbontástól — az elemi formák számától és bonyolultságától függ,
» a képfájl mérete lényegesen kisebb, mint a raszterábrázolás esetében.
A hagyományos képek kódolására nem használható. Illetve speciális alkalmazási területeken léteznek programok, például tervrajz-digitalizáló, karakterfelismerő.
A raszter és a vektor formátumot kombinálni is lehet.

Zenei és beszédhang mint analóg jel
A fül az egyik legfontosabb nagy kapacitású információs csatornánk
- a hallás és a beszéd kommunikációs jelentősége.
A hang fizikailag a levegőben (vagy más közegben) 340 m/s sebességgel tovaterjedő hullámjelenség, egy adott pontban mint gyors nyomásingadozás (rezgés) érzékelhető, illetve mérhető.
Egy átlagembernek a hallható hang frekvenciatartománya 20 Hz-16 kHz, a kisebb frekvenciákat infrahangnak, a nagyobbakat ultrahangnak nevezzük. Minél nagyobb a hang frekvenciája, annál magasabb hangként érzékeljük.
A legtöbb hang sok, különböző frekvenciájú hang állandóan változó összetételű és erősségű keveréke.
Analóg jel — digitális jel
» Analóg jel: makroszkopikus fizikai jel, általában folytonos vagy annak tekinthető — az időbeli analóg jelet legtöbbször egy fizikai mennyiség folytonos időfüggvénye reprezentálja, Ilyen mennyiség lehet például: hőmérséklet, fényerősség, hangnyomás, feszültség.
» Digitális jel: számjegyekkel leírható jel — binárisan kódolható.
» Fontos, hogy a gyakorlatban az analóg jelet elegendően sok számmal jól lehet közelíteni — amelyekből nagy pontossággal vissza is állítható az eredeti analóg jel, például: egy gitár hangja à analóg mikrofonjel (hangkártya) à digitális hang (számítógép) à (hangkártya) analóg jel a hangszóróba à a hangszóró hangja — ez elegendően hasonlít az eredeti gitárhanghoz.

Analóg hangjel digitalizálásának elve
Szükség van a hangjel, például a beszéd digitalizálására, hogy számítógépen tárolható és feldolgozható legyen — ezt analog—digital átalakításnak (A/D átalakításnak) nevezzük.
Egy analóg hangjel digitalizálásának két fő mozzanata a mintavételezés és a kvantálás:
» A jelet diszkrét időpontokban megmérjük, ez a mintavételezés. Például másodpercenként 44100 mintát veszünk a jelből (44,1 kHz a mintavételi frekvencia), ezeket a mintaértékeket valós számoknak tekintjük.
» A jel egész értékekké történő skálázását és kerekítését kvantálásnak nevezzük, így minden mintaértéket egész számmal reprezentálunk. A kvantálás során természetesen veszítünk a mintaértékek pontosságából, de maga a mérés sem teljesen pontos (minden mérésnek van hibája).
» Ezeket az egész számokat bináris számokként (bitsorozattal) ábrázoljuk, például ha 256 jelszintet, azaz egész számot akarunk megkülönböztetni, akkor 8 bit (1 byte) elegendő (28 = 256), ha 65 536 jelszintet szeretnénk megkülönböztetni, akkor 16 bit szükséges.
» Az így előálló számsorozatot nevezzük az analóg hangjel digitális reprezentációjának. Például ha 44,1 kHz frekvenciával mintavételezünk és minden mintát a hangerősségre jellemző 65 536 nyomásszinttel kívánunk leírni, akkor 44100 db 16 bites számot kapunk minden másodpercben.
» A digitalizálást automatizálva végezzük, például hangkártyával, a hozzá csatlakoztatott mikrofonnal és megfelelő programmal.

Mintavételezési frekvencia - az időbeli felbontás finomsága
Ha egy hangjelet, mint nyomás—idő függvény grafikont ábrázolunk, akkora koordináta-rendszerben egy folytonos görbe vonalat kapunk, a mintavételi időpontokhoz tartozó függőleges vonalak és a kvantálási szintekhez tartozó vízszintes vonalak egy téglalap rácsot határoznak meg.
A mintavételezés azt jelenti, hogy a folytonos vonal helyett csak a függőleges egyenesekre jutó mintavételi értékeket ábrázoljuk (a jel- görbe és a rács metszéspontjait).
Természetesen a mintavételi idő a mintavételi frekvencia reciproka:
T = 1/f.
Például ha f = 44100 Hz, akkor két szomszédos mintavétel között eltelt idő: T = 1/44100 s

A mintavételi frekvenciát az időbeli felbontás mértékének tekinthetjük, a jel esetleges gyors változásait csak akkor közelíthetjük jól, ha a mintavételi frekvencia elég nagy.
A digitalizálni kívánt hang legmagasabb frekvenciájának legalább a 2-3-szorosát válasszuk mintavételi frekvenciának.

 

A digitalizált hang tárolása – formátumai
Wave formátum
Egy analóg hang, mintavételezéssel és kvantálással történő digitalizálásakor egy wave formátumú hang jön létre, amelyet bináris adatsorozatban tárolnak. Ezt hullámformás-tárolásnak nevezzük.

MIDI formátum (Music Instrument Digital Interface)
A zene digitális kottája. A kód tartalmazza az alapfrekvenciát, a hangerőt, és a hangszert.
A hangszerre jellemző hangzást vagy szintetikusan, vagy egy előre felvett minta alapján állítják elő.

MP3 formátumú hangtömörítés
A hullámformás-kódolás nagy adathalmazt eredményez, ezért fontos a tömörítés.
Nyílván a minél nagyobb mértékű tömörítés és a hangminőség fordított arányban áll egymással, azaz minél kisebb a tömörített hang mérete, annál rosszabb a minősége.