Hangtömörítések

Előzmények, következmények

Az audio CD a nyolcvanas évek végétől minden más hangrögzítő, hangtároló eszközt kiszorított az amatőr felhasználók körében. A 90-es években a személyi számítógépek elterjedésével, az internet hozzáférés széleskörűvé válásával azonban újabb zenehallgatási lehetőségek nyíltak meg. A számítógépen tárolt hangok, zenék és a fájlcserélő szerverek segítségével ingyenesen megszerezhető zeneszámok egyszerre indítottak meg pozitív és negatív folyamatokat. Pozitívum, hogy a zenehallgatás sosem látott méreteket öltött. Negatívum, hogy szerzői jogdíj megfizetése nélkül juthatunk hozzá a zenékhez.

Amiről kevésbé hallunk, hogy a rossz minőségű tömörített zene hallgatásával, továbbadásával az igénytelen zenehallgatók tábora jelentősen megnőtt. Elveszítettük mindazt, amit a technikai fejlődés biztosított számunkra, igényeink visszasüllyedtek a walkman korszak kazettás magnóinak színvonalára, az olcsó rádiók és a filléres fejhallgató-fülhallgató által biztosított minőségre. Ez kevesekben tudatosul.

Számítsuk ki mekkora jelfolyamot jelent az audio CD minőség, hiszen ezt fogadtuk el etalonnak. 44100 minta másodpercenként, egy mintát 16 biten tárolunk, és két csatorna van (sztereo). Így 44100*16*2=1411200 bitet használunk 1mp-nyi anyag tárolására, vagyis 1,3458252Mbps (megabit per sec) adatsebességet kapunk. Egy 3 perces (180 mp-es) zene tárhely igénye Byte-ban180*1,3458252/8 azaz kb. 30,28MB. Ez a számítástechnika mai szintje mellett nem nagy méret, és interneten történő továbbítása sem okoz gondot. Nem így volt azonban több mint 20 évvel ezelőtt a hangtömörítési láz kezdetekor.

Általában elmondhatjuk, hogy léteznek veszteséges és veszteségmentes tömörítések. Az előbbieknél adatvesztés van, de ez esetleg nem, vagy csak kevésbé érzékelhető. Ilyen tömörítéseket alkalmazhatunk hangoknál, képeknél, videonál. Egy ügyesen megválasztott kóddal ki tudjuk használni érzékszerveink tökéletlenségét. A létrehozott méretcsökkenés akár 90% is lehet. A veszteségmentesnél, ahogyan az a nevéből is adódik nincs adatvesztés, csak a tömörítés után kevesebb biten tároljuk az információt (például olyan kódolást használunk, amivel a gyakori ismétlődő hosszabb adatsorozatokat rövidebb kóddal helyettesítjük). Utóbbi megoldást kell használnunk adatok, programok tömörítésénél, amikor nem veszíthetünk el egyetlen bitet sem. Így csak kisméretű 10-30%-os méretcsökkenést tudunk elérni. A két kódolást akár vegyesen is használhatjuk.

Hangtömörítésről először a nyolcvanas évek végén hallhatunk. Az MPEG (Moving Pictures Expert Group) szabványok kidolgozására létrejött szakértőgárda 1992-ben több szabványosított ajánlást tett hangok tömörítésére. Ebben az évben már tömörített hangfájlok jelentek meg az Interneten, amit a Windows operációs rendszer még nem tudott kezelni, ezért külön lejátszót kellett telepíteni a gépre (Xing). 1995-96 környékén azonban már tömegesen zajlott az mp3 fájlok töltögetése.

A tömörítés alapja fülünknek az a tökéletlensége, amit pszichoakusztikai hangelfedési jelenségnek nevezünk. Ez egyrészt azt jelenti, hogy egyidejűleg megszólaló hangoknál a magasabb szintű ”eltakarja” az alacsonyabb szintűt, másrészt a frekvenciában egymáshoz közel álló hangokat a fül nem tudja szétválasztani, így egy ún. frekvenciatartomány-beli lefedés történik.

Veszteségmentes hangtömörítések

Ahogyan már említettük, ebben az esetben a visszaállított hang teljesen azonos az eredetivel. Néhány ma használatos elterjedt formátum a teljesség igénye nélkül: wav, aiff, flac, mlp, alac, shn, wma lossless, tta. Nem célunk valamennyi formátum elemzése, ezt számtalan szakmai weboldalon, könyvekben megtalálhatjuk, inkább egy-két ajánlott formátumra hívjuk fel a figyelmet.

Évtizedek óta, a mai napig is széles körben használatos a WAV (Waveform Audio File Format), amelyet az IBM és a Microsoft fejlesztett ki, és ami a lineáris PCM (Pulse Code Modulation, impulzuskód moduláció) formátumra épül.

Apple gépeken ehhez hasonló minőséget nyújt az AIFF (Audio Interchange File Format), ha nem csökkentjük le a bitráta értékét.

A FLAC (Free Lossless Audio Codec) az utóbbi időben nagyon terjedő formátum, mivel 40-50%-os méretcsökkenés is elérhető vele, annak ellenére hogy veszteségmentes. Így jóval hatékonyabb, mint például az általános célokra kidolgozott ZIP.[6]

Minden esetben igaz, ha jó minőségű a kiinduló hanganyag, a veszteségmentes tömörítés után ugyanolyan jó marad.

Veszteséges hangtömörítések

Bizonyos fokú adatvesztés a már említett pszichoakusztikai modell szerint mindenképpen bekövetkezik, kérdés, hogy ezt mennyire vesszük észre, mennyire zavaró? Háttér zenehallgatás, háttér rádiózás esetén még megfelelő, munka mellett, közlekedés közben, telefonon tároláshoz is elfogadható. Zenekedvelőknek, zeneélvezethez, különösen ha jó a fejhallgatónk, vagy kiváló hangsugárzóink vannak, semmiképp sem ajánlott. A sok átalakítás, konvertálás minden egyes alkalommal újabb és újabb veszteséggel jár, minőségromlást okoz, így ne gondoljuk, hogy ha átalakítjuk a hangot veszteségmentes formátummá, akkor visszanyerünk valamit.

A teljesség igénye nélkül álljon itt néhány népszerű formátum: mp3, Ogg Vorbis, Real Audio, AAC, AC-3, ATRAC, WMA.

A legkorábbi és legnépszerűbb MPEG1 szabvány megalkotása során kialakult egyszerűen mp3-nak nevezett tömörítés igazából három ajánlott adatsebességet takar.

layer 1, 384 kbps adatsebesség, kb. 4:1 tömörítés,

layer 2, 192–256 kbps adatsebesség, 6 - 8:1 tömörítés,

layer 3, 112–128 kbps adatsebesség, 10 - 12:1 tömörítés

Alábbiakban hallgassunk meg egy rövid zenerészletet - Vivaldi: Négy évszak című művéböl - különböző paraméterekkel digitalizálva. A négy részre osztott interaktív ábrán a felső kettő wav kiterjesztésű, az alsó kettő mp3. Sorrendben: 44k 16bit- az etalon CD minőség, 11k 8bit - ekkor rosszabb minőséget kell halljunk, majd alul 128 kbit/s adatsebességű és 32 kbit/s –os mp3 tömörítésű anyag, ez utóbbi szintén igen zajos, gyenge minőségű. A különbségek jobban érzékelhetők, ha a hangrendszerünk jó minőségű és a mintákat elég hangosan hallgatjuk meg, odafigyelve a különbségekre.

1.11 ábra Különböző minőséggel digitalizált hanganyagok- interaktív

Ma már a háttértárak kapacitása nagy, az internet gyors, a telefon memóriája, a kártyák kapacitása nagy, semmi okunk a spórolásra. Válasszunk tehát minél nagyobb adatsebességet.

Alkalmazzuk lehetőség szerint a kevésbé elterjedt, de jobb wma formátumot, ez ugyanazon adatsebesség mellett jobb hangminőséget ad.

Az AAC(Advanced Audio Coding) tömörítési eljárás az Apple cég egyre népszerűbb mobil eszközei miatt lett közismert. A több cég által közösen kifejlesztett formátum ugyanazon bitsebesség mellett jobb mint az mp3. Mivel az MPEG-2 és MPEG-4 szabványokba is bekerült, filmek hangjánál is gyakran alkalmazzák.

Az AC-3 formátum a Dolby Digital házimozi változata, egy adattömörítési és zajcsökkentési eljárás egyben, melynek adatsebessége 5.1 csatorna esetén 384 kbps. Elsősorban filmeknél találkozhatunk vele.

Hangtömörítésekről még sok-sok helyen olvashatunk.[7] Sok esetben, amikorra egy szakkönyv megjelenik már újabb megoldások is megjelennek, így naprakész követésük leginkább a megbízható internetes források alapján lehetséges.

Nem tértünk ki tehát minden egyes tömörítési formátumra, de az alábbi ábrán láthatjuk, hogy egy jobb hangszerkesztő szoftver export menüjében sok formátumból választhatunk.

Olvassuk el a kiválasztott formátum paramétereit a megjelenő ablakban és ennek ismeretében döntsünk. Törekedjünk elterjedt formátumok használatára.

Az Adobe Audition 3.0 hangszerkesztő szoftver export menüjét láthatjuk, vagyis, hogy milyen tömörítésű, kiterjesztésű anyagot tudunk kódolni a szerkesztett anyagból.
1.12 ábra Egy hangszerkesztő szoftver export menüje