Video tömörítése

Ez a fejezet lehetne nagyon hosszú is, hiszen a videojel tömörítésének ma is, de már a kilencvenes évek közepén is nagyon sok módja volt. A múltat nem érdemes nagyon bolygatni, a jelen természetesen fontos, a jövőről meg nem tudjuk, hogy mit tartogat. Inkább csak az elveket fektetjük le, hogy megértsük a tömörítésfajták lényegét. Ezek mindegyike látásunk gyengeségeit használja ki, azt, hogy a gyorsan változó képkockák közti apró változásokat nem vesszük észre, és gyenge a színérzékelésünk. Nem célunk minél több formátum tárgyalása ez számtalan helyen megtalálható az interneten és a szakirodalomban. A mérföldkövek, az elvek megismerése elegendő ahhoz, hogy akit érdekel az a részletesebb leírásokban eligazodjon.

A videotömörítés kezdetei, elvei

Az 1990-es évek elején a hardvertechnológia olyan fejlettségi szinten állt, hogy a processzor órajele, háttértára, memóriája, korlátozott mértékű mozgóképtárolást és megjelenítést tett csak lehetővé. Például 1992-ben még csak egy 160*120-as felbontású videojelet lehetett PC-n biztonságosan (akadásmentesen) lejátszani. Ez csak a képernyő negyed részén adott elfogadható képet. Ugyanekkor a VHS kazetta kb. 576*240-es képminőséget szolgáltatott. Ekkor tehát az analóg amatőr video, jobb minőségű volt, mint a digitális számítógép képe. A videojel adatfolyama a számítógép technikai korlátai miatt, csak kis bitsebességű lehetett.

Mozgókép tömörítésére két alapvető mód illetve azok kombinációja lehetséges. Először csak egy képkockán belül tömörítünk valamilyen eljárással, ezt az angol nyelv szóhasználatával intraframe-es, képkockán belüli tömörítésnek nevezzük. Ezután, figyelembe vehetjük, hogy két egymás után következő képkocka sok esetben nem is nagyon különbözik egymástól. Előfordulhat, hogy akár 90%-ban azonosak, ezt felesleges lenne újra letárolni. Ezt a lehetőséget képkockák közötti - szaknyelven interframe-es - tömörítésnek nevezzük. Ezek módja, algoritmusa, arányai, az adatok kisebb-nagyobb mértékű elhanyagolása számtalan eljárást (kodeket) alakított ki az elmúlt két évtizedben.

A tömörítési módokat más csoportosításban két osztályba sorolhatjuk: veszteségmentes és veszteséges kategóriába. Értelemszerűen a veszteségmentes tömörítés esetén nem veszítünk el információt, a visszaalakítás (dekódolás) után az eredetivel megegyező minőséget kapunk, a fájlméret azonban ebben az esetben kevésbé csökken.

Veszteséges tömörítés esetén vagy a pixelek számában, vagy azok jellemzőinek tárolásában, vagy az egymást követő képkockák változásának tekintetében veszítünk adatokat, ilyen módon akár jelentősebb fájlméret megtakarítást is elérhetünk, de csak a minőség rovására. Az első tömörítési módok ilyenek voltak, hiszen még csak az volt a cél, hogy a számítógép le tudja játszani a mozgóképet.

Néhány veszteséges tömörítés

Az első tömörítési mód a Microsoft által kifejlesztett AVI rövidítésű formátum. Azt jelentette, hogy a kiolvasás gyorsítására a gép az audiót és a videót egy fájlba csomagolta (audio video interleave, 1992). Napjainkig nagyon sokféle tömörítés avi jellegű, tehát ez ma már egy gyűjtőfogalom, mert az avi tömörítések ma sokféle, változó minőségű csoportot alkotnak. Eleinte a már említett gyengített felbontásokban használták 160*120, 320*240 képponttal. Ezek a képek a kontúrok mentén képződő lépcsőhatás miatt teljes képernyőn nem élvezhetők. A 640*480 már kisebb képernyőn is megfelelő lehet, majd a 800*600, 1024*768 felbontás a nagyobb képernyőn, esetleg videoprojektoron kivetítve is, az 1-2 méteres átlójú képig élvezhetők.

A minőséget azonban nem csak a felbontás (mintavételezés), hanem a képjellemzők (színek, világosságjel) tárolása (színmélység, bitmélység) is meghatározzák. Jellemezhetjük a tárolt képet egyetlen adattal, az adatsebességgel, vagyis hogy egy másodpercnyi anyag hány biten tárolódik. Mégsem véletlen, hogy sokféle algoritmust találtak ki, hiszen vannak hatékonyabbak, és kevésbé jók. Mást kell alkalmazni egy statikusabb, mást egy gyorsan változó képhez. A videoszerkesztő programok export menüjében számtalan lehetőség van, sok próba és tapasztalat kell a paraméterek finombeállítására, hogy optimálisan állítsuk be az értékeket.

Az Apple cég dolgozta ki a Quick Time tömörítést. Számos verziója született, a korai kisfelbontású, 15fps (frame per secundum) sebességű képeket teljes képernyős és 25fps sebességű szabvány váltotta, mely már windows platformon is megtekinthető, ez a verzió (QT6, 2002) már MPEG-4 tömörítésen alapult. A 7. verzió 2005-től H.264/MPEG-4 kodekkel HD anyagok tömörítésére is alkalmas. Ez gyakori tömörítési formátum digitális fényképezőgépeknél is (mov).[29]

Az FLV formátum 2003-ban jelent meg, világszerte a legelterjedtebb, az ún. streaming média csoportba tartozik. Tehát itt a film letöltésének megkezdésével rögtön el is indul a lejátszás. Amióta az Adobe cég integrálta a Macromédiát az Adobe szoftverek is támogatják ezt a formátumot. Többféle kodekkel is készülhet, a 2008-as megjelenésű „on VP6” igen jó képminőséget ad, szerény tárhelyigény mellett.[30]

Az MPEG csoport

A Moving Picture Expert Group néven létrejött bizottság kidolgozott egy szabványsorozatot a mozgóképek tömörítésére. Ezek a tömörítések a képkockán belüli tömörítés mellett igen erősen támaszkodnak a képkockák közötti tömörítési lehetőségekre.

A rendszer a képkockán belül blokkokra osztja az állókép területét, és ezen belül DCT algoritmust alkalmaz hasonlóan a JPEG eljáráshoz. Az egymás utáni képkockákat 3 különböző módon képezi. Az I típusú képek nagy pontosságúak, csak önmagukban tömörítettek, méretük viszonylag nagy. A P típusú képek esetén az eljárás a megelőző I és P típusú képekhez viszonyított változást tartalmazza csak. A legkisebb méretű (tárhelyigényű) képek a B típusúak, ezek képtartalmát az előző és utána következő képek alapján jósolja meg (számítja ki) a gép. Három különböző módon megválasztott képtípus csoportokat láthatunk az alábbi ábrán.

A képen csak I framek sorozatát, I és P típusú képkockák sorozatát, végül I, B és P adott ritmusban váltakozó sorozatát láthatjuk.
5.15 ábra Az I, P és B típusú képek különböző ismétlődései

Az 1992-es MPEG-1 alkalmazkodva a számítógépek teljesítményéhez egy negyed képernyőnyi méretben, 352*288 felbontású (PAL rendszerben), 1,5Mbit/s adatsebességű jelfolyam. Nagyobb képernyőn nem élvezhető, pixeles, ferde vonalak mentén lépcsőhatás alakul ki.

Az MPEG-2 1994-ben már egész képernyőn élvezetes képet adó tömörítéstípus, 704*576-os felbontással, az adatsebesség 4-15Mbit/s. Ez a formátum lett a video DVD-k szabványos tömörítése. (Az MPEG-3 nem született meg.)

Az MPEG-4 1998-2000 között több változatban jelent meg, eredeti célja a kis adatátviteli sebességű rendszerek, internetes, mobiltelefonos, multimédiás alkalmazások támogatása lett volna. Végül integrálta az 1-es és 2-es verziókat is és a kis adatsebességtől a nagyig mindent támogat, a HD felbontást is, ez lett az ún. 10. réteg a H.264 kodekben. MPEG-4-es nagy hatékonyságú tömörítést használnak a DVB-T földi digitális műsorszórás kódolásánál Magyarországon, de a Blu-ray Disc tömörítésénél is.

Veszteségmentes, kvázi veszteségmentes tömörítések

Állóképtömörítési módok is használhatók a mozgókép tömörítésére, ilyenkor nem vesszük figyelembe, hogy néha csak kevés változás van két egymást követő képkocka között. Az ilyen esetben, amikor az állókép tömörítési mód veszteségmentes, a mozgókép is az lesz. Egy köztes kategóriát is be lehetne vezetni, ha az adatok elhanyagolása oly mértékű, hogy átlagos megjelenítőn, átlagos néző számára nem vehető észre a kép lebutítása ezt egy kvázi veszteségmentes tömörítésnek nevezhetnénk. Gondoljunk arra az 5.5.2 fejezetben kiszámolt értékre, hogy egy órányi SD (nem HD!) video, több mint 100 GB méretű. Ezért bátran állíthatjuk, hogy tömörítetlen videot a gyakorlatban szinte nem is használnak.

A GIF tömörítés veszteségmentes, de nem a fotorealisztikus képek tömörítésére, hanem vonalas ábrák, kevés színt tartalmazó rajzok, animációk esetén ajánlott. Ezeknél ténylegesen jó hatékonyságú, veszteségmentes tömörítés érhető el (akár 20-80% helymegtakarítás).

A DV AVI file a DV szabványnak megfelelő felbontásúra tömöríti a képet. Igen nagy méretű fájlokat kapunk, viszont előnye az elmondott kompatibilitás és jó minőség. Ez egy nagyon jó univerzális formátum (csak képkockán belüli tömörítés), amelyet az ismert videoszerkesztő programok mindegyike felismer.

MJPEG (Motion JPEG) az állóképek tömörítésére kidolgozott JPEG alkalmazása a mozgókép minden képkockájára. Ha a JPEG minőségét jó szinten tartjuk, szinte észrevehetetlen a tömörítés. Mivel nincs képkockák közötti tömörítés, itt is elmondhatjuk, hogy a videoszerkesztő programok elterjedt formátuma, viszont ebben az esetben nem igaz a különböző gyártók közti kompatibilitás.

Minden tömörítésről elmondható, hogy hardveres és szoftveres úton is meg lehet valósítani. Hardveres esetben egy komolyabb digitalizáló kártyát kell beszereznünk, ekkor valós időben jön létre a tömörítés, szoftveres eljárás esetén a beállított értékek és gépünk gyorsasága szabja meg a „renderelési” időt. Ez a formátumtól, felbontástól, adatsebességtől függően egy órányi anyag esetén pár perctől kezdve több órát is igénybe vehet.

HD video tömörítése

Napjaink (2004-es megjelenése óta) legelterjedtebb formátuma a H.264/MPEG4-part 10 AVC (advanced video coding), egyre nagyobb teret hódít. Bár voltak korábbi szabványok a HD jel tömörítésére (274M – 1080i; 275M – 1080p; 296M – 720p) a 2010-es évekre a BD lemezeken, Apple Quick Time tömörítésben, IPTV, DVB-T, DVB-C alkalmazásokban, kamerákban, mérhetetlen mennyiségben a youtube-on, egyelőre versenytárs nélküli, annak ellenére, hogy 2011-ben a VP8/WebM, 2012-ben pedig a H.265 HEVC bejelentésre került. A versenyt minden bizonnyal a mobil szegmens is jelentősen befolyásolja, ezért a jövőről nem tudunk semmi biztosat mondani.

A H.264/MPEG4 AVC kódolásban egyaránt alkalmazhatjuk a már említett 4:4:4, 4:2:2, 4:1:1, 4:2:0 típusú mintavételezéseket az YUV színtérben. A makroblokk képzés (16*16, 8*8, 4*4) majd DCT algoritmus alkalmazása után az I,B, P framek létrehozása következik. Ez tehát egy igen jó hatékonyságú veszteséges tömörítés, amely egyaránt használ intraframe és interframe megoldásokat.

A természettudományos eredmények video publikációjánál elsősorban vizsgáljuk meg, hogy szükség van-e nagy felbontású anyag készítésére. Nem a HD kamerával történő forgatással van probléma, nem is az utómunkával (bár ebben az esetben egy jó erős számítógépre van szükségünk), hanem a nehézségekkel, amik ezek után jönnek.

A felhasználók nem biztos, hogy rendelkeznek HD anyag lejátszására alkalmas berendezéssel, szoftverrel, megjelenítővel. Bármelyik hiánya esetén elesnek a HD biztosította többlet élménytől. Ezért, ha a jelenség nem feltétlenül igényli a nagy felbontást, jobb ha eltekintünk a HD anyag készítésétől. Szélesebb körben tudjuk így publikálni anyagunkat.

Igen ajánlott a HD alkalmazása, ha munkánkat fontosabb bemutatásra szánjuk, televíziós csatornának, nemzetközi bemutatásra, terjesztésre, az utókornak történő archiválásra. Külön kérdés az ilyen anyagok hosszabb idejű tárolása.

Az alábbi félperces videofilm a népszerű tömörített videoformátumok összehasonlítására ad lehetőséget. Egy full HD felbontásban leforgatott anyagot először wmv, majd MPEG-2 (m2v) formátumba tömörítettünk azonos paramétereket választva (6Mbps). Így egy SD anyagot kaptunk, ezek a formátumok kerültek a képernyő felső térfelére. Ezután a full HD felbontást meghagyva, de szintén 6 Mbps adatsebességű anyagokat készítettünk az elterjedt flv és a H264 kodekek alkalmazásával. Ezek az oszott képernyő alsó felébe kerültek. A négy anyagot ezután egy, az előző formátumok által kialakított minőséget nem befolyásoló igen nagy (32-40 Mbps) adatsebességű tömörítéssel foglaltuk egy HD felbontású projektbe. Jó felbontású és nagy képernyőn észrevehetünk különbségeket a közeli finom részletekben, a totálképekben, a sötét képernyőrészletekben és a színek telítettségében is.

A négyes osztású képernyő térnegyedeiben négy elterjedt tömörítési mód képének összehasonlítására van lehetőség.
5.16 ábra Azonos, full HD kiindulási anyagból gyártott WMV, MPEG-2, FLV és H.264 tömörítésű anyagok összehasonlítása - video

Említsük meg, hogy az MPEG csoport legújabb tömörítő szabványa a H.265 jelzésű 2012-ben került bejelentésre, e szabvány célja, hogy a HD anyagok tömörítése még hatékonyabb legyen. HEVC rövidítése a High Efficiency Video Coding nevet takarja. Ennek elterjedése még a jövő kérdése, de ezt minden bizonnyal segíteni fogja, hogy majdnem a felére csökkenti a szükséges adatsebességet. A televíziós csatornákból így több fér el egy adott sávszélességen belül és várható, hogy a mobil platformok hamarosan alkalmazni fogják.