TopTechnický slovníkH.264 - štandard kódovania obrazu

H.264 - štandard kódovania obrazu

V roku 2003 bol prijatý štandard H.264, známy tiež ako AVC (Advanced Video Coding), ako 10. časť štandardu MPEG-4.

 

Štandard H.264 využíva, podobne ako pri predošlom MPEG-2 a MPEG-4, diferenciálnu kompresiu, tzn., že aktuálny obraz je tvorený na základe jedného alebo niekoľkých predchádzajúcich a rozdielov, ktoré sa medzi nimi v tomto čase vyskytli. Ale v H.264 bol použitý celý rad vylepšení. Na jednej strane výrazne zvyšuje nároky na výpočtový výkon počas kódovania, ale na druhej strane značne redukuje rýchlosť prenosu pri nemennej kvalite obrazu.

 

Dôležitou súčasťou kompresie H.264 je predvídanie obrazov (medziobrazová predikcia). Spočíva v predvídaní ďalšieho kódovaného obrazu na základe predtým zakódovaných a dekódovaných obrazov. Pôsobí úplne rovnako na kodér i dekodér, dekodér vďaka tomu môže prehrať zakódovaný obraz na základe chyby predvídania obrazu, určeného na kodéri ako rozdiel medzi originálnym kódovaným obrazom a jeho predikcií. Takže sa nezasielajú po sebe idúce obrazy, ale len chyby predikcie (predvídanie), ktoré pri dobrých algoritmoch neobsahujú veľa informácií a možno ich zakódovať s pomocou mála bitov.

 

V kompresii H.264 môžeme rozlíšiť 3 druhy rámčekov: I – Intra Coded, P – Predictive, B – Bi-predictive.

 

Obr. 1. Ukážkový záznam jednotlivých políčok sekvencie, v ktorej sa vyskytujú tri druhy rámčekov

 

t - Čas

Rámčeky typu I obsahujú kompletné informácie o danom obraze. Rámčeky P obsahujú informácie o zmenách medzi susednými rámčekmi P alebo I (výsledný obraz je tvorený na základe práve týchto informácií). Rámčeky B sú obrazy kódované s pomocou dvoch referenčných obrazov, konkrétne jedného pred kódovaným obrazom a jedného prezentovaného v danej sekvencii po kódovanom obraze. Na obrazoch typu B sú tie najpodobnejšie si bloky (makrobloky) vzoriek vyberané z oboch referenčných obrazov alebo sú určené ako priemer z blokov z oboch referenčných obrazov. Veľkosť jednotlivých rámčekov samozrejme závisí na mnohých faktoroch. Približne môžeme prijať, že rámčeky P tvoria cca 60% veľkosti rámčekov typu I a rámčeky B môžu mať len 10% ich objemu. Môžeme tak ľahko učiniť záver, že čím viac sa v danej sekvencii po sebe vyskytujú rámčeky typu B, tým väčšia je jej kompresia. Nemusí sa to nevyhnutne spájať so zhoršením kvality obrazu.

 

Nižšie sú predstavené príklady porovnania kvality pre tri štandardy kompresie, ako vrcholovú hodnotu pomeru signál šum (PSNR — Peak Signal-to-Noise Ratio) v závislosti na rýchlosti prenosu bitov.

 

Obr. 2. Porovnanie formátov H.264, MPEG-4 a JPEG

 

X - Rýchlosť prenosu bitov

Y - Vrcholná hodnota pomeru signál-šum (PSNR)

Nižšie sú predstavené niektoré z vylepšení a modifikácií, ktoré H.264 odlišujú od starších štandardov, ktoré využívajú hybridné kódovanie s medziobrazovou predikciou (medziobrazovým predvídaním) s kompenzáciou pohybu.

 

1. Premenlivá veľkosť blokov pre kompenzáciu pohybu. Kompenzáciu pohybu možno vykonávať nielen vo vzťahu k celým makroblokom, ale aj k ich častiam. Sú k nim potom priraďované samostatné vektory pohybu. Najmenšie bloky majú veľkosť (4x4) jasové body. Vďaka tomu je dosiahnuté menších chýb predikcie, ktoré môžu byť predstavené s pomocou mála bitov.


2. Predvídanie pohybu s presnosťou do 1/4 intervalu vzorkovania obrazu. Veľká presnosť vektorov pohybu umožňuje presnejšiu predikciu s kompenzáciou pohybu.


3. Využívanie mnohých referenčných obrazov - využívanie dlhodobej pamäte, užitočnej pri predikcii odkrývaných oblastí.


4. Smerové intra predikcie (predvídanie) pre intra kódované makrobloky.


5. Deblokujúci filter odstraňuje blokové efekty, ktoré sa vyskytujú v obrazoch predikcie pri silnej kompresii.


6. Kosínusová transformácia operuje na malých blokoch - (4x4) vzoriek jasu a (2x2) vzorkách chrominancie, čo umožňuje lepšiu adaptáciu lokálnym vlastnostiam obrazu.


7. Adaptívne entropné kódovanie: CAVLC (Context-Adaptive Variable Length Coding) – so zmenou dĺžky slov a CABAC (Context-Based Binary Arithmetic Coding) – komplikovanejšie adaptačné aritmetické kódovanie, ktoré umožňuje dosiahnuť silnejšie kompresie.

Pre plné využitie možností štandardu H.264 musí byť na kodéri urobená optimálna voľba z rôznych možných režimov kódovania. Použitie H.264 má veľký význam pre systémy CCTV, pretože zníženie rýchlosti prenosu obrazov bez straty kvality umožňuje prenos pre väčší počet kanálov v lepšej kvalite.