TopTeknisk ordbogH.264 - video kodning standard

H.264 - video kodning standard

I 2003 H.264 standard blev vedtaget, også kendt som AVC (Advanced Video Coding), som 10. del af MPEG-4 standard.

 

H.264 standard, på samme måde som i tidligere MPEG-2 og MPEG-4, bruger differential kompression, dvs. det aktuelle billede er skabt på baggrund af en eller flere tidligere billeder og forskelle, der fandt sted mellem dem i tide. Men H.264 bruger en række forbedringer. På den ene side er de betydeligt øget efterspørgslen efter computerkraft under indkodning, men på den anden væsentligt reducere transmissionshastigheden uden at kvaliteten af billedet.

 

Et vigtigt element i H.264-komprimering, er forudsigelsen af billeder (inter-image forudsigelse). Den består i at forudsige det næste kodede billede baseret på tidligere indkodede og dekodede billeder. Det fungerer nøjagtig den samme som i koderen og dekoderen, således at dekoderen kan reproducere det kodede billede baseret på billedet forudsigelsesfejlen, betegnet i indkoderen som forskellen mellem den oprindelige kodede billede og dets forudsigelse. Så de successive billeder ikke bliver sendt, men kun forudsigelsesfejl (forventninger), der med gode algoritmer, ikke indeholder en masse oplysninger og kan kodes ved hjælp af ikke så mange bits.

 

I H.264-komprimering, kan vi skelne mellem tre typer af rammer: I - intrakodet, P - Intelligent, B - Bi-prædiktiv.

 

Fig. 1. Prøve registrering af hver ramme af sekvenser, hvor tre rammetyper er til stede

 

t - Tid

I rammetype indeholder fuldstændige oplysninger om det pågældende billede. P frames indeholder oplysninger om ændringer mellem tilstødende frames P eller I (det resulterende billede er skabt på grundlag af netop sådanne oplysninger). B rammer er de billeder, der kodes ved hjælp af to referencebilleder, nemlig en før det kodede billede og et præsenteret i given sekvens efter det kodede billede. I B type billeder de mest lignende blokke (microblocks) af prøverne er udvalgt fra to reference billeder eller bestemmes som et gennemsnit af blokke fra begge reference billeder. Størrelsen af ​​hver ramme afhænger naturligvis af mange faktorer. Det kan tilnærmelsesvis antages, at P frames tegner sig for omkring 60% af størrelsen af ​​ I rammer og B frames kan kun have 10% af deres volumen. Det kan derfor let trækkes, at jo mere af fortløbende B rammetype i en given sekvens, jo større er kompressionen. Ikke nødvendigvis det indebærer en forringelse af billedkvaliteten.

 

Nedenfor præsenteres et eksempel sammenligning af kvaliteten af tre kompression standarder som peak signal-til-støj-forhold (PSNR), afhængigt af bit transmissionshastighed.

 

Fig. 2. Sammenligning af H.264, MPEG4 og JPEG-standarder

 

X - Bit transmissionshastighed

Y - Peak signal-til-støj-forhold (PSNR)

Nedenfor er listet nogle af de forbedringer og ændringer, der adskiller H.264 mod ældre standarder, ved hjælp af hybrid kodning med inter-billede forudsigelse med bevægelseskompensation.

 

1. Variabel blokstørrelse for bevægelse kompensation. Erstatningen bevægelse kan ske ikke kun i forhold til hele makroblokke, men også til dele af dem. Så de er tildelt separate bevægelsesvektorer. De mindste blokke har størrelse (4x4) luminans point. Dette resulterer i mindre forudsigelsesfejl der kan præsenteres ved hjælp af blot få bit.


to. Motion forudsigelse med en nøjagtighed på 1/4 pixel sampling interval. Høj nøjagtighed bevægelsesvektorer giver mulighed for en mere præcis forudsigelse med bevægelseskompensation.


tre. Anvendelsen af flere reference billeder - anvendelse af langtidshukommelse, der er nyttige i forudsigelsen af åbenbarede områder.


tre. Anvendelsen af flere reference billeder - anvendelse af langtidshukommelse, der er nyttige i forudsigelsen af åbenbarede områder.


5. De-blokerende filter fjerner virkningerne af blokke,der optræder i forudsagte billeder ved høj kompression.


6. Cosinus transformation opererer på små blokke - (4x4) luminans prøver og (2x2) krominans prøver, som giver en bedre tilpasning til de lokale billedets egenskaber.


7. Adaptive entropi kodning: CAVLC (Context-Adaptive Variable Length Coding) - med variabel ordlængde, og CABAC (kontekstbaseret Binary aritmetisk kodning) - mere kompliceret adaptive aritmetisk kodning, der gør det muligt at opnå en stærkere kompression.

For at drage fuld fordel af H.264 standard kapacitet bør koderen tillade gør optimale valg mellem forskellige mulige kodning tilstande. Brugen af H.264 er af stor betydning for CCTV-systemer, eftersom at reducere antallet af billedtransmission uden kvalitetstab tillader overførsel af større antal kanaler i en bedre kvalitet.