TopDictionnaire techniqueH.264 - une norme de codage vidéo

H.264 - une norme de codage vidéo

En 2003, l’on a admis une norme H.264, connue aussi sous le nom de AVC (Advanced Video Coding), en tant que la 10ième partie de la norme MPEG-4.

 

La norme H.264, comme dans celles précédentes MPEG-2 et MPEG-4, utilise une compression différentielle, c’est-à-dire une image actuelle est créée à la base d’une ou de plusieurs images précédentes et de différences entre elles qui ont apparu entretemps. Cependant, en cas d’H.264 l’on a introduit bien des améliorations. D’une part, elles augmentent considérablement leur puissance de calcul lors du codage, mais d’autre part, elles réduisent de manière considérable la vitesse de transmission sans compromettre la qualité de l'image

 

Un élément important de compression de l’H.264 est une prédiction d’images (prédiction inter-image). Elle consiste à prédire la prochaine image codée à partir d'images préalablement codées et décodées. Elle fonctionne comme dans le codeur et le décodeur, c’est pour cette raison que le décodeur peut reproduire l'image codée à base d'erreur de prédiction définie dans le codeur en tant que différence entre l'image de départ codée et sa prédiction codée. Par conséquent, les images successives ne sont pas transmises ; seules les erreurs de prédiction sont transmises ; il est possible de les coder avec peu de bits, si elles ont de bons algorithmes et ne contiennent pas beaucoup d'informations.

 

La compression H.264 est équipée en 3 types de cadres : I – Intra Coded, P – Predictive, B – Bi-predictive.

 

Fig. 1. Exemple d'enregistrement des images particulières d'une séquence où il y a trois types de cadres.

 

t - Temps

Les cadres type I contiennent toutes les informations sur une image donnée. Les cadres P contiennent des informations sur des modifications entre les cadres voisines P ou I (l'image résultante est créée à base de telles informations). Les cadres B ce sont des images codées à l’aide de deux images de référence à savoir l’une avant l’image codée et l’autre présentée dans une séquence donnée après l’image codée. En ce qui concerne les images type B, des blocs similaires (macroblocs) des échantillons y sont sélectionnés à partir des deux images de référence ou ils sont déterminés en tant que moyenne des deux blocs des images de référence. Evidemment, la taille des cadres particuliers dépend de nombreux facteurs. On peut supposer que les cadres P constituent environ 60% de la taille des cadres du type I, et les cadres B ne peuvent compter que 10% de leur volume. Il en résulte que plus de cadres successives type B il y a dans une séquence donnée, plus grande est la compression. Cela ne doit pas nécessairesment nuire la qualité d’image

 

Vous trouverez ci-dessous un exemple de comparaisn de la qualité pour trois normes de compression comme une valeur supérieure du rapport signal sur bruit (PSNR — Peak Signal-to-Noise Ratio) en fonction de la vitesse de transmission de bits

 

Fig. 2. Comparaison des formats H.264, MPEG-4 et JPEG

 

X - Vitesse de transmission des bits

Y - Valeur supérieure du rapport signal sur bruit (PSNR)

Vous trouverez ci-dessous certaines améliorations et modifications qui distinguent la norme H.264 parmi les anciennes versions des normes utilisant un codage hybride à une prédiction inter-image avec une compensation de mouvement

 

1. La taille variable des blocs pour la compensation de mouvement. La compensation de mouvement est possible non seulement par rapport aux macroblocs entiers mais aussi par rapport à leurs parties. Le cas échéant, des vecteurs de mouvement différents sont leur attribués. La taille des petits blocs est de (4x4) points de luminances. Cela permet d’obtenir des erreurs de prédiction moins importantes et elles peuvent être présentées avec peu de bits.


2. La prédiction du mouvement dont la précision est jusqu’à 1/4 d’espace d’échantillonage de l’image. Grâce à une grande précision des vecteurs de mouvement nous avons une prédiction plus précise avec une compensation de mouvement.


3. L’utilisation des plusieurs images de référence – l’utilisation d’un mémoire à long terme, utile dans une prédiction des espaces découverts.


4. Une prédiction directionnelle d’inter-image pour les macroblocs codés à l’inter-image.


5. Un filtre de déblocage élimine des effets de bloc qui apparaissent dans des images de prédiction en cas de compression forte.


6. Une transformation en cosinus fonctionne sur de petits blocs - (4x4) d’échantillons de luminance et (2x2) d’échantillons de chrominance ce qui rend possible une meilleure adaptation aux propriétés locales de l’image.


7. Le codage entropique adaptatif: CAVLC (Context-Adaptive Variable Length Coding) – avec une longueur variable de la parole et CABAC (Context-Based Binary Arithmetic Coding) – un codage arithmétique adaptatif plus compliqué permettant d’obtenir une compression plus forte.

Afin d’utiliser toutes les possibilités de la norme H.264, parmi les différents modes possibles de codage, il convient d’en choisir ceux les plus optimaux. L'application de la H.264 est très importante pour les systèmes de la vidéosurveillance car la réduction de la vitesse de transmission des images sans nuire leur qualité permet de transmetre un plus grand nombre de canaux en une meilleure qualité.