TopTeknisk ordbogKompression

Kompression

Grundlæggende spørgsmål

 

Originale data, der repræsenterer billeder og visuelle sekvenser optaget i RGB-format indeholder overdrevne og ubetydelig information. Overdreven oplysninger kan gendannes baseret på andre data vedrørende det samme billede. Ubetydelig oplysninger er oplysninger, hvis sletning ikke resulterer i nogen billedforringelse. Strukturen i komprimeringsalgoritmer giver mulighed for automatisk vurdering af information, hvilken resulterer i fastlæggelsen af ubetydelig oplysninger, som forårsager deformation næsten ikke mærkbar for en observatør. Kompressionsniveauet afhænger af billedindholdet og et tilladt tab i et billedkvalitet. Diagrammet nedenfor (fig. 1) præsenterer en teoretisk sammenhæng mellem en datastrøm og deformation.

 

Fig. 1. Image deformation i funktionen af datastrøm volumen

 

A - Data stråle B - Deformation

Kompression deler sig i inde-billede og inter-billede kompression. I det første tilfælde hele billedet kodes uanset de resterende billedsekvens. I det andet tilfælde kodningen afhænger af de foregående og følgende rammer.

 

Farvepræsentation

 

Normalt komprimeres farvebilleder. Billeder opnås i skærme, ved at blande tre grundfarver: rød, grøn og blå (RGB). Hver pixel er repræsenteret ved summen af sådanne tre komponenter. Desværre sådanne data har et stort volumen. På grund af specifikken af det menneskelige øje, er det bedre at gemme data i form af luminans Y og to differentiale krominanser Cr og Cb, hvor:

 

Y = 0.299R + 0.587G + 0.114B,
Cb = 0.564(B-Y), Cr = 0.713(R-Y). 

En fordel er, at det menneskelige øje er mest følsomt over for ændringer i lysstyrken af punkter, der repræsenteres af luminans og den er mindre følsom over for farveændring repræsenteret af krominans. Et krominanssignal kan være genstand for decimering. I analoge tv-systemer, såsom PAL, SECAM eller NTSC, denne egenskab blev brugt og cirka dobbelt så mindre bånd var beregnet til krominans signaloverførsel uden tab af kvalitetsbilledet.

 

Inde-billede kompression

 

Essensen af de moderne inter-billede kompression teknikker er faktummet, at spektret af det visuelle signal er stærkt fokuseret omkring de laveste frekvenser. Derfor er det nok til at beregne signal spektrum og gemme kun få koefficienter med betydelig indvirkning (for det meste med laveste frekvenser), og de resterende (for det meste med højeste frekvenser) kan optages på en virkelig lav mængde af bits.

 

I praksis er billederne opdelt i 8x8 blokke af punkter og en cosinus transformation (modificeret Fourier transformation) beregnes. Den modtagende talsekvens er delt af en særlig kvantiseringstabel. Som et resultat af denne operation får vi mange gentagne nuller. Den opnåede repræsentation registreres i følgende par: antallet af nuller, værdien af en koefficient forskellig fra nul. De opnåede resultater registreres ved hjælp af koder med varieret bitlængde. Det betyder, at par, som er mere almindelige tildeles koder med lavere antal bits; dem, der er sjældnere tildeles koder med højere antal bit.

 

Inter-billede kompression

 

Essensen af inter-billede kodning gør brug af det faktum, at den næste og den foregående ramme i videosekvensen er generelt meget ens. Det er tilstrækkeligt at sende forudsigelsesfejl, som er forskellen mellem billedet og dets forudsigelse. Det forventes, at det næste billede er identisk med det foregående.

 

I mere avancerede indkodere bevægelseskompensation bruges til at forudsige. For 16x16 kvadrater af luminans prøver, er de fleste lignende firkanter søgt efter i det næste billede. Forskellene i lokaliseringen af disse firkanter er bevægelsesvektorer. Med brug af bevægelseskompensation eller uden og afhængigt af indkoderen er det forudsagte billede genereret og sammenlignet med det faktiske. Forskellen, der kodes som i inde-billede kodningen sendes til modtageren.

 

Fig. 2. Et princip om bevægelsesforudsigelse i inde-billede kodning

 

A - 16x16 pixels blok i det foregående billede B - Mest lignende 16x16 pixels blok i det aktuelle billede