FMUSER Wirless Trasmetti video e audio più facilmente!
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> Afrikaans
sq.fmuser.org -> albanese
ar.fmuser.org -> Arabo
hy.fmuser.org -> Armenian
az.fmuser.org -> Azerbaigiano
eu.fmuser.org -> Basco
be.fmuser.org -> bielorusso
bg.fmuser.org -> Bulgaro
ca.fmuser.org -> Catalano
zh-CN.fmuser.org -> Cinese (semplificato)
zh-TW.fmuser.org -> Cinese (Tradizionale)
hr.fmuser.org -> croato
cs.fmuser.org -> ceco
da.fmuser.org -> danese
nl.fmuser.org -> Olandese
et.fmuser.org -> Estone
tl.fmuser.org -> Filippino
fi.fmuser.org -> finlandese
fr.fmuser.org -> Francese
gl.fmuser.org -> Galiziano
ka.fmuser.org -> georgiano
de.fmuser.org -> tedesco
el.fmuser.org -> Greca
ht.fmuser.org -> Creolo haitiano
iw.fmuser.org -> Ebraico
hi.fmuser.org -> Hindi
hu.fmuser.org -> Hungarian
is.fmuser.org -> Islandese
id.fmuser.org -> Indonesiano
ga.fmuser.org -> Irlandese
it.fmuser.org -> Italiano
ja.fmuser.org -> giapponese
ko.fmuser.org -> coreano
lv.fmuser.org -> Lettone
lt.fmuser.org -> Lithuanian
mk.fmuser.org -> Macedone
ms.fmuser.org -> Malese
mt.fmuser.org -> Maltese
no.fmuser.org -> Norwegian
fa.fmuser.org -> persiano
pl.fmuser.org -> polacco
pt.fmuser.org -> portoghese
ro.fmuser.org -> Romeno
ru.fmuser.org -> Russo
sr.fmuser.org -> Serbo
sk.fmuser.org -> slovacco
sl.fmuser.org -> Sloveno
es.fmuser.org -> spagnolo
sw.fmuser.org -> Swahili
sv.fmuser.org -> svedese
th.fmuser.org -> Thai
tr.fmuser.org -> turco
uk.fmuser.org -> Ucraino
ur.fmuser.org -> Urdu
vi.fmuser.org -> Vietnamita
cy.fmuser.org -> Gallese
yi.fmuser.org -> Yiddish
(1) Informazioni ridondanti del segnale video
Prendendo come esempio il formato componente YUV della registrazione di video digitale, YUV rappresenta rispettivamente la luminosità e due segnali di differenza di colore. Ad esempio, per il sistema pal TV esistente, la frequenza di campionamento del segnale di luminanza è 13.5 mhz; la banda di frequenza del segnale di crominanza è solitamente la metà o meno del segnale di luminosità, che è 6.75 mhz o 3.375 mhz. Prendendo come esempio la frequenza di campionamento di 4: 2: 2, il segnale Y adotta 13.5 mhz, il segnale di crominanza U e V vengono campionati da 6.75 mhz e il segnale di campionamento viene quantizzato di 8 bit, quindi è possibile calcolare la velocità di codice del video digitale come segue:
13.5 * 8 + 6.75 * 8 + 6.75 * 8 = 216 Mbit / s
Se una quantità così grande di dati viene archiviata o trasmessa direttamente, sarà difficile utilizzare la tecnologia di compressione per ridurre il bit rate. Il segnale video digitale può essere compresso secondo due condizioni fondamentali:
L. ridondanza dei dati. Ad esempio, ridondanza spaziale, ridondanza temporale, ridondanza della struttura, ridondanza dell'entropia delle informazioni, ecc., Ovvero, esiste una forte correlazione tra i pixel dell'immagine. L'eliminazione di queste ridondanze non comporta la perdita di informazioni ed è una compressione senza perdite.
L. ridondanza visiva. Alcune caratteristiche degli occhi umani, come la soglia di discriminazione della luminosità, la soglia visiva, sono diverse per sensibilità alla luminosità e alla crominanza, il che rende impossibile introdurre errori appropriati nella codifica e non verranno rilevate. Le caratteristiche visive degli occhi umani possono essere utilizzate per scambiare la compressione dei dati con una certa distorsione oggettiva. Questa compressione è con perdita.
La compressione del segnale video digitale si basa sulle due condizioni precedenti, il che rende i dati video notevolmente compressi, favorendo la trasmissione e l'archiviazione. I metodi comuni di compressione video digitale sono la codifica mista, che consiste nel combinare la codifica della trasformazione, la stima del movimento e la compensazione del movimento e la codifica entropica per comprimere la codifica. Di solito, la codifica della trasformazione viene utilizzata per eliminare la ridondanza intra-frame dell'immagine e la stima del movimento e la compensazione del movimento vengono utilizzate per rimuovere la ridondanza inter-frame dell'immagine e la codifica entropica viene utilizzata per migliorare ulteriormente l'efficienza di compressione. I seguenti tre metodi di codifica della compressione vengono introdotti brevemente.
(a) Metodo di codifica a compressione
(b) Trasforma la codifica
La funzione della codifica della trasformata è trasformare il segnale dell'immagine descritto nel dominio dello spazio nel dominio della frequenza e quindi codificare i coefficienti trasformati. In generale, l'immagine ha una forte correlazione nello spazio e la trasformazione nel dominio della frequenza può realizzare la decorrelazione e la concentrazione di energia. La trasformazione ortogonale comune include la trasformata discreta di Fourier, la trasformata discreta del coseno e così via. La trasformazione discreta del coseno è ampiamente utilizzata nella compressione video digitale.
La trasformata discreta del coseno viene definita trasformata DCT. Può trasformare il blocco dell'immagine di L * l dal dominio dello spazio al dominio della frequenza. Pertanto, nel processo di compressione e codifica dell'immagine basata su DCT, l'immagine deve essere suddivisa in blocchi immagine non sovrapposti. Supponiamo che la dimensione di un'immagine sia 1280 * 720, è divisa in blocchi immagine 160 * 90 con dimensioni 8 * 8 senza sovrapposizione sotto forma di griglia. Quindi la trasformazione DCT può essere eseguita per ogni blocco immagine.
Dopo che il blocco è stato diviso, ogni blocco immagine a 8 * 8 punti viene inviato al codificatore DCT e il blocco immagine 8 * 8 viene trasformato dal dominio spaziale al dominio della frequenza. La figura seguente mostra un esempio di un blocco immagine di 8 * 8 in cui il numero rappresenta il valore di luminosità di ogni pixel. Si può vedere dalla figura che i valori di luminosità di ciascun pixel in questo blocco di immagine sono relativamente uniformi, in particolare il valore di luminosità dei pixel adiacenti non è molto grande, il che indica che il segnale dell'immagine ha una forte correlazione.
Un vero e proprio blocco di immagini 8 * 8
La figura seguente mostra i risultati della trasformazione DCT del blocco immagine nella figura sopra. Si può vedere dalla figura che dopo la trasformazione DCT, il coefficiente di bassa frequenza nell'angolo in alto a sinistra concentra molta energia, mentre l'energia sul coefficiente di alta frequenza nell'angolo in basso a destra è molto piccola.
I coefficienti del blocco dell'immagine dopo la trasformazione DCT
Il segnale deve essere quantificato dopo la trasformazione DCT. Poiché gli occhi umani sono sensibili alle caratteristiche a bassa frequenza delle immagini, come la luminosità complessiva degli oggetti, e non ai dettagli ad alta frequenza nell'immagine, quindi nel processo di trasmissione, le informazioni ad alta frequenza possono essere trasmesse meno o meno, solo la parte a bassa frequenza. Il processo di quantizzazione riduce la trasmissione delle informazioni quantificando i coefficienti della regione a bassa frequenza e la quantizzazione grossolana dei coefficienti nella regione ad alta frequenza, che rimuove le informazioni ad alta frequenza che non sono sensibili agli occhi umani. Pertanto, la quantizzazione è un processo di compressione con perdita e la ragione principale del danno alla qualità nella codifica della compressione video.
Il processo di quantificazione può essere espresso dalla seguente formula:
Tra questi, FQ (U, V) rappresenta il coefficiente DCT dopo la quantizzazione; f (U, V) rappresenta il coefficiente DCT prima della quantizzazione; Q (U, V) rappresenta la matrice di ponderazione di quantizzazione; q è il passo di quantizzazione; round si riferisce al consolidamento e il valore da produrre viene considerato come il valore intero più vicino.
Selezionare ragionevolmente il coefficiente di quantizzazione e il risultato dopo la quantizzazione del blocco immagine trasformato viene mostrato nella figura.
Coefficiente DCT dopo quantificazione
La maggior parte dei coefficienti DCT viene modificata in 0 dopo la quantizzazione, mentre solo pochi coefficienti sono valori diversi da zero. A questo punto, solo questi valori diversi da zero devono essere compressi e codificati.
(b) Codifica entropica
La codifica entropica è denominata perché la lunghezza media del codice dopo la codifica è vicina al valore di entropia della sorgente. La codifica entropica è implementata da VLC (codifica a lunghezza variabile). Il principio di base è quello di dare un codice breve al simbolo con alta probabilità nella sorgente, e di dare un codice lungo al simbolo con una piccola probabilità di accadimento, in modo da ottenere statisticamente la lunghezza media del codice più breve. La codifica a lunghezza variabile di solito include codice Hoffman, codice aritmetico, codice di esecuzione, ecc. La codifica della lunghezza di esecuzione è un metodo di compressione molto semplice, la sua efficienza di compressione non è elevata, ma la velocità di codifica e decodifica è veloce ed è ancora ampiamente utilizzata, soprattutto dopo la trasformazione della codifica, utilizzando la codifica run-length, ha un buon effetto.
Innanzitutto, il coefficiente AC immediatamente successivo al coefficiente DC di uscita del quantizzatore deve essere scansionato in tipo Z (come mostrato nella linea della freccia). Lo Z-scan trasforma il coefficiente di quantizzazione bidimensionale in una sequenza unidimensionale, quindi prosegue la codifica della lunghezza della corsa. Infine, un altro codice a lunghezza variabile viene utilizzato per codificare i dati dopo la codifica di esecuzione, come la codifica Hoffman. Grazie a questo tipo di codifica a lunghezza variabile, l'efficienza della codifica è ulteriormente migliorata.
(c) Stima del movimento e compensazione del movimento
La stima del movimento e la compensazione del movimento sono metodi efficaci per eliminare la correlazione della direzione temporale delle sequenze di immagini. I metodi di trasformazione DCT, quantizzazione e codifica entropica descritti sopra si basano su un'immagine di fotogramma. Attraverso questi metodi, la correlazione spaziale tra i pixel nell'immagine può essere eliminata. Infatti, oltre alla correlazione spaziale, il segnale dell'immagine ha una correlazione temporale. Ad esempio, per i video digitali con sfondo statico come la trasmissione di notiziari e piccoli movimenti del corpo principale dell'immagine, la differenza tra ciascuna immagine è molto piccola e la correlazione tra le immagini è molto grande. In questo caso, non abbiamo bisogno di codificare ogni immagine di fotogramma separatamente, ma possiamo codificare solo le parti modificate di fotogrammi video adiacenti, in modo da ridurre ulteriormente la quantità di dati. Questo lavoro è realizzato dalla stima del movimento e dalla compensazione del movimento.
La tecnologia di stima del movimento generalmente divide l'immagine in ingresso corrente in diversi piccoli sottoblocchi dell'immagine che non si sovrappongono tra loro, ad esempio, la dimensione di un'immagine del fotogramma è 1280 * 720. In primo luogo, è divisa in 40 * 45 blocchi immagine con 16 * 16 dimensioni che non si sovrappongono tra loro sotto forma di griglia, quindi, nell'ambito di una finestra di ricerca dell'immagine precedente o di quest'ultima immagine, trova un blocco per ogni blocco immagine per trovare un blocco immagine nell'ambito di un finestra di ricerca Il blocco di immagini più simile. Il processo di ricerca è chiamato stima del movimento. Calcolando le informazioni sulla posizione tra il blocco immagine più simile e il blocco immagine, è possibile ottenere un vettore di movimento. In questo modo, il blocco immagine corrente può essere sottratto dal blocco immagine più simile indicato dal vettore di movimento dell'immagine di riferimento e si può ottenere un blocco immagine residuo. Poiché ogni valore di pixel nel blocco dell'immagine residua è molto piccolo, è possibile ottenere un rapporto di compressione più elevato nella codifica di compressione. Questo processo di sottrazione è chiamato compensazione del movimento.
Poiché è necessario utilizzare l'immagine di riferimento per la stima del movimento e la compensazione del movimento nel processo di codifica, è molto importante selezionare l'immagine di riferimento. Generalmente, il codificatore divide ogni immagine di frame in ingresso in tre diversi tipi in base alle diverse immagini di riferimento: frame I (intra), frame B (previsione di guida) e frame P (predizione). Come mostrato in figura.
Tipica sequenza della struttura del frame I, B, P.
Come mostrato nella figura, I frame utilizza solo i dati nel frame per la codifica e non necessita di stima del movimento e compensazione del movimento durante il processo di codifica. Ovviamente, poiché I frame non elimina la correlazione della direzione del tempo, il rapporto di compressione è relativamente basso. Nel processo di codifica, il fotogramma P utilizza un fotogramma I anteriore o un fotogramma P come immagine di riferimento per la compensazione del movimento, infatti codifica la differenza tra l'immagine corrente e l'immagine di riferimento. La modalità di codifica del fotogramma B è simile al fotogramma P, l'unica differenza è che deve utilizzare un fotogramma I anteriore o un fotogramma P e un fotogramma I successivo o fotogramma P per prevedere durante il processo di codifica. Pertanto, ogni codifica di frame P deve utilizzare un'immagine di frame come immagine di riferimento, mentre il frame B necessita di due frame come riferimento. Al contrario, il frame B ha un rapporto di compressione più elevato rispetto al frame P.
(d) Codifica mista
Il documento introduce diversi metodi importanti nella compressione e codifica video. Nell'applicazione pratica, questi metodi non sono separati e di solito vengono combinati per ottenere il miglior effetto di compressione. La figura seguente mostra il modello di codifica ibrida (cioè codifica trasformata + stima del movimento e compensazione del movimento + codifica entropica). Il modello è ampiamente utilizzato in MPEG1, MPEG2, H.264 e altri standard. Dalla figura, possiamo vedere che l'immagine corrente in ingresso deve essere prima divisa in blocchi, il blocco dell'immagine ottenuto dal blocco deve essere sottratto dal immagine prevista dopo la compensazione del movimento per ottenere l'immagine della differenza x, quindi vengono eseguite la trasformazione DCT e la quantizzazione per il blocco dell'immagine della differenza. I dati di output quantizzati hanno due posizioni diverse: una è l'invio al codificatore entropico per la codifica e il flusso di codice codificato viene emesso in una cache Salva nel dispositivo e attende la trasmissione. Un'altra applicazione consiste nel contrastare quantificare e invertire la modifica al segnale x ', che aggiunge l'uscita del blocco immagine con la compensazione del movimento per ottenere un nuovo segnale dell'immagine di previsione e invia un nuovo blocco dell'immagine di previsione alla memoria del frame.
|
Inserisci l'email per ricevere una sorpresa
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> Afrikaans
sq.fmuser.org -> albanese
ar.fmuser.org -> Arabo
hy.fmuser.org -> Armenian
az.fmuser.org -> Azerbaigiano
eu.fmuser.org -> Basco
be.fmuser.org -> bielorusso
bg.fmuser.org -> Bulgaro
ca.fmuser.org -> Catalano
zh-CN.fmuser.org -> Cinese (semplificato)
zh-TW.fmuser.org -> Cinese (Tradizionale)
hr.fmuser.org -> croato
cs.fmuser.org -> ceco
da.fmuser.org -> danese
nl.fmuser.org -> Olandese
et.fmuser.org -> Estone
tl.fmuser.org -> Filippino
fi.fmuser.org -> finlandese
fr.fmuser.org -> Francese
gl.fmuser.org -> Galiziano
ka.fmuser.org -> georgiano
de.fmuser.org -> tedesco
el.fmuser.org -> Greca
ht.fmuser.org -> Creolo haitiano
iw.fmuser.org -> Ebraico
hi.fmuser.org -> Hindi
hu.fmuser.org -> Hungarian
is.fmuser.org -> Islandese
id.fmuser.org -> Indonesiano
ga.fmuser.org -> Irlandese
it.fmuser.org -> Italiano
ja.fmuser.org -> giapponese
ko.fmuser.org -> coreano
lv.fmuser.org -> Lettone
lt.fmuser.org -> Lithuanian
mk.fmuser.org -> Macedone
ms.fmuser.org -> Malese
mt.fmuser.org -> Maltese
no.fmuser.org -> Norwegian
fa.fmuser.org -> persiano
pl.fmuser.org -> polacco
pt.fmuser.org -> portoghese
ro.fmuser.org -> Romeno
ru.fmuser.org -> Russo
sr.fmuser.org -> Serbo
sk.fmuser.org -> slovacco
sl.fmuser.org -> Sloveno
es.fmuser.org -> spagnolo
sw.fmuser.org -> Swahili
sv.fmuser.org -> svedese
th.fmuser.org -> Thai
tr.fmuser.org -> turco
uk.fmuser.org -> Ucraino
ur.fmuser.org -> Urdu
vi.fmuser.org -> Vietnamita
cy.fmuser.org -> Gallese
yi.fmuser.org -> Yiddish
FMUSER Wirless Trasmetti video e audio più facilmente!
Contatti
Indirizzo:
No.305 Room HuiLan Building No.273 Huanpu Road Guangzhou Cina 510620
Categorie
Newsletter