FMUSER Wirless Trasmetti video e audio più facilmente!
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> Afrikaans
sq.fmuser.org -> albanese
ar.fmuser.org -> Arabo
hy.fmuser.org -> Armenian
az.fmuser.org -> Azerbaigiano
eu.fmuser.org -> Basco
be.fmuser.org -> bielorusso
bg.fmuser.org -> Bulgaro
ca.fmuser.org -> Catalano
zh-CN.fmuser.org -> Cinese (semplificato)
zh-TW.fmuser.org -> Cinese (Tradizionale)
hr.fmuser.org -> croato
cs.fmuser.org -> ceco
da.fmuser.org -> danese
nl.fmuser.org -> Olandese
et.fmuser.org -> Estone
tl.fmuser.org -> Filippino
fi.fmuser.org -> finlandese
fr.fmuser.org -> Francese
gl.fmuser.org -> Galiziano
ka.fmuser.org -> georgiano
de.fmuser.org -> tedesco
el.fmuser.org -> Greca
ht.fmuser.org -> Creolo haitiano
iw.fmuser.org -> Ebraico
hi.fmuser.org -> Hindi
hu.fmuser.org -> Hungarian
is.fmuser.org -> Islandese
id.fmuser.org -> Indonesiano
ga.fmuser.org -> Irlandese
it.fmuser.org -> Italiano
ja.fmuser.org -> giapponese
ko.fmuser.org -> coreano
lv.fmuser.org -> Lettone
lt.fmuser.org -> Lithuanian
mk.fmuser.org -> Macedone
ms.fmuser.org -> Malese
mt.fmuser.org -> Maltese
no.fmuser.org -> Norwegian
fa.fmuser.org -> persiano
pl.fmuser.org -> polacco
pt.fmuser.org -> portoghese
ro.fmuser.org -> Romeno
ru.fmuser.org -> Russo
sr.fmuser.org -> Serbo
sk.fmuser.org -> slovacco
sl.fmuser.org -> Sloveno
es.fmuser.org -> spagnolo
sw.fmuser.org -> Swahili
sv.fmuser.org -> svedese
th.fmuser.org -> Thai
tr.fmuser.org -> turco
uk.fmuser.org -> Ucraino
ur.fmuser.org -> Urdu
vi.fmuser.org -> Vietnamita
cy.fmuser.org -> Gallese
yi.fmuser.org -> Yiddish
H.264, o MPEG-4 Part Ten (AVC, Advanced Video Coding), è l'ultima generazione di standard di compressione video lanciati congiuntamente dall'International Telecommunication Standardization Department ITU-T e dall'International Organization for Standardization ISO / IEC nel 2003. A presente, lo standard H.264 è ampiamente utilizzato nel monitoraggio remoto di video cablato / wireless, media interattivi di rete, TV digitale e videoconferenza, ecc.
Nome cinese H.264 + alias MPEG-4 Part 10 Tempo standard per la compressione video di qualità nel 2003
sommario
1 Introduzione di base
2 Punti salienti tecnici
Confronto delle prestazioni 3
Introduzione di base
H.264 è un nuovo video digitale sviluppato dal team video congiunto (JVT: team video congiunto) di VCEG (Video Coding Experts Group) di ITU-T e MPEG (Moving Picture Coding Experts Group) di ISO / IEC
Server video
Server video
Standard di codifica, è sia ITU-T H.264 che ISO / IEC MPEG-4 Parte 10. La richiesta di bozze è iniziata nel gennaio 1998. La prima bozza è stata completata nel settembre 1999. Il modello di test TML-8 è stato sviluppato a maggio 2001. Il consiglio di FCD di H.264 è stato approvato alla quinta riunione della JVT nel giugno 5.. Rilasciato ufficialmente nel marzo 2002. Come lo standard precedente, anche H.2003 è una modalità di codifica ibrida di DPCM più codifica di trasformazione. Tuttavia, adotta un design semplice di "ritorno alle basi", senza molte opzioni, e ottiene prestazioni di compressione molto migliori rispetto a H.264 ++; rafforza l'adattabilità a vari canali, adotta una struttura e sintassi "network-friendly", favorevole all'elaborazione di errori e perdita di pacchetti; un'ampia gamma di obiettivi applicativi per soddisfare le esigenze di diverse velocità, diverse risoluzioni e diverse occasioni di trasmissione (archiviazione); il suo sistema di base è aperto e non è richiesto alcun copyright per l'uso. Tecnicamente, ci sono molti punti salienti nello standard H.263, come la codifica dei simboli VLC unificata, la stima dello spostamento multimodale ad alta precisione, la trasformazione intera basata su blocchi 264 × 4 e la sintassi di codifica a strati. Queste misure fanno sì che l'algoritmo H.4 abbia un'efficienza di codifica molto elevata, a parità di qualità dell'immagine ricostruita, può risparmiare circa il 264% del tasso di codice rispetto a H.50. La struttura del flusso di codice di H.263 ha una forte adattabilità di rete, aumenta le capacità di ripristino degli errori e può adattarsi bene alle applicazioni di rete IP e wireless.
Punti salienti tecnici
Design a strati
L'algoritmo H.264 può essere suddiviso concettualmente in due livelli: il livello di codifica video (VCL: Video Coding Layer) è responsabile della rappresentazione efficiente dei contenuti video e il livello di astrazione della rete (NAL: Network Abstraction Layer) è responsabile del modo appropriato richiesto dalla rete Comprimere e trasmettere i dati. Un'interfaccia basata su pacchetti è definita tra VCL e NAL e il confezionamento e la segnalazione corrispondente fanno parte di NAL. In questo modo, i compiti di alta efficienza di codifica e compatibilità di rete vengono completati rispettivamente da VCL e NAL. Il livello VCL include la codifica ibrida di compensazione del movimento basata su blocchi e alcune nuove funzionalità. Come i precedenti standard di codifica video, H.264 non include funzioni come pre-elaborazione e post-elaborazione nella bozza, il che può aumentare la flessibilità dello standard. NAL è responsabile dell'incapsulamento dei dati utilizzando il formato del segmento della rete sottostante, inclusi il framing, la segnalazione dei canali logici, l'utilizzo delle informazioni di temporizzazione o i segnali di fine sequenza. Ad esempio, NAL supporta i formati di trasmissione video sui canali a commutazione di circuito e supporta i formati di trasmissione video su Internet utilizzando RTP / UDP / IP. NAL include le proprie informazioni di intestazione, informazioni sulla struttura del segmento e informazioni sul carico effettivo, ovvero i dati VCL del livello superiore. (Se viene utilizzata la tecnologia di segmentazione dei dati, i dati possono essere costituiti da più parti).
Stima del movimento multimodale ad alta precisione
H.264 supporta i vettori di movimento con una precisione di 1/4 o 1/8 pixel. Con una precisione di 1/4 di pixel, è possibile utilizzare un filtro a 6 colpi per ridurre il rumore ad alta frequenza. Per i vettori di movimento con una precisione di 1/8 pixel, è possibile utilizzare un filtro a 8 tocchi più complesso. Quando si esegue la stima del movimento, il codificatore può anche scegliere filtri di interpolazione "avanzati" per migliorare l'effetto della previsione. Nella previsione del movimento di H.264, un macro blocco (MB) può essere suddiviso in diversi sottoblocchi come mostrato nella Figura 2, formando blocchi di 7 diverse modalità. Questa divisione multi-modalità flessibile e dettagliata è più adatta alla forma degli oggetti in movimento effettivi nell'immagine, il che migliora notevolmente l'accuratezza della stima del movimento. In questo modo, 1, 2, 4, 8 o 16 vettori di movimento possono essere inclusi in ogni macro blocco. In H.264, l'encoder può utilizzare più di un frame precedente per la stima del movimento, che è la cosiddetta tecnologia di riferimento multi-frame. Ad esempio, se 2 o 3 frame sono solo frame di riferimento codificati, il codificatore selezionerà un frame di previsione migliore per ciascun macroblocco di destinazione e indicherà per ciascun macroblocco quale frame viene utilizzato per la previsione.
Trasformazione intera
H.264 è simile allo standard precedente, utilizzando la codifica della trasformazione basata su blocchi per il residuo, ma la trasformazione è un'operazione intera piuttosto che un'operazione su numeri reali, e il suo processo è sostanzialmente simile a DCT. Il vantaggio di questo metodo è che nell'encoder e nel decoder sono consentite la stessa trasformazione di precisione e inversa, ed è conveniente utilizzare semplici operazioni a virgola fissa. In altre parole, non esiste un "errore di trasformazione inversa". L'unità di trasformazione è blocchi 4 × 4, invece di blocchi 8 × 8 comunemente usati in passato. Man mano che la dimensione del blocco di trasformazione viene ridotta, la divisione dell'oggetto in movimento è più accurata, in modo che non solo la quantità di calcolo della trasformazione sia inferiore, ma anche l'errore di convergenza sul bordo dell'oggetto in movimento viene notevolmente ridotto. Per fare in modo che il metodo di trasformazione dei blocchi di piccole dimensioni non produca la differenza in scala di grigi tra i blocchi nell'area liscia più grande dell'immagine, il coefficiente DC di 16 blocchi 4 × 4 dei dati di luminosità del macroblocco intra-frame (ogni blocco piccolo Uno , per un totale di 16) esegue la seconda trasformazione del blocco 4 × 4 ed esegue la trasformazione del blocco 2 × 2 sui coefficienti DC di 4 blocchi 4 × 4 di dati di crominanza (uno per ogni blocco piccolo, 4 in totale).
Al fine di migliorare la capacità di controllo della velocità di H.264, la variazione della dimensione del passo di quantizzazione è controllata a circa il 12.5%, invece di un aumento costante. La normalizzazione dell'ampiezza del coefficiente di trasformazione viene elaborata nel processo di quantizzazione inversa per ridurre la complessità computazionale. Per enfatizzare la fedeltà del colore, viene adottata una dimensione del passo di quantizzazione più piccola per il coefficiente di crominanza.
VLC unificato
Esistono due metodi di codifica entropica in H.264, uno consiste nell'utilizzare un VLC unificato (UVLC: Universal VLC) per tutti i simboli da codificare e l'altro consiste nell'utilizzare la codifica aritmetica binaria adattiva al contenuto (CABAC: Context-Adaptive Binary Codifica aritmetica). CABAC è opzionale e le sue prestazioni di codifica sono leggermente migliori di UVLC, ma anche la complessità computazionale è maggiore. UVLC utilizza un set di parole in codice di lunghezza illimitata e la struttura del design è molto regolare e oggetti diversi possono essere codificati con la stessa tabella di codici. Questo metodo può generare facilmente una parola in codice e il decodificatore può identificare facilmente il prefisso della parola in codice e UVLC può ottenere rapidamente la risincronizzazione quando si verifica un errore di bit.
Previsione intra
Negli standard della serie H.26x e MPEG-x precedenti, vengono utilizzati metodi di previsione inter-frame. In H.264, la previsione intra-frame è disponibile durante la codifica di immagini Intra. Per ogni blocco 4 × 4 (eccetto per il trattamento speciale del blocco bordo), ogni pixel può essere previsto con la diversa somma ponderata dei 17 pixel codificati in precedenza più vicini (alcuni pesi possono essere 0), cioè questo pixel 17 pixel nell'angolo in alto a sinistra del blocco. Ovviamente, questo tipo di previsione intra-frame non è nel tempo, ma è un algoritmo di codifica predittivo eseguito nel dominio spaziale, che può rimuovere la ridondanza spaziale tra blocchi adiacenti e ottenere una compressione più efficace.
Come mostrato nella Figura 4, a, b, ..., p nel quadrato 4 × 4 sono 16 pixel da prevedere e A, B, ..., P sono pixel che sono stati codificati. Ad esempio, il valore del punto m può essere previsto dalla formula (J + 2K + L + 2) / 4 o dalla formula (A + B + C + D + I + J + K + L) / 8, eccetera. . In base ai punti di riferimento della previsione selezionati, ci sono 9 diverse modalità per la luminosità, ma solo 1 modalità per la previsione intra della crominanza.
Per ambienti IP e wireless
La bozza H.264 contiene strumenti per l'eliminazione degli errori per facilitare la trasmissione di video compresso in un ambiente con errori frequenti e perdita di pacchetti, come la robustezza della trasmissione su canali mobili o canali IP. Per resistere agli errori di trasmissione, la sincronizzazione temporale nel flusso video H.264 può essere realizzata utilizzando l'aggiornamento dell'immagine intra-frame e la sincronizzazione spaziale è supportata dalla codifica strutturata in sezioni. Allo stesso tempo, per facilitare la risincronizzazione dopo un errore di bit, viene fornito anche un certo punto di risincronizzazione nei dati video di un'immagine. Inoltre, l'aggiornamento dei macroblocchi intra-frame e i macroblocchi di riferimento multipli consentono all'encoder di considerare non solo l'efficienza della codifica, ma anche le caratteristiche del canale di trasmissione quando determina la modalità del macroblocco.
Oltre a utilizzare la modifica della dimensione del passo di quantizzazione per adattarsi alla velocità di codice del canale, in H.264, il metodo di segmentazione dei dati viene spesso utilizzato per gestire la modifica della velocità di codice del canale. In generale, il concetto di segmentazione dei dati consiste nel generare dati video con priorità diverse nell'encoder per supportare la qualità del servizio QoS nella rete. Ad esempio, il metodo di partizionamento dei dati basato sulla sintassi viene adottato per dividere i dati di ogni frame in più parti in base alla sua importanza, il che consente di scartare le informazioni meno importanti quando il buffer va in overflow. È anche possibile adottare un metodo di partizionamento dei dati temporali simile, ottenuto utilizzando più frame di riferimento in frame P e B.
Nell'applicazione della comunicazione wireless, possiamo supportare grandi variazioni di bit rate del canale wireless modificando la precisione di quantizzazione o la risoluzione spazio / temporale di ogni frame. Tuttavia, nel caso del multicast, è impossibile richiedere al codificatore di rispondere a velocità di bit variabili. Pertanto, a differenza del metodo FGS (Fine Granular Scalability) utilizzato in MPEG-4 (con minore efficienza), H.264 utilizza frame SP di commutazione di flusso invece della codifica gerarchica.
Confronto delle prestazioni
TML-8 è un test per H.264. Il PSNR fornito dai risultati del test ha chiaramente mostrato che rispetto alle prestazioni di MPEG-4 (ASP: Advanced Simple Profile) e H.263 ++ (HLP: High Latency Profile), i risultati di H.264 hanno evidenti vantaggi.
Il PSNR di H.264 è ovviamente migliore di quello di MPEG-4 (ASP) e H.263 ++ (HLP). Nel test comparativo di 6 velocità, il PSNR di H.264 è in media 2dB superiore a MPEG-4 (ASP). In media è superiore di 3dB rispetto a H.263 (HLP). Le 6 velocità di test e le relative condizioni sono: 32 kbit / s rate, 10f / s frame rate e formato QCIF; Velocità di 64 kbit / s, frequenza di fotogrammi 15 f / s e formato QCIF; Velocità di 128 kbit / s, velocità dei fotogrammi 15 f / s e formato CIF; Velocità di 256 kbit / s, frequenza di fotogrammi 15 f / s e formato QCIF; Velocità di 512 kbit / s, frequenza dei fotogrammi di 30 f / s e formato CIF; Velocità di 1024 kbit / s, frequenza dei fotogrammi di 30 f / s e formato CIF.
|
Inserisci l'email per ricevere una sorpresa
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> Afrikaans
sq.fmuser.org -> albanese
ar.fmuser.org -> Arabo
hy.fmuser.org -> Armenian
az.fmuser.org -> Azerbaigiano
eu.fmuser.org -> Basco
be.fmuser.org -> bielorusso
bg.fmuser.org -> Bulgaro
ca.fmuser.org -> Catalano
zh-CN.fmuser.org -> Cinese (semplificato)
zh-TW.fmuser.org -> Cinese (Tradizionale)
hr.fmuser.org -> croato
cs.fmuser.org -> ceco
da.fmuser.org -> danese
nl.fmuser.org -> Olandese
et.fmuser.org -> Estone
tl.fmuser.org -> Filippino
fi.fmuser.org -> finlandese
fr.fmuser.org -> Francese
gl.fmuser.org -> Galiziano
ka.fmuser.org -> georgiano
de.fmuser.org -> tedesco
el.fmuser.org -> Greca
ht.fmuser.org -> Creolo haitiano
iw.fmuser.org -> Ebraico
hi.fmuser.org -> Hindi
hu.fmuser.org -> Hungarian
is.fmuser.org -> Islandese
id.fmuser.org -> Indonesiano
ga.fmuser.org -> Irlandese
it.fmuser.org -> Italiano
ja.fmuser.org -> giapponese
ko.fmuser.org -> coreano
lv.fmuser.org -> Lettone
lt.fmuser.org -> Lithuanian
mk.fmuser.org -> Macedone
ms.fmuser.org -> Malese
mt.fmuser.org -> Maltese
no.fmuser.org -> Norwegian
fa.fmuser.org -> persiano
pl.fmuser.org -> polacco
pt.fmuser.org -> portoghese
ro.fmuser.org -> Romeno
ru.fmuser.org -> Russo
sr.fmuser.org -> Serbo
sk.fmuser.org -> slovacco
sl.fmuser.org -> Sloveno
es.fmuser.org -> spagnolo
sw.fmuser.org -> Swahili
sv.fmuser.org -> svedese
th.fmuser.org -> Thai
tr.fmuser.org -> turco
uk.fmuser.org -> Ucraino
ur.fmuser.org -> Urdu
vi.fmuser.org -> Vietnamita
cy.fmuser.org -> Gallese
yi.fmuser.org -> Yiddish
FMUSER Wirless Trasmetti video e audio più facilmente!
Contatto
Indirizzo:
No.305 Room HuiLan Building No.273 Huanpu Road Guangzhou Cina 510620
Categorie
Newsletter