Principi di base di H264

Prefazione
L'algoritmo di compressione video H264 è ora senza dubbio la più utilizzata e la più popolare di tutte le tecniche di compressione video. Con l'introduzione di librerie open source come x264 / openh264 e ffmpeg, la maggior parte degli utenti non ha più bisogno di fare troppe ricerche sui dettagli di H264, il che riduce notevolmente il costo delle persone che utilizzano H264.

Ma per fare un buon uso di H264, dobbiamo ancora capire i principi di base di H264. Oggi daremo uno sguardo ai principi di base di H264.

La tecnologia di compressione H264 utilizza principalmente i seguenti metodi per comprimere i dati video. includere:

La compressione della previsione intra-frame risolve il problema della ridondanza dei dati spaziali.
La compressione della previsione inter-frame (stima del movimento e compensazione) risolve il problema della ridondanza dei dati nel dominio del tempo.
Integer Discrete Cosine Transform (DCT), che trasforma la correlazione spaziale in dati irrilevanti nel dominio della frequenza e quindi la quantizza.
Compressione CABAC.
Il frame compresso è suddiviso in: I frame, P frame e B frame:

I frame: fotogramma chiave, utilizzando la tecnologia di compressione intra-frame.
Frame P: frame di riferimento in avanti, durante la compressione, si riferisce solo al frame elaborato in precedenza. Utilizza la tecnologia di compressione audio dei fotogrammi.
Frame B: un frame di riferimento bidirezionale. Durante la compressione, si riferisce al frame precedente e al frame successivo. Utilizzo della tecnologia di compressione inter-frame.
Oltre ai frame I / P / B, ci sono anche sequenze di immagini GOP.

GOP: Tra due fotogrammi I c'è una sequenza di immagini, e c'è solo un fotogramma I in una sequenza di immagini. Come mostrato di seguito:

Tecnologia di compressione H264
Il principio di base di H264 è in realtà molto semplice, descriviamo brevemente il processo di compressione dei dati di H264. I fotogrammi video catturati dalla telecamera (calcolati a 30 fotogrammi al secondo) vengono inviati al buffer dell'encoder H264. L'encoder deve prima dividere i macroblocchi per ogni immagine.

Macroblocco di partizione
H264 utilizza un'area 16X16 come blocco macro per impostazione predefinita e può anche essere diviso in dimensioni 8X8.

Dopo aver diviso il blocco macro, calcolare il valore in pixel del blocco macro.

Per analogia, viene calcolato il valore dei pixel di ogni macroblocco in un'immagine e tutti i macroblocchi vengono elaborati come segue.

Sottoblocco
H264 utilizza macroblocchi 16X16 per immagini relativamente piatte. Tuttavia, per ottenere un tasso di compressione più elevato, i sottoblocchi più piccoli possono anche essere suddivisi in macroblocchi 16X16. La dimensione del sottoblocco può essere 8X16, 16X8, 8X8, 4X8, 8X4, 4X4, che è molto flessibile.

Nella foto sopra, la maggior parte dei macroblocchi 16X16 nella cornice rossa hanno uno sfondo blu, e parte dell'immagine delle tre aquile è disegnata in questo macroblocco. Per poter elaborare al meglio le immagini parziali delle tre aquile, i sottoblocchi Multipli H264 sono suddivisi in macroblocchi 16X16.

In questo modo, dopo la compressione intra-frame, è possibile ottenere dati più efficienti. La figura sotto è il risultato della compressione dei macroblocchi precedenti utilizzando rispettivamente mpeg-2 e H264. La metà sinistra è il risultato della compressione dopo la divisione dei sottoblocchi MPEG-2 e la metà destra è il risultato della compressione dei sottoblocchi H264. Si può vedere che il metodo di divisione H264 ha più vantaggi.

Dopo che il blocco macro è stato diviso, tutte le immagini nel buffer dell'encoder H264 possono essere raggruppate.

Raggruppamento di frame
Per i dati video, esistono principalmente due tipi di ridondanza dei dati, uno è la ridondanza dei dati nel tempo e l'altro è la ridondanza dei dati nello spazio. Tra questi, la ridondanza dei dati nel tempo è la più grande. Parliamo prima del problema di ridondanza del tempo dei dati video.

Perché la ridondanza di tempo è la più grande? Supponendo che la fotocamera acquisisca 30 fotogrammi al secondo, i dati di questi 30 fotogrammi sono per lo più correlati. È anche possibile che più di 30 frame di dati, decine di frame o centinaia di frame di dati siano particolarmente strettamente correlati.

Per questi frame strettamente correlati, infatti, è necessario salvare solo un frame di dati e altri frame possono essere previsti da questo frame secondo determinate regole, quindi i dati video hanno la ridondanza più tempo.

Per fare in modo che i frame rilevanti comprimano i dati attraverso il metodo di predizione, è necessario raggruppare i frame video. Quindi come determinare che determinati frame sono strettamente correlati e possono essere raggruppati insieme? Diamo un'occhiata a un esempio. Di seguito è riportato un fotogramma video catturato di un gruppo di palle da biliardo in movimento. Le palle da biliardo rotolano dall'angolo superiore destro all'angolo inferiore sinistro.

L'encoder H264 estrae ogni volta due frame adiacenti per confrontare i macroblocchi al fine di calcolare la somiglianza dei due frame. Come mostrato di seguito:

Attraverso la macro block scan e la macro block search, si può riscontrare che la correlazione tra i due frame è molto alta. Inoltre, si è riscontrato che il grado di correlazione di questo gruppo di frame è molto alto. Pertanto, i frame di cui sopra possono essere divisi in un gruppo. L'algoritmo è: nelle immagini adiacenti, i pixel che sono generalmente diversi sono solo entro il 10%, la differenza di luminosità non supera il 2% e la differenza di cromaticità cambia solo entro l'1%. Pensiamo che questo I grafici possano essere raggruppati insieme.

In un tale gruppo di frame, dopo la codifica, conserviamo solo i dati completi del primo post e gli altri frame vengono calcolati facendo riferimento al frame precedente. Chiamiamo il primo frame IDR / I frame e gli altri frame P / B frame, quindi chiamiamo GOP il gruppo di frame di dati codificati.

Stima e compensazione del movimento
Dopo che i frame sono stati raggruppati nell'encoder H264, è necessario calcolare i vettori di movimento degli oggetti nel gruppo di frame. Prendendo come esempio il fotogramma video del biliardo in movimento sopra, diamo un'occhiata a come calcola il vettore di movimento.

L'encoder H264 estrae prima due fotogrammi di dati video dall'intestazione del buffer in sequenza, quindi esegue la scansione del blocco macro. Quando un oggetto viene trovato in una delle immagini, la ricerca viene eseguita in prossimità dell'altra immagine (nella finestra di ricerca). Se l'oggetto si trova in un'altra immagine in questo momento, è possibile calcolare il vettore di movimento dell'oggetto. L'immagine seguente mostra la posizione della palla da biliardo dopo la ricerca.

Attraverso la differenza tra le posizioni delle palle da biliardo nell'immagine sopra, è possibile calcolare la direzione e la distanza dell'immagine del tavolo. H264 registra la distanza e la direzione del movimento della palla in ogni fotogramma a turno, e diventa il seguente.

Dopo che il vettore di movimento è stato calcolato, la stessa parte (ovvero la parte verde) viene sottratta per ottenere i dati di compensazione. Alla fine, dobbiamo solo comprimere e salvare i dati di compensazione, quindi l'immagine originale può essere ripristinata durante la decodifica. I dati compressi devono registrare solo una piccola quantità di dati. Come segue:

Chiamiamo vettore di movimento e compensazione come tecnologia di compressione inter-frame, che risolve la ridondanza dei dati dei frame video nel tempo. Oltre alla compressione inter-frame, anche la compressione dei dati deve essere eseguita all'interno del frame. La compressione dei dati intra-frame risolve la ridondanza dei dati spaziali. Ora introdurremo la tecnologia di compressione intra-frame.

Previsione intra
L'occhio umano ha un grado di riconoscimento dell'immagine, è molto sensibile alla luminosità delle basse frequenze e non è molto sensibile alla luminosità delle alte frequenze. Pertanto, sulla base di alcune ricerche, i dati che non sono sensibili agli occhi umani possono essere rimossi da un'immagine. In questo modo viene proposta la tecnologia di predizione intra.

La compressione intra-frame di H264 è molto simile a JPEG. Dopo che un'immagine è stata divisa in macroblocchi, ogni macroblocco può essere previsto in 9 modalità. Trova la modalità di previsione più vicina all'immagine originale.

L'immagine seguente è il processo di previsione di ciascun blocco macro nell'intera immagine.

Il confronto tra l'immagine dopo la predizione intra e l'immagine originale è il seguente:

Quindi, l'immagine originale e l'immagine intra predetta vengono sottratte per ottenere un valore residuo.

Quindi salva le informazioni sulla modalità di previsione che abbiamo ottenuto in precedenza, in modo da poter ripristinare l'immagine originale durante la decodifica. L'effetto è il seguente:

Dopo la compressione intra-frame e inter-frame, sebbene i dati siano notevolmente ridotti, c'è ancora spazio per l'ottimizzazione.

Eseguire DCT sui dati residui
I dati residui possono essere sottoposti a trasformata coseno discreta intera per rimuovere la correlazione dei dati e comprimere ulteriormente i dati. Come mostrato nella figura sottostante, il lato sinistro è il macro blocco dei dati originali e il lato destro è il macro blocco dei dati residui calcolati.

Il macroblocco dei dati residui viene digitalizzato come mostrato nella figura seguente:

Dopo aver rimosso i dati associati, possiamo vedere che i dati vengono ulteriormente compressi.

Dopo aver eseguito DCT, non è sufficiente e CABAC è necessario per la compressione senza perdite.

CABAC
La suddetta compressione intra-frame è una tecnica di compressione con perdita. In altre parole, dopo che l'immagine è stata compressa, non può essere ripristinata completamente. CABAC è una tecnologia di compressione senza perdite.

La tecnologia di compressione senza perdita può essere la più familiare a tutti è la codifica di Huffman, un codice breve per parole ad alta frequenza, un codice lungo per parole a bassa frequenza per raggiungere lo scopo della compressione dei dati. VLC utilizzato in MPEG-2 è questo tipo di algoritmo, prendiamo AZ come esempio, A appartiene ai dati ad alta frequenza e Z appartiene ai dati a bassa frequenza. Guarda come si fa.

CABAC è anche un codice breve per dati ad alta frequenza e un codice lungo per dati a bassa frequenza. Allo stesso tempo, si comprimerà in base al contesto, il che è molto più efficiente di VLC. L'effetto è il seguente:

È ovvio dall'immagine sopra che lo schema di compressione senza perdita di dati che utilizza CACBA è molto più efficiente di VLC.

sommario
A questo punto, abbiamo terminato il principio di codifica H264. Questo articolo parla principalmente dei seguenti punti:
1. Jianyin ha introdotto alcuni concetti di base in H264. Come frame I / P / B, GOP.
2. Ha spiegato in dettaglio i principi di base della codifica H264, tra cui:

Divisione macro blocchi
Raggruppamento di immagini
Principio della tecnologia di compressione intra-frame
Il principio della tecnologia di compressione inter-frame.
DCT
Principio di compressione CABAC.

Fino a che punto (lungo) il coperchio del trasmettitore?

Il raggio di trasmissione dipende da molti fattori. La distanza reale si basa sulla antenna installazione altezza, guadagno di antenna, utilizzando ambiente come costruzione ed altri ostacoli, sensibilità del ricevitore, antenna del ricevitore. Installazione antenna più alta e l'utilizzo in campagna, la distanza sarà molto più lontano.

ESEMPIO 5W trasmettitore FM utilizzare in città e città natale:

Ho un uso del cliente 5W trasmettitore FM con antenna GP USA nella sua città natale, e lui prova con una macchina, coprire 10km (6.21mile).

I test il trasmettitore FM 5W con antenna GP nella mia città natale, che coprono circa il 2km (1.24mile).

I test il trasmettitore FM 5W con antenna GP nella città di Guangzhou, che coprono circa il solo 300meter (984ft).

Qui di seguito sono la gamma approssimativa di diversi trasmettitori di potenza FM. (L'intervallo è di diametro)

0.1W ~ 5W Trasmettitore FM: 100M ~ 1KM

5W ~ 15W FM Ttransmitter: 1KM ~ 3KM

15W ~ 80W Trasmettitore FM: 3KM ~ 10KM

80W ~ 500W Trasmettitore FM: 10KM ~ 30KM

500W ~ 1000W Trasmettitore FM: 30KM ~ 50KM

1KW ~ 2KW Trasmettitore FM: 50KM ~ 100KM

2KW ~ 5KW Trasmettitore FM: 100KM ~ 150KM

5KW ~ 10KW Trasmettitore FM: 150KM ~ 200KM

Come contattarci per il trasmettitore?

Call me + 8618078869184 O
Se la tua attività ha avuto un impatto negativo e posso esserti di aiuto, mi piacerebbe aiutarti., Mandami un'email [email protected]
1.How lontano si vuole coprire di diametro?
2.How alto di voi Tower?
3.Where sei?
E vi daremo consigli più professionale.

Chi siamo

FMUSER.ORG è una società di integrazione di sistemi che si occupa di trasmissione wireless RF / apparecchiature audio video da studio / streaming e elaborazione dati. Forniamo tutto, dalla consulenza e consulenza attraverso l'integrazione del rack all'installazione, alla messa in servizio e alla formazione.

Offriamo trasmettitori FM, trasmettitori TV analogici, trasmettitori TV digitali, trasmettitori UHF VHF, antenne, connettori per cavi coassiali, STL, elaborazione in onda, prodotti Broadcast per lo studio, monitoraggio del segnale RF, codificatori RDS, processori audio e unità di controllo del sito remoto, Prodotti IPTV, codificatore / codificatore audio / video, progettato per soddisfare le esigenze sia delle grandi reti di trasmissione internazionali che di piccole stazioni private.

La nostra soluzione dispone di stazione radio FM / stazione TV analogica / stazione TV digitale / attrezzatura da studio audio video / collegamento trasmettitore da studio / sistema di telemetria del trasmettitore / sistema TV dell'hotel / trasmissione live IPTV / trasmissione live streaming / videoconferenza / sistema di trasmissione CATV.

Stiamo utilizzando prodotti di tecnologia avanzata per tutti i sistemi, perché sappiamo che l'alta affidabilità e le alte prestazioni sono così importanti per il sistema e la soluzione. Allo stesso tempo, dobbiamo anche assicurarci che il nostro sistema di prodotti abbia un prezzo molto ragionevole.

Abbiamo clienti di emittenti pubbliche e commerciali, operatori di telecomunicazioni e autorità di regolamentazione e offriamo anche soluzioni e prodotti a molte centinaia di emittenti minori, locali e comunitarie.

FMUSER.ORG esporta da più di 15 anni e ha clienti in tutto il mondo. Con 13 anni di esperienza in questo campo, abbiamo un team di professionisti per risolvere tutti i tipi di problemi dei clienti. Ci siamo impegnati a fornire prezzi estremamente ragionevoli di prodotti e servizi professionali. Contatto email : [email protected]

La nostra fabbrica

Abbiamo modernizzazione della fabbrica. Siete invitati a visitare la nostra fabbrica quando si arriva in Cina.

Allo stato attuale, ci sono già clienti 1095 in tutto il mondo visitato il nostro ufficio di Guangzhou Tianhe. Se venite in Cina, siete invitati a farci visita.

Alla Fiera

Questa è la nostra partecipazione a 2012 globali Fonti Hong Kong Electronics Fair . I clienti provenienti da tutto il mondo infine, avere la possibilità di stare insieme.

Dove è FMUSER?

Puoi cercare questi numeri " 23.127460034623816,113.33224654197693 "in google map, puoi trovare il nostro ufficio fmuser.

ufficio FMUSER Guangzhou è nel quartiere Tianhe che è la centro del Cantone . Molto vicino Vai all’email la fiera di Canton , stazione ferroviaria di Guangzhou, strada Xiaobei e Dashatou , Solo bisogno 10 minuti se prendere TAXI . Benvenuti amici di tutto il mondo a visitare e negoziare.

Contatto: Blue Sky
Cellulare: + 8618078869184
WhatsApp: + 8618078869184
Wechat: + 8618078869184
E-mail: [email protected]
QQ: 727926717
Skype: sky198710021
Indirizzo: No.305 camera Huilan costruzione No.273 Huanpu Strada Guangzhou Cina Codice postale: 510620

Inglese: Accettiamo tutti i pagamenti, come PayPal, Carta di credito, Western Union, Alipay, Money Bookers, T / T, LC, DP, DA, OA, Payoneer, se hai qualche domanda, per favore contattami [email protected] o WhatsApp + 8618078869184

PayPal.  www.paypal.com

Si consiglia di utilizzare Paypal per comprare i nostri articoli, il Paypal è un modo sicuro per acquistare su internet.

Ogni della nostra lista elemento della pagina in basso sulla parte superiore hanno un logo PayPal per pagare.

Carta di credito.Se non avete paypal, ma avete carta di credito, è anche possibile fare clic sul pulsante giallo PayPal per pagare con carta di credito.

-------------------------------------------------- -------------------

Ma se non hai una carta di credito e non avere un conto paypal o difficile ottenuto un accout PayPal, è possibile utilizzare il seguente:
Western Union.  www.westernunion.com

Pagare con Western Union a me:

Nome / Nome proprio: Yingfeng
Cognome / Cognome / Nome famiglia: Zhang
Nome completo: Yingfeng Zhang
Paese: China
Città: Guangzhou

-------------------------------------------------- -------------------

T / T.  Paga con T / T (bonifico bancario / trasferimento telegrafico / bonifico bancario)
Primi DATI BANCARIE (CONTO AZIENDA):

SWIFT BIC: BKCHHKHHXXX
Nome della banca: BANK OF CHINA (HONG KONG) LIMITED, HONG KONG
Indirizzo bancario: BANK OF CHINA TOWER, 1 GARDEN ROAD, CENTRAL, HONG KONG
CODICE BANCARIO: 012
Nome account: FMUSER INTERNATIONAL GROUP LIMITED
Conto NO. : 012-676-2-007855-0

-------------------------------------------------- -------------------
Secondo DATI BANCARIE (CONTO AZIENDALE):
Beneficiario: FMuser International Group Inc
Numero di conto: 44050158090900000337
Banca del beneficiario: China Construction Bank Guangdong Branch
Codice SWIFT: PCBCCNBJGDX
Indirizzo: NO.553 Tianhe Road, Guangzhou, Guangdong, distretto di Tianhe, Cina
**Nota: quando trasferisci denaro sul nostro conto bancario, NON scrivere nulla nell'area dei commenti, altrimenti non saremo in grado di ricevere il pagamento a causa della politica del governo sul commercio internazionale.

* Sarà inviato in 1-2 giorni lavorativi in cui il pagamento chiaro.

* Invieremo al tuo indirizzo paypal. Se si desidera cambiare l'indirizzo, si prega di inviare il vostro indirizzo corretto e numero di telefono per la mia e-mail [email protected]

* Se i pacchetti è inferiore 2kg, ci sarà spedito via posta aerea, ci vorranno circa 15-25days a mano.

Se il pacchetto è più di 2kg, spediremo via lo SME, DHL, UPS, Fedex consegna veloce espresso, ci vorranno circa 7 ~ 15days alla tua mano.

Se il pacchetto più di 100kg, invieremo via DHL o trasporto aereo. Ci vorranno circa 3 ~ 7days alla tua mano.

Tutti i pacchetti sono forma Cina Guangzhou.

* Il pacco verrà inviato come "regalo" e verrà declassato il meno possibile, l'acquirente non dovrà pagare la "TASSA".

* Dopo la nave, vi invieremo una e-mail e vi darò il numero di tracking.

Per garanzia.
Contattaci --- >> Restituiscici l'articolo --- >> Ricevi e invia un'altra sostituzione.

Nome: Liu Xiaoxia
Indirizzo: 305Fang HuiLanGe HuangPuDaDaoXi 273Hao TianHeQu Guangzhou in Cina.
ZIP: 510620
Telefono: + 8618078869184

Si prega di restituire a questo indirizzo e scrivere il vostro paypal indirizzo, nome, problema sulla nota: