FMUSER Wirless Trasmetti video e audio più facilmente!
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> Afrikaans
sq.fmuser.org -> albanese
ar.fmuser.org -> Arabo
hy.fmuser.org -> Armenian
az.fmuser.org -> Azerbaigiano
eu.fmuser.org -> Basco
be.fmuser.org -> bielorusso
bg.fmuser.org -> Bulgaro
ca.fmuser.org -> Catalano
zh-CN.fmuser.org -> Cinese (semplificato)
zh-TW.fmuser.org -> Cinese (Tradizionale)
hr.fmuser.org -> croato
cs.fmuser.org -> ceco
da.fmuser.org -> danese
nl.fmuser.org -> Olandese
et.fmuser.org -> Estone
tl.fmuser.org -> Filippino
fi.fmuser.org -> finlandese
fr.fmuser.org -> Francese
gl.fmuser.org -> Galiziano
ka.fmuser.org -> georgiano
de.fmuser.org -> tedesco
el.fmuser.org -> Greca
ht.fmuser.org -> Creolo haitiano
iw.fmuser.org -> Ebraico
hi.fmuser.org -> Hindi
hu.fmuser.org -> Hungarian
is.fmuser.org -> Islandese
id.fmuser.org -> Indonesiano
ga.fmuser.org -> Irlandese
it.fmuser.org -> Italiano
ja.fmuser.org -> giapponese
ko.fmuser.org -> coreano
lv.fmuser.org -> Lettone
lt.fmuser.org -> Lithuanian
mk.fmuser.org -> Macedone
ms.fmuser.org -> Malese
mt.fmuser.org -> Maltese
no.fmuser.org -> Norwegian
fa.fmuser.org -> persiano
pl.fmuser.org -> polacco
pt.fmuser.org -> portoghese
ro.fmuser.org -> Romeno
ru.fmuser.org -> Russo
sr.fmuser.org -> Serbo
sk.fmuser.org -> slovacco
sl.fmuser.org -> Sloveno
es.fmuser.org -> spagnolo
sw.fmuser.org -> Swahili
sv.fmuser.org -> svedese
th.fmuser.org -> Thai
tr.fmuser.org -> turco
uk.fmuser.org -> Ucraino
ur.fmuser.org -> Urdu
vi.fmuser.org -> Vietnamita
cy.fmuser.org -> Gallese
yi.fmuser.org -> Yiddish
1 Introduzione
Se H.264 è attualmente il vero signore del CODEC video, allora AAC è la regina del CODEC audio. I formati audio e video tradizionali sono H.264 con AAC, che si tratti di un file multimediale non in tempo reale o di un flusso multimediale in tempo reale.
2. Storia della CAA
Advanced Audio Coding (AAC) è un set di codifica audio compresso con perdita (in effetti, il nuovo strumento di codifica supporta anche senza perdita).
Il suo obiettivo di progettazione è sostituire lo standard di codifica MP3 originale e sperare che la qualità sia migliore di MP3 con una velocità in bit simile a MP3. Questo obiettivo è stato raggiunto e standardizzato in MPEG-2 e MPEG-4 dalle organizzazioni di standard ISO e IEC.
AAC è stato ampiamente supportato e applicato a vari dispositivi e sistemi YouTube, iPhone, iPod, iPad, Nintendo DSi, Nintendo 3DS, iTunes, DivX Plus Web Player e PlayStation 3. È supportato su PlayStation Vita, Wii (con Photo Channel 1.1 aggiornamento installato), Sony Walkman serie MP3 e successive, Android e BlackBerry, ecc.
Nel 1997, AAC è apparso per la prima volta nello standard MPEG-2 Part 7 (ISO/IEC 13818-7:1997). Simile allo standard video CODEC, AAC ha tre profili in MPEG-2 Part 7. Sono rispettivamente.
l Profilo a bassa complessità (AAC-LC / LC-AAC)
l Profilo principale (AAC Main)
l Profilo scalabile della frequenza di campionamento (AAC-SSR)
Da ciò si può vedere che AAC-LC è apparso per primo, quindi AAC-LC è il più utilizzato e ha la migliore compatibilità.
Nel 1999, AAC è stato aggiornato dallo standard originale e ha incorporato lo standard MPEG-4 Part 3 (ISO/IEC 14496-3:1999)
Un cambiamento importante in questo aggiornamento è l'introduzione dei tipi di oggetti audio (AOT) e l'integrazione del concetto di AOT nei profili. In questo momento anche i profili sono diventati quattro.
l Main (che include la maggior parte dei tipi di oggetti audio MPEG-4)
l Scalabile (AAC LC, AAC LTP, CELP, HVXC, TwinVQ, sintesi Wavetable, TTSI),
l Discorso (CELP, HVXC, TTSI)
l Sintesi a bassa velocità (Sintesi Wavetable, TTSI) per sintetizzare il parlato.
Nel 2000, la versione è stata aggiornata a 2, MPEG-4 Audio Version 2 (ISO / IEC 14496-3: 1999 / Amd 1: 2000), lo standard ha definito un nuovo AOT, AAC a basso ritardo, AAC a basso ritardo (AAC - LD).
Nel 2001 è stata standardizzata la codifica audio avanzata ad alta efficienza (HE-AAC) ISO/IEC 14496-3:2001.
Nel 2003, profilo HE-AAC v2 standardizzato (AAC LC con SBR e Parametric Stereo) ISO / IEC 14496-3: 2005
L'attuale versione standardizzata della CAA è ISO/IEC 14496-3:2009.
Dalla storia della standardizzazione di cui sopra, si può vedere che AAC non è un semplice codificatore, ma un'enorme raccolta di strumenti di codifica audio.
3. AOT
AOT è l'abbreviazione di MPEG-4 Audio Object Types. L'ID AOT viene utilizzato per la negoziazione del set di capacità.
È proprio a causa dei numerosi AOT della CAA che è difficile identificare gli utenti che utilizzano la CAA.
AAC-LC può essere considerato come un AAC con un AOT di 2.
La tabella seguente è la tabella corrispondente di AOT.
4. Profili audio MPEG-4
La descrizione dell'insieme di capacità audio nella direzione della codifica audio di MPEG-4 è denominata Profili audio e la descrizione delle capacità audio si basa su AOT.
5. AAC-LC
In base alla popolarità e all'importanza di AAC-LC, sebbene sia stata introdotta sopra, è elencata separatamente qui.
Il formato Advanced Audio Coding a bassa complessità (AAC-LC / LC-AAC) è il formato MPEG-2, progettato per la TV digitale. AAC-LC viene utilizzato quando lo spazio di archiviazione e la potenza di calcolo sono limitati. Questo tipo non utilizza i due strumenti di previsione e controllo del guadagno e l'ordine di modellamento del rumore istantaneo è relativamente basso.
AAC-LC fa pieno uso del principio psicoacustico. Ha le caratteristiche di incoerenza e ridondanza statistica nella percezione umana dei segnali audio. Riduce al minimo i dati in bit utilizzati per esprimere il segnale e realizza la compressione rapida ed efficace dei segnali audio. Perseguire la somiglianza tra il segnale di uscita e il segnale originale.
I punti tecnici importanti di AAC-LC sono i seguenti.
Temporal Noise Shaping: il noise shaping istantaneo viene utilizzato per controllare la forma istantanea del rumore di quantizzazione e risolvere il problema della falsa corrispondenza della soglia di mascheramento e del rumore di quantizzazione. TNS utilizza la dualità tempo-frequenza. Un segnale stabile nel dominio del tempo reale cambierà drasticamente nel dominio della frequenza, mentre un segnale stabile nel dominio della frequenza può cambiare drasticamente nel dominio del tempo. Per i segnali transitori nel dominio del tempo, i coefficienti spettrali possono essere previsti e codificati. Prevedendo i coefficienti spettrali, il quantizzatore può essere regolato in tempo per adattarsi allo stato nel dominio del tempo del segnale di ingresso e il rumore di quantizzazione può essere efficacemente controllato.
Intensity Stereo: un metodo per utilizzare i principi psicoacustici per migliorare l'efficienza della codifica. Poiché l'orecchio umano non è sensibile alla fase del segnale ad alta frequenza, finché l'energia e lo spettro di frequenza del segnale sono simili, non c'è differenza nella percezione. Pertanto, quando la correlazione del segnale di una coppia di canali è elevata, la parte ad alta frequenza può essere elaborata in una certa misura, codificare e trasmettere solo i dati in un canale senza influire sulla qualità del suono ricostruita dopo la decodifica.
AAC-LC considera 6kHz come la frequenza iniziale dell'elaborazione stereo dell'intensità sonora e tutta l'elaborazione stereo dell'intensità sonora viene eseguita su questa frequenza. Calcolare l'energia e l'energia totale di ciascuna sottobanda dei canali sinistro e destro, quindi calcolare il rapporto tra l'energia del canale sinistro e l'energia totale e convertirlo in un fattore di intensità. Secondo questo fattore di intensità, tutti gli spettri della banda vengono sommati per i canali sinistro e destro. Normalizzazione, i dati del canale destro sono tutti impostati a zero, in modo che solo i dati del canale sinistro debbano essere quantizzati e codificati.
Sostituzione del rumore percettivo: la sostituzione del rumore percettivo viene utilizzata per i componenti spettrali per dividere il rumore simile (la densità spettrale di potenza è uniforme) e al suo posto viene utilizzato il rumore artificiale. Quando si giudica che una certa banda di frequenza debba essere sostituita da rumore percettivo, solo l'energia di questa banda di frequenza viene utilizzata come parametro per codificare e trasmettere, senza la necessità di codificare il valore dello spettro nella sottobanda, e l'energia della sottobanda e la funzione di generazione di vettori casuali sono ottenuti durante la decodifica. Simile al rumore.
Middle/Side: la codifica stereo è un metodo per utilizzare la correlazione tra i segnali di una coppia di canali per eliminare la ridondanza e ridurre il bit rate di codifica. Quando l'encoder AAC-LD ha un'ampia correlazione tra i dati del canale sinistro e destro, è possibile utilizzare Middle=(L+R)/2, Side = (LR)/2 per sostituire i dati del canale sinistro e destro per la codifica. In questo modo, l'energia è concentrata in un canale di dati, mentre l'altro canale richiede solo pochi bit di dati, ottenendo la compressione dei dati.
5. CAA-LD
Ora che ho parlato di AAC-LC, parliamo di AAC-LD
AAC è un codec audio percettivo in grado di fornire una qualità del suono soggettiva di altissima qualità a un bit rate inferiore. Tuttavia, il ritardo algoritmico di un tale codec a basse velocità in bit supera spesso i 100 ms, quindi non è adatto per la comunicazione bidirezionale in tempo reale. Lo schema del codec vocale basato su G.722 è adatto per la comunicazione bidirezionale a causa del suo ritardo algoritmico più piccolo. Tuttavia, questo tipo di codec vocale può fornire solo una migliore qualità soggettiva per i segnali vocali e non è adatto per segnali audio più complessi. Inoltre, anche a bit rate molto elevati, il risultato del codec non è buono. È difficile ottenere una buona qualità del suono.
I ritardi dei codificatori audio percettivi comunemente usati includono:
Ritardo di frame: la lunghezza del blocco richiesta per la trasformazione del blocco;
Ritardo del banco di filtri: Analisi-il ritardo richiesto dal filtro integrato;
Ritardo di previsione per la commutazione di blocco: il ritardo richiesto per la commutazione di blocco per rilevare i transitori;
Uso del serbatoio di bit: il ritardo richiesto per la dimensione del pool di bit rispetto alla velocità di trasmissione media.
Formula di calcolo del ritardo totale:
Prendiamo come esempio il seguente AAC-LC:
In AAC-LD, per ridurre il ritardo, la lunghezza del frame originale di 1024 viene modificata in 512; non esiste una funzione di cambio finestra, che riduce il ritardo in avanti richiesto per il cambio finestra; allo stesso tempo, per migliorare la qualità della codifica dei segnali transitori, viene introdotto un meccanismo di commutazione della finestra. Il tipo di finestra include una finestra SINE generale e una finestra con meno sovrapposizione. Questa finestra ha una sovrapposizione minima con le finestre seguenti. In questo modo, lo strumento TNS è ottimizzato per eliminare la generazione di segnali transitori. Effetto eco.
MPEG-4 Low Delay Audio Coder (AAC-LD) è derivato direttamente da MPEG-2 AAC e combina i requisiti di bassa latenza necessari per la codifica audio percettiva e la comunicazione bidirezionale. Può garantire il ritardo algoritmico massimo di 20 ms e una buona qualità del suono dei segnali inclusi voce e musica. L'attuale MPEG-4 AAC LD supporta una frequenza di campionamento massima di 48kHz e il numero massimo di canali è 2 (che può essere esteso a più canali).
6. Formato del pacchetto AAC
Prendi due formati comunemente usati come esempi.
ADIF (formato di scambio dati audio)
ADIF è il formato di packaging audio AAC specificato da MPEG2. La caratteristica di questo formato è che l'inizio dei dati audio può essere trovato in modo deterministico, senza la necessità di avviare la decodifica nel mezzo del flusso di dati audio, ovvero la sua decodifica deve essere eseguita all'inizio chiaramente definito. Pertanto, questo formato è comunemente usato nei file su disco.
ADTS (flusso di trasporto dati audio)
La caratteristica di questo formato è che è un flusso di bit con parole di sincronizzazione e la decodifica può iniziare in qualsiasi posizione in questo flusso. La sua caratteristica è il formato del flusso di dati.
Lo scopo della sincronizzazione dei frame è scoprire la posizione dell'intestazione del frame nel flusso di bit. La parola di sincronizzazione dell'intestazione del frame nel formato aac ADTS è "12 1111 1111" a 1111 bit. Le informazioni di intestazione di ADTS sono composte da due parti, una è l'informazione di intestazione fissa, la successiva è l'informazione di intestazione variabile. I dati nelle informazioni di intestazione fissa sono gli stessi per ogni fotogramma, mentre le informazioni di intestazione variabile sono variabili da fotogramma a fotogramma.
Informazioni di intestazione fisse
Informazioni di intestazione variabile
Presi insieme come la seguente tabella
7. Copyright AAC e licenza di brevetto
I file AAC e i flussi di codice non comportano problemi di copyright e licenza di brevetto, quindi i file AAC sono più facili da diffondere e distribuire legalmente rispetto ai formati MP3. Il copyright e la licenza di brevetto di AAC sono solo per i produttori e gli sviluppatori di codec AAC per scopi commerciali, quindi FFMPEG e FAAC e altri software contenenti codec AAC sono rilasciati in forma open source.
La licenza di copyright di AAC è di cinque anni e un periodo di cinque anni può essere continuato dopo la scadenza della rivalutazione.
La quota di copyright di AAC è una quota di iscrizione una tantum di $ 15,000 e non è richiesta alcuna quota annuale di follow-up. La quota di iscrizione per le piccole imprese può essere ridotta a $ 1,000. La definizione di piccola impresa è meno di 15 dipendenti e un reddito annuo inferiore a un milione di dollari.
Licenzianti AAC
l AT&T Corp.
lDolby Laboratories, Inc.
l Fraunhofer-Gesellschaft zur Foerderung der angewandten Forschung, eV
l Koninklijke Philips NV
lMicrosoft Corporation
l NEC Corporation
lNTT DOCOMO, INC.
l Arancio SA
lPanasonic Corporation
l Telefonaktiebolaget LM Ericsson
8. Finalmente
Qual è il formato di AAC-LC? Qual è la differenza tra CAA e CAA?
AAC è il termine generale per l'insieme della codifica audio standardizzata in MPEG2 e MPEG4.
AAC-LC è un codec audio con AOT di 2 nell'AAC standardizzato. È caratterizzato da bassa complessità computazionale, ingombro di memoria ridotto, tempi di standardizzazione anticipati, buona connettività, buona compatibilità e ampio utilizzo. Lo svantaggio è che l'algoritmo ha un'elevata latenza, che non favorisce la comunicazione audio in tempo reale.
|
Inserisci l'email per ricevere una sorpresa
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> Afrikaans
sq.fmuser.org -> albanese
ar.fmuser.org -> Arabo
hy.fmuser.org -> Armenian
az.fmuser.org -> Azerbaigiano
eu.fmuser.org -> Basco
be.fmuser.org -> bielorusso
bg.fmuser.org -> Bulgaro
ca.fmuser.org -> Catalano
zh-CN.fmuser.org -> Cinese (semplificato)
zh-TW.fmuser.org -> Cinese (Tradizionale)
hr.fmuser.org -> croato
cs.fmuser.org -> ceco
da.fmuser.org -> danese
nl.fmuser.org -> Olandese
et.fmuser.org -> Estone
tl.fmuser.org -> Filippino
fi.fmuser.org -> finlandese
fr.fmuser.org -> Francese
gl.fmuser.org -> Galiziano
ka.fmuser.org -> georgiano
de.fmuser.org -> tedesco
el.fmuser.org -> Greca
ht.fmuser.org -> Creolo haitiano
iw.fmuser.org -> Ebraico
hi.fmuser.org -> Hindi
hu.fmuser.org -> Hungarian
is.fmuser.org -> Islandese
id.fmuser.org -> Indonesiano
ga.fmuser.org -> Irlandese
it.fmuser.org -> Italiano
ja.fmuser.org -> giapponese
ko.fmuser.org -> coreano
lv.fmuser.org -> Lettone
lt.fmuser.org -> Lithuanian
mk.fmuser.org -> Macedone
ms.fmuser.org -> Malese
mt.fmuser.org -> Maltese
no.fmuser.org -> Norwegian
fa.fmuser.org -> persiano
pl.fmuser.org -> polacco
pt.fmuser.org -> portoghese
ro.fmuser.org -> Romeno
ru.fmuser.org -> Russo
sr.fmuser.org -> Serbo
sk.fmuser.org -> slovacco
sl.fmuser.org -> Sloveno
es.fmuser.org -> spagnolo
sw.fmuser.org -> Swahili
sv.fmuser.org -> svedese
th.fmuser.org -> Thai
tr.fmuser.org -> turco
uk.fmuser.org -> Ucraino
ur.fmuser.org -> Urdu
vi.fmuser.org -> Vietnamita
cy.fmuser.org -> Gallese
yi.fmuser.org -> Yiddish
FMUSER Wirless Trasmetti video e audio più facilmente!
Contatti
Indirizzo:
No.305 Room HuiLan Building No.273 Huanpu Road Guangzhou Cina 510620
Categorie
Newsletter