FMUSER Wirless Trasmetti video e audio più facilmente!

[email protected] WhatsApp + 8618078869184
Lingua

    Conoscenza di base audio e principi di codifica

     

     1. Concetti di base

     

    1) Bit rate: indica quanti bit al secondo devono essere rappresentati i dati audio codificati (compressi) e l'unità è solitamente kbps.

     

    2) Sonorità e intensità: gli attributi soggettivi di un suono. Il volume indica quanto forte suona un suono. Il volume varia principalmente con l'intensità del suono, ma è anche influenzato dalla frequenza. In generale, i suoni a media frequenza puri sono migliori dei suoni a bassa e alta frequenza puri.

     

    3) Campionamento e frequenza di campionamento: il campionamento consiste nel trasformare un segnale a tempo continuo in un segnale digitale discreto. La frequenza di campionamento si riferisce al numero di campioni raccolti al secondo.

     

    Legge di campionamento di Nyquist: Quando la frequenza di campionamento è maggiore o uguale a 2 volte la componente di frequenza più alta del segnale continuo, il segnale campionato può essere utilizzato per ricostruire perfettamente il segnale continuo originale.

     

    2. formati audio comuni

     

    1) Il formato WAV è un formato di file audio sviluppato da Microsoft, chiamato anche file audio wave. È il primo formato audio digitale, ampiamente supportato dalla piattaforma Windows e dalle sue applicazioni, e ha un basso tasso di compressione.

     

    2) MIDI è l'abbreviazione di Musical Instrument Digital Interface, nota anche come Musical Instrument Digital Interface, che è uno standard internazionale unificato per la musica digitale/strumenti musicali sintetici elettronici. Definisce il modo in cui i programmi di musica per computer, i sintetizzatori digitali e altri dispositivi elettronici scambiano segnali musicali e specifica il protocollo di trasmissione dei dati tra cavi e hardware e dispositivi che collegano strumenti musicali elettronici di diversi produttori a computer e può simulare il suono di più brani musicali strumenti. Un file MIDI è un file in formato MIDI e alcuni comandi sono memorizzati nel file MIDI. Invia queste istruzioni alla scheda audio e la scheda audio sintetizzerà il suono secondo le istruzioni.

     

    3) Il nome completo di MP3 è MPEG-1 Audio Layer 3, che è stato integrato nelle specifiche MPEG nel 1992. MP3 può comprimere file audio digitali con un'elevata qualità del suono e una bassa frequenza di campionamento. L'applicazione più comune.

     

    4) MP3Pro è stato sviluppato dalla Swedish Coding Technology Company, che contiene due tecnologie principali: una è l'esclusiva tecnologia di decodifica della Coding Technology Company e l'altra è l'integrazione del titolare del brevetto MP3 francese Thomson Multimedia Company e tedesco Fraunhofer Una tecnologia di decodifica ricercata congiuntamente dall'Associazione Circuiti. MP3Pro può migliorare la qualità del suono della musica MP3 originale senza sostanzialmente modificare la dimensione del file. Può mantenere la qualità del suono prima della compressione nella massima misura mentre comprime i file audio a una velocità in bit inferiore.

     

    5) MP3Pro è stato sviluppato dalla Swedish Coding Technology Company, che contiene due tecnologie principali: una è l'esclusiva tecnologia di decodifica della Coding Technology Company e l'altra è l'integrazione del titolare del brevetto MP3 francese Thomson Multimedia Company e tedesco Fraunhofer Una tecnologia di decodifica ricercata congiuntamente dall'Associazione Circuiti. MP3Pro può migliorare la qualità del suono della musica MP3 originale senza sostanzialmente modificare la dimensione del file. Può mantenere la qualità del suono prima della compressione nella massima misura mentre comprime i file audio a una velocità in bit inferiore.

     

    6) WMA (Windows Media Audio) è il capolavoro di Microsoft nel campo dell'audio e del video su Internet. Il formato WMA raggiunge un tasso di compressione più elevato riducendo il traffico dati ma mantenendo la qualità del suono. Il rapporto di compressione può generalmente raggiungere 1:18. Inoltre, WMA può anche proteggere il copyright tramite DRM (Digital Rights Management).

     

    7) RealAudio è un formato di file lanciato da Real Networks. La caratteristica più grande è che può trasmettere informazioni audio in tempo reale, specialmente quando la velocità della rete è lenta, può comunque trasmettere dati senza problemi, quindi RealAudio è principalmente adatto per la riproduzione online in rete. Gli attuali formati di file RealAudio includono principalmente RA (RealAudio), RM (RealMedia, RealAudio G2), RMX (RealAudio Secured), ecc. La caratteristica comune di questi file è che la qualità del suono cambia con la differenza della larghezza di banda della rete. Partendo dal presupposto che la maggior parte delle persone sente un suono uniforme, gli ascoltatori con una larghezza di banda più ampia possono ottenere una migliore qualità del suono.

     

    8) Audible ha quattro formati diversi: Audible1, 2, 3, 4. Il sito web Audible.com vende principalmente audiolibri su Internet e fornisce protezione per i prodotti e i file che vendono attraverso uno dei quattro formati audio dedicati Audible.com . Ciascun formato considera principalmente la sorgente audio e il dispositivo di ascolto utilizzato. I formati 1, 2 e 3 utilizzano diversi livelli di compressione vocale, mentre il formato 4 utilizza una frequenza di campionamento inferiore e lo stesso metodo di decodifica dell'MP3. La voce risultante è più chiara e può essere scaricata in modo più efficiente da Internet. Audible utilizza il proprio strumento di riproduzione desktop, che è Audible Manager. Con questo lettore, puoi riprodurre file in formato Audible archiviati su un PC o trasferiti su un lettore portatile.

     

    9) AAC è in realtà l'abbreviazione di Advanced Audio Coding. AAC è un formato audio sviluppato congiuntamente da Fraunhofer IIS-A, Dolby e AT&T. Fa parte delle specifiche MPEG-2. L'algoritmo utilizzato da AAC è diverso da quello di MP3. AAC combina altre funzioni per migliorare l'efficienza della codifica. L'algoritmo audio di AAC supera di gran lunga alcuni algoritmi di compressione precedenti (come MP3, ecc.) nelle capacità di compressione. Supporta inoltre fino a 48 tracce audio, 15 tracce audio a bassa frequenza, più frequenze di campionamento e bit rate, compatibilità multilingue e maggiore efficienza di decodifica. In breve, AAC può fornire una migliore qualità del suono con la premessa che è il 30% più piccolo dei file MP3.

     

    10) Ogg Vorbis è un nuovo formato di compressione audio, simile ai formati musicali esistenti come MP3. Ma una differenza è che è completamente gratuito, aperto e senza restrizioni sui brevetti. Vorbis è il nome di questo meccanismo di compressione audio e Ogg è il nome di un progetto che intende progettare un sistema multimediale completamente aperto. VORBIS è anche compressione con perdita, ma utilizza modelli acustici più avanzati per ridurre la perdita. Pertanto, OGG codificato con lo stesso bit rate suona meglio di MP3.

     

    11) APE è un formato audio compresso senza perdita di dati, con la premessa che la qualità del suono non è ridotta, la dimensione è compressa alla metà del tradizionale file WAV in formato senza perdita.

     

    12) FLAC è l'abbreviazione di Free Lossless Audio Codec, un insieme di ben noti codici di compressione audio lossless gratuiti, che è caratterizzato da compressione lossless.

     

    3. il principio di base della codifica audio

     

    La codifica vocale è dedicata alla riduzione della larghezza di banda del canale richiesta per la trasmissione mantenendo l'alta qualità del parlato in ingresso.

     

    L'obiettivo della codifica vocale è progettare un codificatore a bassa complessità per ottenere una trasmissione di dati di alta qualità al bit rate più basso possibile.

     

    1) Curva della soglia di silenziamento: la soglia alla quale l'orecchio umano può sentire il suono a varie frequenze solo in un ambiente silenzioso.

    2) Banda di frequenza critica

    Poiché l'orecchio umano ha risoluzioni diverse per frequenze diverse, MPEG1/Audio divide l'intervallo di frequenza percepibile entro 22 khz in bande di frequenza critiche 23~26 in base a diversi strati di codifica e diverse frequenze di campionamento. La figura seguente elenca la frequenza centrale e la larghezza di banda della banda di frequenza critica ideale. Come si può vedere in figura, l'orecchio umano ha una migliore risoluzione delle basse frequenze

    3) Effetto di mascheramento nel dominio della frequenza: un segnale con un'ampiezza maggiore maschererà un segnale con una frequenza simile e un'ampiezza minore, come mostrato nella figura seguente:

     

    4) Effetto di mascheramento nel dominio del tempo: in un breve periodo di tempo, se compaiono due suoni, il suono con un SPL (livello di pressione sonora) più grande maschererà il suono con un SPL più piccolo. L'effetto di mascheramento nel dominio del tempo è suddiviso in mascheramento in avanti (premascheramento) e mascheramento all'indietro (postmascheramento). Il tempo di post-mascheramento sarà più lungo, circa 10 volte quello di pre-mascheramento.

    L'effetto di mascheramento nel dominio del tempo aiuta ad eliminare il pre-eco.

     

    4. i mezzi di base di codifica

     

    1) Quantizzatore e quantizzatore

     

    Quantizzazione e quantizzatore: la quantizzazione converte un segnale continuo a tempo discreto in un segnale discreto a tempo discreto. I quantizzatori comuni sono: quantizzatore uniforme, quantizzatore logaritmico e quantizzatore non uniforme. L'obiettivo perseguito dal processo di quantizzazione è ridurre al minimo l'errore di quantizzazione e minimizzare la complessità del quantizzatore (i due sono di per sé una contraddizione).

     

    (A) Quantizzatore uniforme: il più semplice, la peggiore prestazione, adatto solo per la voce telefonica.

     

    (B) Quantizzatore logaritmico: è più complicato del quantizzatore uniforme e facile da implementare, e le sue prestazioni sono migliori del quantizzatore uniforme.

     

    (C) Quantizzatore non uniforme: in base alla distribuzione del segnale, progettare il quantizzatore. La quantificazione dettagliata viene eseguita dove il segnale è denso e la quantificazione approssimativa viene eseguita dove il segnale è sparso.

     

    2) Codificatore vocale

     

    Esistono tre tipi di codificatori vocali: (a) codificatore di forme d'onda; (b) Vocoder; (c) Encoder ibrido.

     

    Il codificatore di forme d'onda mira a costruire una forma d'onda analogica che includa il foglio del rumore di fondo. Agendo su tutti i segnali in ingresso, produrrà campioni di alta qualità e consumerà un bit rate elevato. Il vocoder non rigenererà la forma d'onda originale. Questo set di codificatori estrarrà una serie di parametri, che vengono inviati all'estremità ricevente per derivare il modello di generazione della voce. La qualità della voce del vocoder non è abbastanza buona. Encoder ibrido, che incorpora i vantaggi dell'encoder della forma d'onda e del sirena.

     

    2.1 Codificatore della forma d'onda

     

    Il design dell'encoder della forma d'onda è spesso indipendente dal segnale. Quindi è adatto alla codifica di vari segnali e non si limita al parlato.

     

    1) Codifica nel dominio del tempo

     

    a) PCM: modulazione del codice a impulsi, è il metodo di codifica più semplice. È solo la discretizzazione e la quantizzazione del segnale e spesso viene utilizzata la logaritmizzazione.

     

    b) DPCM: modulazione differenziale del codice di impulso, che codifica solo la differenza tra i campioni. Lo o più campioni precedenti vengono utilizzati per prevedere il valore del campione corrente. Più campioni vengono utilizzati per fare previsioni, più accurato è il valore previsto. La differenza tra il valore vero e il valore previsto si chiama residuo, che è l'oggetto della codifica.

                       

     

    c) ADPCM: modulazione del codice di impulso differenziale adattativo, codice di impulso differenziale adattativo. Cioè, sulla base del DPCM, il quantizzatore e il predittore vengono opportunamente regolati in base alle variazioni del segnale, in modo che il valore previsto sia più vicino al segnale reale, il residuo sia minore e l'efficienza di compressione sia maggiore.

     

    (2) Codifica nel dominio della frequenza

     

    La codifica nel dominio della frequenza consiste nel scomporre un segnale in una serie di diversi elementi di frequenza ed eseguire una codifica indipendente.

     

    a) Codifica in sottobanda: la codifica in sottobanda è la tecnica di codifica nel dominio della frequenza più semplice. È una tecnologia che trasforma il segnale originale dal dominio del tempo al dominio della frequenza, quindi lo divide in diverse sottobande ed esegue rispettivamente la codifica digitale su di esse. Utilizza un gruppo di filtri passa-banda (BPF) per dividere il segnale originale in diverse sottobande (ad esempio m) (indicate come sottobande). Passare ciascuna sottobanda attraverso le caratteristiche di modulazione equivalenti alla modulazione di ampiezza a banda laterale singola, spostare ciascuna sottobanda a una frequenza vicina allo zero, rispettivamente passare attraverso BPF (per un totale di m) e quindi trasferire ciascuna sottobanda a una velocità prescritta ( Nyquist rate) Il segnale di uscita della sottobanda viene campionato e il valore campionato viene solitamente codificato digitalmente e vengono impostati m encoder digitali. Invia ogni segnale codificato digitale al multiplexer e infine invia il flusso di dati codificato in sottobanda.

     

    Per diverse sottobande, possono essere utilizzati diversi metodi di quantizzazione e diversi numeri di bit possono essere assegnati alle sottobande secondo il modello di percezione dell'orecchio umano.

     

    b) codifica trasformata: codifica DCT.

     

    5. Vocoder

     

    Vocoder di canale: utilizza l'insensibilità dell'orecchio umano alla fase.

     

    vocoder omomorfo: può elaborare efficacemente segnali sintetici.

     

    Vocoder formante: la maggior parte delle informazioni del segnale vocale si trova sulla posizione e sulla larghezza di banda del formante.

     

    vocoder predittivo lineare: il vocoder più comunemente usato.

     

    6. Encoder ibrido

     

    Il codificatore di forme d'onda cerca di preservare la forma d'onda del segnale codificato e può fornire un parlato di alta qualità a un bit rate medio (32 kbps), ma non può essere applicato a occasioni con bit rate basso. Il vocoder tenta di generare un segnale che è acusticamente simile al segnale codificato e può fornire un discorso intelligibile a un bit rate basso, ma il discorso risultante suona innaturale. L'encoder ibrido combina i vantaggi di entrambi.

     

    RELP: Sulla base della previsione lineare, il residuo è codificato. Il meccanismo è: trasmettere solo una piccola parte dei residui e ricostruire tutti i residui all'estremità ricevente (copiare i residui della banda base).

     

    MPC: codifica multi-impulso, che rimuove la correlazione dei residui, e serve a compensare la semplice classificazione delle voci da parte del vocoder in sonore e sorde senza i difetti degli stati intermedi.

     

    CELP: predizione lineare eccitata del libro di codici, che utilizza la predizione del tratto vocale e il predittore a cascata del tono per approssimare meglio il segnale originale.

     

    MBE: eccitazione multibanda, lo scopo è evitare un gran numero di calcoli CELP, per ottenere una qualità superiore rispetto al vocoder.

     

     

     

     

    Elencare tutte le domande

    Nickname

    E-mail

    Domande

    Il nostro altro prodotto:

    Pacchetto di apparecchiature per stazioni radio FM professionali

     



     

    Soluzione IPTV per hotel

     


      Inserisci l'email per ricevere una sorpresa

      fmuser.org

      es.fmuser.org
      it.fmuser.org
      fr.fmuser.org
      de.fmuser.org
      af.fmuser.org -> Afrikaans
      sq.fmuser.org -> albanese
      ar.fmuser.org -> Arabo
      hy.fmuser.org -> Armenian
      az.fmuser.org -> Azerbaigiano
      eu.fmuser.org -> Basco
      be.fmuser.org -> bielorusso
      bg.fmuser.org -> Bulgaro
      ca.fmuser.org -> Catalano
      zh-CN.fmuser.org -> Cinese (semplificato)
      zh-TW.fmuser.org -> Cinese (Tradizionale)
      hr.fmuser.org -> croato
      cs.fmuser.org -> ceco
      da.fmuser.org -> danese
      nl.fmuser.org -> Olandese
      et.fmuser.org -> Estone
      tl.fmuser.org -> Filippino
      fi.fmuser.org -> finlandese
      fr.fmuser.org -> Francese
      gl.fmuser.org -> Galiziano
      ka.fmuser.org -> georgiano
      de.fmuser.org -> tedesco
      el.fmuser.org -> Greca
      ht.fmuser.org -> Creolo haitiano
      iw.fmuser.org -> Ebraico
      hi.fmuser.org -> Hindi
      hu.fmuser.org -> Hungarian
      is.fmuser.org -> Islandese
      id.fmuser.org -> Indonesiano
      ga.fmuser.org -> Irlandese
      it.fmuser.org -> Italiano
      ja.fmuser.org -> giapponese
      ko.fmuser.org -> coreano
      lv.fmuser.org -> Lettone
      lt.fmuser.org -> Lithuanian
      mk.fmuser.org -> Macedone
      ms.fmuser.org -> Malese
      mt.fmuser.org -> Maltese
      no.fmuser.org -> Norwegian
      fa.fmuser.org -> persiano
      pl.fmuser.org -> polacco
      pt.fmuser.org -> portoghese
      ro.fmuser.org -> Romeno
      ru.fmuser.org -> Russo
      sr.fmuser.org -> Serbo
      sk.fmuser.org -> slovacco
      sl.fmuser.org -> Sloveno
      es.fmuser.org -> spagnolo
      sw.fmuser.org -> Swahili
      sv.fmuser.org -> svedese
      th.fmuser.org -> Thai
      tr.fmuser.org -> turco
      uk.fmuser.org -> Ucraino
      ur.fmuser.org -> Urdu
      vi.fmuser.org -> Vietnamita
      cy.fmuser.org -> Gallese
      yi.fmuser.org -> Yiddish

       
  •  

    FMUSER Wirless Trasmetti video e audio più facilmente!

  • Contatti

    Indirizzo:
    No.305 Room HuiLan Building No.273 Huanpu Road Guangzhou Cina 510620

    E-mail:
    [email protected]

    Telefono/WhatApp:
    + 8618078869184

  • Categorie

  • Newsletter

    NOME PRIMO O COMPLETO

    E-mail

  • soluzione paypal  Western UnionBanca di Cina
    E-mail:[email protected]   WhatsApp: +8618078869184 Skype: sky198710021 Chatta con me
    Copyright 2006-2020 Powered By www.fmuser.org

    Contatti