Parlando di tecnologia vocale di rete

Quando utilizziamo strumenti come Skype e QQ per condurre senza problemi chat vocali e video con gli amici, ci siamo mai chiesti quali potenti tecnologie ci siano dietro? Questo articolo fornirà una breve introduzione alle tecnologie utilizzate nelle chiamate vocali di rete, che possono essere considerate come un assaggio del leopardo.

Le chiamate vocali via Internet sono generalmente bidirezionali, il che è simmetrico a livello di modello. Per semplicità, possiamo discutere il canale in una direzione. Una parte parla e l'altra parte sente la voce. Sembra semplice e veloce, ma il processo alla base è piuttosto complicato.

Questo è il modello più elementare costituito da cinque importanti collegamenti: acquisizione, codifica, trasmissione, decodifica e riproduzione.

La raccolta vocale si riferisce alla raccolta di dati audio da un microfono, ovvero la conversione di campioni sonori in segnali digitali. Coinvolge diversi parametri importanti: frequenza di campionamento, numero di bit di campionamento e numero di canali.

Per dirla semplicemente: la frequenza di campionamento è il numero di azioni di acquisizione in 1 secondo; il numero di bit di campionamento è la lunghezza dei dati ottenuti per ciascuna azione di acquisizione.

La dimensione di un frame audio è pari a: (frequenza di campionamento × numero di bit di campionamento × numero di canali × tempo)

Solitamente, la durata di un frame di campionamento è di 10 ms, ovvero ogni 10 ms di dati costituisce un frame audio. Supponendo: la frequenza di campionamento è 16k, il numero di bit di campionamento è 16 bit e il numero di canali è 1, quindi la dimensione di un frame audio di 10 ms è: (16000*16*1*0.01)/8 = 320 byte. Nella formula di calcolo, 0.01 è un secondo, ovvero 10 ms.

Supponendo di inviare direttamente il frame audio raccolto senza codifica, possiamo calcolare il requisito di larghezza di banda richiesto. Sempre l'esempio sopra: 320*100 = 32KBytes/s, se convertito in bit/s, è 256kb/s. Questo è un grande utilizzo della larghezza di banda. Con gli strumenti di monitoraggio del traffico di rete, possiamo scoprire che quando le chiamate vocali vengono effettuate con software IM come QQ, il traffico è di 3-5 KB/s, che è un ordine di grandezza inferiore al traffico originale. Ciò è dovuto principalmente alla tecnologia di codifica audio. Pertanto, nell'attuale applicazione di chiamata vocale, questo collegamento di codifica è indispensabile. Esistono molte tecnologie di codifica vocale comunemente utilizzate, come G.729, iLBC, AAC, SPEEX e così via.

Quando un frame audio è codificato, può essere inviato al chiamante tramite la rete. Per le applicazioni in tempo reale come le conversazioni vocali, la bassa latenza e la stabilità sono molto importanti, il che richiede che la nostra rete trasmetta in modo molto fluido.

Quando l'altra parte riceve il frame codificato, lo decodificherà per ripristinarlo sui dati che possono essere riprodotti direttamente dalla scheda audio.

Una volta completata la decodifica, il fotogramma audio ottenuto può essere inviato alla scheda audio per la riproduzione. Allegato: puoi fare riferimento all'introduzione e al codice sorgente demo e al download dell'SDK di MPlayer, un componente di riproduzione vocale

Se solo affidandosi alla suddetta tecnologia è possibile realizzare un sistema di dialogo sonoro applicato alla rete WAN, allora non c'è molto bisogno di scrivere questo articolo. È proprio che molti fattori realistici hanno introdotto molte sfide per il suddetto modello concettuale, il che rende non così semplice la realizzazione del sistema vocale di rete, che coinvolge molte tecnologie professionali. Naturalmente, la maggior parte di queste sfide ha già soluzioni mature. Prima di tutto, dobbiamo definire un sistema di dialogo vocale di "buon effetto". Penso che dovrebbe raggiungere i seguenti punti:

(1) Bassa latenza. Solo con una bassa latenza le due parti della chiamata possono avere un forte senso di Realtime. Naturalmente, questo dipende principalmente dalla velocità della rete e dalla distanza tra le posizioni fisiche dei due interlocutori. Dal punto di vista del software puro, la possibilità di ottimizzazione è molto ridotta.

Di seguito parleremo delle tecnologie aggiuntive utilizzate nell'attuale sistema di dialogo vocale di rete una per una.

1. Cancellazione dell'eco AEC Quasi tutti ormai sono abituati a utilizzare direttamente la funzione di riproduzione vocale del PC o del notebook durante la chat vocale. Come tutti sanno, questa piccola abitudine ha rappresentato una grande sfida per la tecnologia vocale. Quando si utilizza la funzione altoparlante, il suono riprodotto dall'altoparlante verrà nuovamente raccolto dal microfono e ritrasmesso all'altra parte, in modo che l'altra parte possa sentire la propria eco. Pertanto, nelle applicazioni pratiche, è necessaria la funzione di cancellazione dell'eco. Dopo aver ottenuto il frame audio raccolto, questo spazio prima della codifica è il momento in cui il modulo di cancellazione dell'eco funziona. Il principio è semplicemente che il modulo di cancellazione dell'eco esegua alcune operazioni di tipo cancellazione nel frame audio raccolto in base al frame audio appena riprodotto, in modo da rimuovere l'eco dal frame raccolto. Questo processo è piuttosto complicato ed è anche correlato alle dimensioni della stanza in cui ti trovi quando stai chattando e alla tua posizione nella stanza, perché queste informazioni determinano la lunghezza del riflesso dell'onda sonora. Il modulo di cancellazione dell'eco intelligente può regolare dinamicamente i parametri interni per adattarsi al meglio all'ambiente attuale.

2. Soppressione del rumore DENOISE La soppressione del rumore, nota anche come elaborazione della riduzione del rumore, si basa sulle caratteristiche dei dati vocali per identificare la parte del rumore di fondo e filtrarla dai frame audio. Molti codificatori hanno questa funzione integrata.

3. JitterBuffer Il jitter buffer viene utilizzato per risolvere il problema del jitter della rete. Il cosiddetto jitter di rete significa che il ritardo di rete sarà sempre maggiore. In questo caso, anche se il mittente invia regolarmente pacchetti di dati (ad esempio, un pacchetto viene inviato ogni 100 ms), il destinatario non può ricevere la stessa temporizzazione. A volte non è possibile ricevere alcun pacchetto in un ciclo, a volte vengono ricevuti più pacchetti in un ciclo. In questo modo, il suono che sente il ricevitore è una carta una carta. JitterBuffer funziona dopo il decoder e prima della riproduzione vocale. In altre parole, dopo che la decodifica vocale è stata completata, il frame decodificato viene inserito nel JitterBuffer e quando arriva il callback di riproduzione della scheda audio, il frame più vecchio viene recuperato dal JitterBuffer per la riproduzione. La profondità del buffer di JitterBuffer dipende dal grado di jitter della rete. Maggiore è il jitter di rete, maggiore è la profondità del buffer e maggiore è il ritardo nella riproduzione dell'audio. Pertanto, JitterBuffer utilizza un ritardo maggiore in cambio di una riproduzione audio fluida, perché rispetto al suono una scheda una carta, un ritardo leggermente maggiore ma un effetto più fluido, la sua esperienza soggettiva è migliore. Ovviamente, la profondità del buffer di JitterBuffer non è costante, ma regolata dinamicamente in base ai cambiamenti nel grado di jitter della rete. Quando la rete viene ripristinata per essere molto liscia e non ostruita, la profondità del buffer sarà molto piccola, quindi l'aumento del ritardo di riproduzione dovuto a JitterBuffer sarà trascurabile.

4. Rilevamento muto VAD In una conversazione vocale, se una delle parti non sta parlando, non verrà generato traffico. A questo scopo viene utilizzato il rilevamento dell'audio. Il rilevamento del mute è solitamente integrato anche nel modulo di codifica. L'algoritmo di rilevamento silenzioso combinato con il precedente algoritmo di soppressione del rumore può identificare se al momento è presente un input vocale. Se non c'è input vocale, può codificare ed emettere un frame codificato speciale (ad esempio, la lunghezza è 0). Soprattutto in una videoconferenza a più persone, di solito parla solo una persona. In questo caso, l'uso della tecnologia di rilevamento silenzioso per risparmiare larghezza di banda è ancora molto considerevole.

5. Algoritmo di missaggio In una chat vocale con più persone, è necessario riprodurre i dati vocali di più persone contemporaneamente e la scheda audio riproduce solo un buffer. Pertanto, dobbiamo mescolare più voci in una. Questo è ciò che fa l'algoritmo di miscelazione. Anche se riesci a trovare un modo per bypassare il missaggio e lasciare che più suoni vengano riprodotti contemporaneamente, ai fini della cancellazione dell'eco, deve essere mixato in un'unica riproduzione, altrimenti, la cancellazione dell'eco può eliminare solo alcuni dei molteplici suoni a maggior parte. Fino in fondo. La miscelazione può essere eseguita sul lato client o sul lato server (che può risparmiare larghezza di banda a valle). Se vengono utilizzati canali P2P, il missaggio può essere eseguito solo sul lato client. Se si sta mixando sul client, di solito, il missaggio è l'ultimo collegamento prima della riproduzione. Questo articolo è un sommario approssimativo della nostra esperienza nell'implementazione della parte vocale di OMCS. Qui, abbiamo appena fatto una semplice descrizione di ogni collegamento nella figura, e ognuno di essi può essere scritto in un lungo foglio o anche in un libro. Pertanto, questo articolo è solo per fornire una mappa introduttiva per coloro che sono nuovi nello sviluppo di sistemi vocali di rete e fornire alcuni indizi.

Fino a che punto (lungo) il coperchio del trasmettitore?

Il raggio di trasmissione dipende da molti fattori. La distanza reale si basa sulla antenna installazione altezza, guadagno di antenna, utilizzando ambiente come costruzione ed altri ostacoli, sensibilità del ricevitore, antenna del ricevitore. Installazione antenna più alta e l'utilizzo in campagna, la distanza sarà molto più lontano.

ESEMPIO 5W trasmettitore FM utilizzare in città e città natale:

Ho un uso del cliente 5W trasmettitore FM con antenna GP USA nella sua città natale, e lui prova con una macchina, coprire 10km (6.21mile).

I test il trasmettitore FM 5W con antenna GP nella mia città natale, che coprono circa il 2km (1.24mile).

I test il trasmettitore FM 5W con antenna GP nella città di Guangzhou, che coprono circa il solo 300meter (984ft).

Qui di seguito sono la gamma approssimativa di diversi trasmettitori di potenza FM. (L'intervallo è di diametro)

0.1W ~ 5W Trasmettitore FM: 100M ~ 1KM

5W ~ 15W FM Ttransmitter: 1KM ~ 3KM

15W ~ 80W Trasmettitore FM: 3KM ~ 10KM

80W ~ 500W Trasmettitore FM: 10KM ~ 30KM

500W ~ 1000W Trasmettitore FM: 30KM ~ 50KM

1KW ~ 2KW Trasmettitore FM: 50KM ~ 100KM

2KW ~ 5KW Trasmettitore FM: 100KM ~ 150KM

5KW ~ 10KW Trasmettitore FM: 150KM ~ 200KM

Come contattarci per il trasmettitore?

Call me + 8618078869184 O
Se la tua attività ha avuto un impatto negativo e posso esserti di aiuto, mi piacerebbe aiutarti., Mandami un'email [email protected]
1.How lontano si vuole coprire di diametro?
2.How alto di voi Tower?
3.Where sei?
E vi daremo consigli più professionale.

Chi siamo

FMUSER.ORG è una società di integrazione di sistemi che si occupa di trasmissione wireless RF / apparecchiature audio video da studio / streaming e elaborazione dati. Forniamo tutto, dalla consulenza e consulenza attraverso l'integrazione del rack all'installazione, alla messa in servizio e alla formazione.

Offriamo trasmettitori FM, trasmettitori TV analogici, trasmettitori TV digitali, trasmettitori UHF VHF, antenne, connettori per cavi coassiali, STL, elaborazione in onda, prodotti Broadcast per lo studio, monitoraggio del segnale RF, codificatori RDS, processori audio e unità di controllo del sito remoto, Prodotti IPTV, codificatore / codificatore audio / video, progettato per soddisfare le esigenze sia delle grandi reti di trasmissione internazionali che di piccole stazioni private.

La nostra soluzione dispone di stazione radio FM / stazione TV analogica / stazione TV digitale / attrezzatura da studio audio video / collegamento trasmettitore da studio / sistema di telemetria del trasmettitore / sistema TV dell'hotel / trasmissione live IPTV / trasmissione live streaming / videoconferenza / sistema di trasmissione CATV.

Stiamo utilizzando prodotti di tecnologia avanzata per tutti i sistemi, perché sappiamo che l'alta affidabilità e le alte prestazioni sono così importanti per il sistema e la soluzione. Allo stesso tempo, dobbiamo anche assicurarci che il nostro sistema di prodotti abbia un prezzo molto ragionevole.

Abbiamo clienti di emittenti pubbliche e commerciali, operatori di telecomunicazioni e autorità di regolamentazione e offriamo anche soluzioni e prodotti a molte centinaia di emittenti minori, locali e comunitarie.

FMUSER.ORG esporta da più di 15 anni e ha clienti in tutto il mondo. Con 13 anni di esperienza in questo campo, abbiamo un team di professionisti per risolvere tutti i tipi di problemi dei clienti. Ci siamo impegnati a fornire prezzi estremamente ragionevoli di prodotti e servizi professionali. Contatto email : [email protected]

La nostra fabbrica

Abbiamo modernizzazione della fabbrica. Siete invitati a visitare la nostra fabbrica quando si arriva in Cina.

Allo stato attuale, ci sono già clienti 1095 in tutto il mondo visitato il nostro ufficio di Guangzhou Tianhe. Se venite in Cina, siete invitati a farci visita.

Alla Fiera

Questa è la nostra partecipazione a 2012 globali Fonti Hong Kong Electronics Fair . I clienti provenienti da tutto il mondo infine, avere la possibilità di stare insieme.

Dove è FMUSER?

Puoi cercare questi numeri " 23.127460034623816,113.33224654197693 "in google map, puoi trovare il nostro ufficio fmuser.

ufficio FMUSER Guangzhou è nel quartiere Tianhe che è la centro del Cantone . Molto vicino Vai all’email la fiera di Canton , stazione ferroviaria di Guangzhou, strada Xiaobei e Dashatou , Solo bisogno 10 minuti se prendere TAXI . Benvenuti amici di tutto il mondo a visitare e negoziare.

Contatto: Blue Sky
Cellulare: + 8618078869184
WhatsApp: + 8618078869184
Wechat: + 8618078869184
E-mail: [email protected]
QQ: 727926717
Skype: sky198710021
Indirizzo: No.305 camera Huilan costruzione No.273 Huanpu Strada Guangzhou Cina Codice postale: 510620

Inglese: Accettiamo tutti i pagamenti, come PayPal, Carta di credito, Western Union, Alipay, Money Bookers, T / T, LC, DP, DA, OA, Payoneer, se hai qualche domanda, per favore contattami [email protected] o WhatsApp + 8618078869184

PayPal.  www.paypal.com

Si consiglia di utilizzare Paypal per comprare i nostri articoli, il Paypal è un modo sicuro per acquistare su internet.

Ogni della nostra lista elemento della pagina in basso sulla parte superiore hanno un logo PayPal per pagare.

Carta di credito.Se non avete paypal, ma avete carta di credito, è anche possibile fare clic sul pulsante giallo PayPal per pagare con carta di credito.

-------------------------------------------------- -------------------

Ma se non hai una carta di credito e non avere un conto paypal o difficile ottenuto un accout PayPal, è possibile utilizzare il seguente:
Western Union.  www.westernunion.com

Pagare con Western Union a me:

Nome / Nome proprio: Yingfeng
Cognome / Cognome / Nome famiglia: Zhang
Nome completo: Yingfeng Zhang
Paese: China
Città: Guangzhou

-------------------------------------------------- -------------------

T / T.  Paga con T / T (bonifico bancario / trasferimento telegrafico / bonifico bancario)
Primi DATI BANCARIE (CONTO AZIENDA):

SWIFT BIC: BKCHHKHHXXX
Nome della banca: BANK OF CHINA (HONG KONG) LIMITED, HONG KONG
Indirizzo bancario: BANK OF CHINA TOWER, 1 GARDEN ROAD, CENTRAL, HONG KONG
CODICE BANCARIO: 012
Nome account: FMUSER INTERNATIONAL GROUP LIMITED
Conto NO. : 012-676-2-007855-0

-------------------------------------------------- -------------------
Secondo DATI BANCARIE (CONTO AZIENDALE):
Beneficiario: FMuser International Group Inc
Numero di conto: 44050158090900000337
Banca del beneficiario: China Construction Bank Guangdong Branch
Codice SWIFT: PCBCCNBJGDX
Indirizzo: NO.553 Tianhe Road, Guangzhou, Guangdong, distretto di Tianhe, Cina
**Nota: quando trasferisci denaro sul nostro conto bancario, NON scrivere nulla nell'area dei commenti, altrimenti non saremo in grado di ricevere il pagamento a causa della politica del governo sul commercio internazionale.

* Sarà inviato in 1-2 giorni lavorativi in cui il pagamento chiaro.

* Invieremo al tuo indirizzo paypal. Se si desidera cambiare l'indirizzo, si prega di inviare il vostro indirizzo corretto e numero di telefono per la mia e-mail [email protected]

* Se i pacchetti è inferiore 2kg, ci sarà spedito via posta aerea, ci vorranno circa 15-25days a mano.

Se il pacchetto è più di 2kg, spediremo via lo SME, DHL, UPS, Fedex consegna veloce espresso, ci vorranno circa 7 ~ 15days alla tua mano.

Se il pacchetto più di 100kg, invieremo via DHL o trasporto aereo. Ci vorranno circa 3 ~ 7days alla tua mano.

Tutti i pacchetti sono forma Cina Guangzhou.

* Il pacco verrà inviato come "regalo" e verrà declassato il meno possibile, l'acquirente non dovrà pagare la "TASSA".

* Dopo la nave, vi invieremo una e-mail e vi darò il numero di tracking.

Per garanzia.
Contattaci --- >> Restituiscici l'articolo --- >> Ricevi e invia un'altra sostituzione.

Nome: Liu Xiaoxia
Indirizzo: 305Fang HuiLanGe HuangPuDaDaoXi 273Hao TianHeQu Guangzhou in Cina.
ZIP: 510620
Telefono: + 8618078869184

Si prega di restituire a questo indirizzo e scrivere il vostro paypal indirizzo, nome, problema sulla nota: