當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

VoIP技术(2)--语音编码算法-1

發布時間：2023/12/18 编程问答 56 豆豆

生活随笔收集整理的這篇文章主要介紹了 VoIP技术(2)--语音编码算法-1 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

4．語音編碼算法原理與應用

4.1 波形編碼算法基本原理

語音編碼主要有波形編碼和參數編碼兩大類。波形編碼就是根據語音信號波形導出相應的數字編碼形式。最早的波形編碼就是PCM，即ITU-T G.711A和ITU-T G.711μ，其編碼速率為64kbit/s。

圖9 自適應量化器

PCM雖然能夠提供相當好的語音質量，但要占用過高的網絡帶寬資源。這里主要討論低速率的波形編碼算法，是利用了連續語音之間的相關性，主要采用的技術為自適應量化器和自適應預測器。

為了獲得僅可能大的量化信噪比，應該對小信號采用小的量化步長，對大信號采用較大的量化步長。使量化器范圍與輸入信號的動態范圍相匹配，減小量化噪聲。這就是自適應量化技術。自適應量化分為兩類：前向自適應量化和后向自適應量化，目前常用的是后向自適應量化。

自適應預測的基本原理是根據語音波形的時間相關性確定預測系數，使差分信號的方差為最小，時間相關性則以自相關函數來度量，如圖9所示。

4.2 參數編碼算法基本原理

語音的種類主要有兩種：濁音和清音。聲帶周期性地打開和關閉產生固定頻率的聲音，這個頻率就是濁音的音調；音調頻率男性為50~250Hz，女性為100~500Hz；考慮到音頻等聲音頻率范圍，一般是0.3kHz~3.4kHz，因此8kHz的采樣頻率滿足采樣定理。從頻域上來看，幅頻頻譜的包洛有幾個明顯的局部最大值，稱為共振峰，頻譜的精細結構呈現周期性。清音的頻譜沒有周期性，峰值的分布也沒有明顯的規律，整個頻譜相對比較平坦，類似于白噪聲，因而幾乎不可預測。

圖10 語音生成模型

參數編碼器又稱為聲碼器（Vocoder），它的原理和設計思想跟波形編碼完全不同。參數編碼根據對聲音形成機理的分析，構造語音生成模型(如圖10)，該模型以一定精度模擬發話者的發聲聲道；接收端根據該模型還原生成發話者的因素。由于話音信號變化是緩慢的，模型參數的更新頻度較低，可以有效地降低編碼比特率。因此參數編碼在移動通信、VoIP系統等領域得以廣泛應用。

??????????? 參數編碼器主要可分為三類：通道式、共振峰式和線性預測編碼(LPC:Linear Predictive Coding)方式。其中線性預測編碼方式的性能優異，目前低比特率語音編碼器都采用這種技術。

4.3 編碼算法綜述及其屬性和性能評估

在VoIP系統中，為了充分地利用網絡帶寬資源，一般均采用語音壓縮編碼。語音編碼的主要屬性有比特率、時延、復雜度和語音質量四項。在具體的實現中，這些屬性往往相互沖突，在實際應用中，應該是對各項屬性的折衷，確定合適的編碼。

算法綜述：

降低比特率是往往是語音編碼的首要目標，采用的壓縮編碼的主要目的就是充分利用網絡資源。一般來說，編碼的比特率越低，算法的復雜度就越高，編碼的處理時延也會越長，并降低語音質量。

目前，話音和圖像壓縮技術發展十分迅速，已經研究開發出很多高效率的壓縮編碼技術。如先進的以碼本激勵線性預測(CELP)原理為基礎的G.729、G.723(G.723.1)話音壓縮編碼技術。常用的ITU-T G.729算法和ITU-T G.723.1算法的編碼速率分別為8kbit/s和5.3或6.3kbit/s。以G.729為例，它可將經過采樣的64kb/s話音以幾乎不失真的質量壓縮至8kb/s。話音壓縮編碼技術是IP電話技術的一個重要組成部分。圖像編碼方面有IP網絡會議系統采用的H.261(活動圖像編碼)和H.263(低速率活動圖像編碼)。傳真編碼方面則有T.38。

近年來，出現了一些可變比特率的技術，主要有兩個算法。

活動語音檢測(VAD: Voice Activity Detection)：主要用于檢測輸入信號是話音還是背景噪音。

舒適噪聲生成(CNG: Comfortable Noise Generation)：主要用于接收方重建背景噪聲。

根據統計，雙方通話的過程中，每一方真正講話的時間約為40%，即約有50％為聆聽對方講話的靜默時間，10％為講話時短暫停頓的靜默時間。靜音檢測技術可以有效剔除靜默信號，從而使話音信號占用的帶寬要求進一步降低到3.5kb/s左右，一個很自然的想法就是：通過利用VAD技術，在講話時，媒體流正常發送，在沒講話時，不向對方發送媒體流，為了不使得對方產生斷線的錯覺，在對方產生舒適噪聲。這種算法實現地不當，就會丟掉部分語音，如句子的開始。一個好的算法應該保證：丟掉的語音小于64毫秒，而且丟掉的語音小于0.2%。

本文來自CSDN博客，轉載請標明出處：http://blog.csdn.net/jaxkxu/archive/2010/08/16/5815849.aspx

總結

以上是生活随笔為你收集整理的VoIP技术(2)--语音编码算法-1的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： ThinkPHP--initialize
下一篇： activity劫持学习与复现

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

VoIP技术(2)--语音编码算法-1

總結