DSP应用技术(第一章)
1.1 DSP技術概念
**DSP技術:**將通用的或專用的DSP處理器用于完成數字信號處理的方法和技術。
DSP完成數字信號處理(即實時DSP系統實現框圖)的簡單過程如下圖所示:
1.2 數字信號處理的優勢
- 可控性強:
通過改變程序使微處理器實現不同的功能,比如下表:
| 數字濾波器 | 通過改變程序中的系數來實現低通、高通、帶通等不同的濾波任務以及性能 |
| 軟件無線電技術 | 在一個統一的以高性能DSP處理器為核心的硬件平臺上,加載不同的程序來實現不同工作模式的電臺通信 |
| 虛擬儀器技術 | 是以在同一硬件平臺上獲取外部采樣信號,編寫不同的軟件來實現傳統儀器的測量任務,甚至更為復雜的信號運算、信號產生等功能 |
-
穩定性高
較模擬系統,數字系統受時間和環境的影響小的多;數字制造采用大規模集成電路,其故障率遠比采用分立元件構成的模擬系統的低。 -
精度高
-
抗干擾性能強
-
實現自適應算法
強調系統的自我學習能力:eg:神經網絡、遺傳算法 -
數據壓縮
目的:減小傳輸帶寬
模擬信號:帶限濾波,失真
數字信號:壓縮數據,幾乎無失真 -
大規模集成
系統的一致性、可靠性顯著提高;系統功耗、體積日益減小
模擬信號處理不可替代:
- 自然界的信號絕大多數都是模擬信號
- 模擬信號處理系統從根本上說是實時的
- 射頻(RF)信號的處理要由模擬系統來完成
1.4 實時數字信號處理概念
實時指的是系統必須在有限的時間內完成外部輸入信號的指定處理,即信號處理速度必須大于等于輸入信號更新的速度,而且從信號輸入到處理后輸出的延遲必須足夠的小。
實時取決因素:
eg:
(1)音頻信號:采樣時鐘44.1KHz,字長16bit,則數據率88.2KBps,實時處理速度至少為88.2KBps
(2)視頻信號:一幀畫面512×512點陣,每個像素點用16個色階表示,當傳輸速率為30幀/秒時,則數據率15MBps,實時處理速度至少為15MBps
結論:對實時信號處理速度的要求與原始模擬信號帶寬以及數據格式(字長、維數)、算法復雜程度等因素是密切相關的。
1.5 實時DSP系統組成
實時DSP系統實現框圖如圖所示:
其中DSP子系統是整個系統的核心。
DSP子系統實現方式:
- 通用微計算機
利用統一的平臺,編寫軟件,實現不同的功能。這種方法缺點是速度太慢,不能用于實時系統,只能用于仿真研究。 - 加速處理模塊
在通用微機內部加入專用的加速處理模塊,微機作為系統控制使用。缺點是不適合嵌入式應用。 - 單片機
單片機采用的是馮?諾依曼總線結構,用它構成的系統比較復雜,尤其是乘法運算速度慢,在運算量大的實時控制系統中很難有所作為。 - 專用DSP芯片
專用DSP芯片可用于FFT、FIR、卷積、相關等高速運算。一般速度較快,但是靈活性較差,而且開發工具不完善。 - 可編程FPGA器件
利用VHDL或是VerilogHDL硬件開發語言,通過軟件編程來改變FPGA內部門陣列結構,最終用硬件實現特定數字信號處理算法。這種實現方法具有通用性、并行性,一般作為DSP芯片的協處理器。 - 通用可編程DSP芯片
通用可編程DSP芯片有著更適合于數字信號處理的硬件特點和指令系統,而且其性價比隨著微電子的發展不斷提高,非常適合實現性要求高的應用領域。
通用DSPs構成的子系統:
其中前向通道:
后向通道:
DSP系統典型數據處理方式:
- 數據流處理
數據是在一個輸入樣本到達后,就立即開始進行與該樣本有關的運算,并在下一個樣本到達之前完成。這種在下一個樣本輸入之前完成上一個樣本處理的方法稱為數據流處理方式。例如數字FIR濾波。
特點:每接收一個樣本,就做一次新的運算。輸入樣本周期與輸出樣本周期保持一致。
優點:其結果是隨時更新的。輸出樣本和其影響的輸出結果之間的時延達到理論的最小值。
缺點:要求處理器的速度必須足夠高,能在下一個樣本到達之前完成所有計算。 - 塊處理
首先將輸入樣本存放到存儲器中,當L個輸入樣本都到達以后,才開始處理。這種同時處理多個樣本的方法稱為塊處理技術,也叫幀處理。在塊處理技術中,輸入樣本按組存儲,當有足夠多的樣本到達后,開始處理這個樣本塊。主要應用在輸出采樣率小于輸入采樣率(采用間隔T)的場合,其計算時間限制在LT以內。譬如傅里葉變換運算。
優點:減少頻繁讀寫存儲器所帶來的額外開銷,獲得較高處理效率;可以使用較低速度的處理器。
缺點:時延以及足夠的存儲空間。 - 矢量處理
同時處理多路輸入/輸出信號的方法,稱為矢量處理技術。
通常情況下,矢量處理用來計算兩個信號之間的相關程度。
1.7 DSPs芯片特點
- 算術單元
硬件乘法器大大減少了乘法指令的運算時間,提高了DSP芯片在完成數字信號算法的運算性能。
硬件乘法器是DSPs區別早期通用微處理器的一個重要標志。
DSP芯片內部設置了多個并行操作的功能單元(ALU,乘法器和地址生成器),為進一步提高運算速度。
多功能單元使DSP在單位時間內完成更多的操作,提高了程序執行速度。
- 總線結構
| 通用微處理器CPU | 馮?諾依曼總線結構 | 數據、程序 空間共享/總線復用 |
| 數字信號處理芯片DSP | 哈佛總線結構 | 數據、程序 空間獨立/總線分離 |
- 流水技術
流水技術是將各指令的各個步驟重疊起來執行,即使得若干條指令的不同執行階段可以處于同一時刻并行處理,這樣每一個階段稱作一個流水。 - 專用尋址單元
DSPs通常都有支持地址計算的算術單元——地址產生器。地址產生器與ALU并行工作,地址的計算不再額外占用CPU時間。
DSPs的地址產生器一般都支持直接尋址、間接尋址,完成地址的加減運算,而且有些DSPs還能夠支持位反轉尋址(用于FFT計算)和循環尋址(用于FIR計算)。 - 片內存儲器
- 豐富的外設
1.8 DSP處理器實現高速運算途徑
- 硬件乘法器及乘加單元
支持單周期的乘法指令、單周期的乘-加操作(MAC) - 多個執行單元
片內多個獨立單元并行執行 - 高效的存儲器訪問
- 數據格式
定點芯片、浮點芯片 - 零開銷循環
支持高效的循環操作,在無須花費任何時鐘周期的情況下,實現FOR—NEXT循環。往往將這種特性稱為“零開銷循環”。 - 數據流的線性I/O
為了達到高性能低成本的輸入和輸出,大多數DSP處理器都有一個或多個專門的串口或并口,并采用線性的處理機制,例如低開銷的中斷和DMA,使得數據的傳輸不影響或盡可能少地影響處理器計算單元的工作。 - 專門的指令集
1.9 DSP芯片性能指標及選型依據
DSP評價方法:
- 傳統性能評價:
| MIPS | Millions of Instructions per Second百萬指令每秒 |
| MOPS | Millions of Operations per Second百萬操作每秒 |
| MFLOPS | Millions of Float Operations per Second百萬浮點操作每秒 |
| MACS | Multiply-Accumulates per Second乘加次數每秒 |
- 完整應用評價:
優點:
可以完整的評估不同系列DSP芯片完成某一特定應用任務的詳細性能指標,包括執行時間、存儲器使用、功耗等指標。
缺點:
? 真實的環境難以模擬,評價難以做到公平
? 難以確保不同DSP應用軟件的最優
? 評價更依賴于系統而非DSP本身
? 評價系統成本過高 - 核心算法評價:
BDTI 提出了一種使用核心算法和應用測試的方法。它是介于過于簡單的MIPS類指標和過于復雜的完全基于應用的指標之間的方法。核心算法是構成大多數信號處理系統的基本模塊,其中包括FFT、濾波器等。
統計量:執行時間、存儲器使用、能耗
控制指標的優化則在于存儲器的使用。
控制代碼的大小,基本上決定了片內存儲器的大小,從而在很大程度上決定DSP處理器的成本。
測量方式:軟件仿真周期技術(simulate)、基于硬件的應用開發工具測量(emulate)。
選型依據:
- 速度
運算速度是DSP處理器一個最重要的性能指標,也是選擇DSP處理器主要因素。可以用以下指標來衡量:指令周期,MACS,FFT執行時間,MIPS,MOPS,MFLOPS; - 精度
浮點與定點的選擇,字長的選擇 - 芯片資源
片內RAM,ROM,FLASH等儲存器的大小,可擴展空間,總線接口,I/O接口,外設資源:比如定時器,DMA,串口,PCI接口,CAN總線接口,網絡接口,硬件譯碼器,PWM產生器,AD,HPI接口等等。 - 開發工具
開發工具是否完備,開發環境功能是否強大,開發界面是否友好,是否有現成的庫函數。 - 支持多處理器
雷達和聲納等高數據率和大運算量的應用系統,往往需要使用多個DSP處理器。多處理器之間的連接是否容易(處理器之間通信電路時間以及成本)和連接性能成為主要因素。 - 功耗與電源管理
工作電壓,休眠與待機模式,外設電源控制 - 成本
封裝形式、質量標準、供貨情況、生命周期等等
總結
以上是生活随笔為你收集整理的DSP应用技术(第一章)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: java log4j 路径配置_指定lo
- 下一篇: 算法动画图解(安卓)、排序算法的可视化