音视频专有名词总结
音視頻專有名詞總結
版本說明
| 0.1 | loon | 2019.1.29 | 初稿 |
目錄
文章目錄
- 音視頻專有名詞總結
- 版本說明
- 目錄
- 一、初衷
- 二、常用音視頻名詞
- 1、D1、D2、D3、D4、D5
- 2、幀、幀數、fps
- 3、kbps、碼率、Mbps、Gbps
- 4、I幀、P幀、B幀
- 5、720P、1080P、CIF、QCIF
- 6、VGA
- 7、RTSP
- 8、G.711
- 9、IPC、NVR、DVR
- 10、ES、PES、PTS、DTS、PS、TS流
- 11、AAC
- 12、H264、H265
- 13、IVS
一、初衷
目前在開發IPC(IP Camera),所以對于音視頻方面的知識必須有一定程度的了解,否則在程序開發以及一些需求文檔閱讀時將會非常困難。
二、常用音視頻名詞
注:以下大多來自百度百科,主要是為了統一總結
1、D1、D2、D3、D4、D5
D1是數字電視系統顯示格式的標準,共分為5種規格,其中D1 和D2標準是我們一般模擬電視的最高標準。
D1:480i格式(525i):720×480(水平480線,隔行掃描),和NTSC模擬電視清晰度相同,行頻為15.25kHz,相當于我們所說的4CIF(704×576)
D2:480P格式(525p):720×480(水平480線,逐行掃描),較D1隔行掃描要清晰不少,和逐行掃描DVD規格相同,行頻為31.5kHz
D3:1080i格式(1125i):1920×1080(水平1080線,隔行掃描),高清放松采用最多的一種分辨率,分辨率為1920×1080i/60Hz,行頻為33.75kHz
D4:720p 格式(750p):1280×720(水平720線,逐行掃描),雖然分辨率較D3要低,但是因為逐行掃描,市面上更多人感覺相對于 1080I(實際逐次540線)視覺效果更加清晰。不過個人感覺來說,在最大分辨率達到1920×1080的情況下,D3要比D4感覺更加清晰,尤其是文 字表現力上,分辨率為1280×720p/60Hz,行頻為45kHz
D5:1080p格式(1125p):1920×1080(水平1080線,逐行掃描),目前民用高清視頻的最高標準,分辨率為1920×1080P/60Hz,行頻為67.5KHZ。
2、幀、幀數、fps
幀——就是影像動畫中最小單位的單幅影像畫面,相當于電影膠片上的每一格鏡頭。 一幀就是一副靜止的畫面,連續的幀就形成動畫,如電視圖象等。
我們通常說幀數,簡單地說,就是在1秒鐘時間里傳輸的圖片的幀數,也可以理解為圖形處理器每秒鐘能夠刷新幾次,通常用fps表示。每一幀都是靜止的圖象,快速連續地顯示幀便形成了運動的假象。高的幀率可以得到更流暢、更逼真的動畫。每秒鐘幀數 (fps) 愈多,所顯示的動作就會愈流暢。
3、kbps、碼率、Mbps、Gbps
kbps千比特每秒,又稱千比特率,指的是數字信號的傳輸速率,也就是每秒鐘傳送多少個千位的信息(k表示千,kb表示的是多少千個位);kbps也可以表示網絡的傳輸速度,為了在直觀上顯得網絡的傳輸速度較快,一般公司都使用kb(千位)來表示。如果是大寫B的kBps,則表示每秒傳送多少千字節。1kByte/s=8kbit/s(一般簡寫為1kB/s=8kb/s)。
碼率我們用的單位是kbps即千位每秒。
通俗一點的理解就是取樣率,單位時間內取樣率越大,精度就越高,處理出來的文件就越接近原始文件,但是文件體積與取樣率是成正比的,所以幾乎所有的編碼格式重視的都是如何用最低的碼率達到最少的失真,圍繞這個核心衍生出來的cbr(固定碼率)與vbr(可變碼率),都是在這方面做的文章,不過事情總不是絕對的,從音頻方面來說,碼率越高,被壓縮的比例越小,音質損失越小,與音源的音質越接近。
類似的單位還有兆位每秒(又稱兆比特每秒,megabit per second, Mbps),Gbps(俗稱千兆)。
4、I幀、P幀、B幀
I幀又稱幀內編碼幀,是一種自帶全部信息的獨立幀,無需參考其他圖像便可獨立進行解碼,可以簡單理解為一張靜態畫面。視頻序列中的第一個幀始終都是I幀,因為它是關鍵幀。
P幀又稱幀間預測編碼幀,需要參考前面的I幀才能進行編碼。表示的是當前幀畫面與前一幀(前一幀可能是I幀也可能是P幀)的差別。解碼時需要用之前緩存的畫面疊加上本幀定義的差別,生成最終畫面。與I幀相比,P幀通常占用更少的數據位,但不足是,由于P幀對前面的P和I參考幀有著復雜的依耐性,因此對傳輸錯誤非常敏感。
B幀又稱雙向預測編碼幀,也就是B幀記錄的是本幀與前后幀的差別。也就是說要解碼B幀,不僅要取得之前的緩存畫面,還要解碼之后的畫面,通過前后畫面的與本幀數據的疊加取得最終的畫面。B幀壓縮率高,但是對解碼性能要求較高。
I幀只需考慮本幀;P幀記錄的是與前一幀的差別;B幀記錄的是前一幀及后一幀的差別,能節約更多的空間,視頻文件小了,但相對來說解碼的時候就比較麻煩。因為在解碼時,不僅要用之前緩存的畫面,而且要知道下一個I或者P的畫面,對于不支持B幀解碼的播放器容易卡頓。
視頻監控系統中預覽的視頻畫面是實時的,對畫面的流暢性要求較高。采用I幀、P幀進行視頻傳輸可以提高網絡的適應能力,且能降低解碼成本所以現階段的視頻解碼都只采用I幀和P幀進行傳輸。
5、720P、1080P、CIF、QCIF
720P是美國電影電視工程師協會(SMPTE)制定的高等級高清數字電視的格式標準,有效顯示格式為:1280×720.SMPTE(美國電影電視工程協會)將數字高清信號數字電視掃描線的不同分為1080P、1080I、720P(i是interlace,隔行的意思,p是Progressive,逐行的意思)。720P是一種在逐行掃描下達到1280×720的分辨率的顯示格式。是數字電影成像技術和計算機技術的融合。
1080P是兩百萬像素的,分辨率達到1920*1080
720P是一百萬像素的,分辨率達到960*720/1280*720
D1的分辨率達到704*576
CIF的分辨率達到352*288
QCIF的分辨率達到176*144
6、VGA
VGA(Video Graphics Array)是IBM在1987年隨PS/2機一起推出的一種視頻傳輸標準,具有分辨率高、顯示速率快、顏色豐富等優點,在彩色顯示器領域得到了廣泛的應用。不支持熱插拔,不支持音頻傳輸。
7、RTSP
RTSP(Real Time Streaming Protocol),RFC2326,實時流傳輸協議,是TCP/IP協議體系中的一個應用層協議,由哥倫比亞大學、網景和RealNetworks公司提交的IETF RFC標準。該協議定義了一對多應用程序如何有效地通過IP網絡傳送多媒體數據。RTSP在體系結構上位于RTP和RTCP之上,它使用TCP或UDP完成數據傳輸。HTTP與RTSP相比,HTTP請求由客戶機發出,服務器作出響應;使用RTSP時,客戶機和服務器都可以發出請求,即RTSP可以是雙向的。RTSP是用來控制聲音或影像的多媒體串流協議,并允許同時多個串流需求控制,傳輸時所用的網絡通訊協定并不在其定義的范圍內,服務器端可以自行選擇使用TCP或UDP來傳送串流內容,它的語法和運作跟HTTP 1.1類似,但并不特別強調時間同步,所以比較能容忍網絡延遲。而前面提到的允許同時多個串流需求控制(Multicast),除了可以降低服務器端的網絡用量,更進而支持多方視訊會議(Video Conference)。因為與HTTP1.1的運作方式相似,所以代理服務器〈Proxy〉的快取功能〈Cache〉也同樣適用于RTSP,并因RTSP具有重新導向功能,可視實際負載情況來轉換提供服務的服務器,以避免過大的負載集中于同一服務器而造成延遲。
8、G.711
G.711是一種由國際電信聯盟(ITU-T)制定的音頻編碼方式,又稱為ITU-T G.711。G.711 標準下主要有兩種壓縮算法。一種是**μ-law algorithm** (又稱often u-law, ulaw, mu-law),主要運用于北美和日本;另一種是A-law algorithm,主要運用于歐洲和世界其他地區。其中,后者是特別設計用來方便計算機處理的。
9、IPC、NVR、DVR
NVR是(Network Video Recorder即網絡硬盤錄像機)的縮寫。NVR最主要的功能是通過網絡接收IPC(網絡攝像機)設備傳輸的數字視頻碼流, 并進行存儲、管理,從而實現網絡化帶來的分布式架構優勢。 簡單來說,通過Nvr,可以同時觀看、瀏覽、回放、管理、存儲多個網絡攝像機。擺脫了電腦硬件的牽絆,再也不用面臨安裝軟件的繁瑣。如果所有攝像機網絡化,那么必經之路就是有一個集中管理核心出現。
近幾年,隨著IP網絡的快速發展,視頻監控行業也進入了全網絡化時代。全網絡化時代的視頻監控行業正逐步表現出IT行業的特征,作為網絡化監控的核心產品NVR(Network Video Recorder即網絡視頻錄像機),從本質上已經變成了IT產品。NVR最主要的功能是通過網絡接收IPC(網絡攝像機)、DVS(視頻編碼器)等設備傳輸的數字視頻碼流, 并進行存儲、管理。
dvr,全稱為Digital Video Recorder(硬盤錄像機),即數字視頻錄像機,相對于傳統的模擬視頻錄像機,采用硬盤錄像,故常常被稱為硬盤錄像機,也被稱為DVR。它是一套進行圖像計算存儲處理的計算機系統,具有對圖像/語音和動態幀等進行長時間錄像、錄音、遠程監視和控制的功能,DVR集合了錄像機、畫面分割器、云臺鏡頭控制、報警控制、網絡傳輸等五種功能于一身,用一臺設備就能取代模擬監控系統一大堆設備的功能,而且在價格上也逐漸占有優勢和人氣。
10、ES、PES、PTS、DTS、PS、TS流
https://blog.csdn.net/huangblog/article/details/8740571
**ES–Elementary Streams (原始流)**是直接從編碼器出來的數據流,可以是編碼過的視頻數據流(H.264,MJPEG等),音頻數據流(AAC),或其他編碼數據流的統稱。
PES–Packetized? Elementary?Streams? (分組的ES),ES形成的分組稱為PES分組,是用來傳遞ES的一種數據結構。PES流是ES流經過PES打包器處理后形成的數據流,在這個過程中完成了將ES流分組、打包、加入包頭信息等操作(對ES流的第一次打包)。PES流的基本單位是PES包。PES包由包頭和payload組成。
**PTS–PresentationTime Stamp(顯示時間標記)**表示顯示單元出現在系統目標解碼器(H.264、MJPEG等)的時間。
**DTS–Decoding Time Stamp(解碼時間標記)**表示將存取單元全部字節從解碼緩存器移走的時間。
**PS–Program Stream(節目流)**PS流由PS包組成,而一個PS包又由若干個PES包組成(到這里,ES經過了兩層的封裝)。PS包的包頭中包含了同步信息與時鐘恢復信息。
**TS–Transport Stream(傳輸流)**由定長的TS包組成(188字節),而TS包是對PES包的一個重新封裝(到這里,ES也經過了兩層的封裝)。PES包的包頭信息依然存在于TS包中。
11、AAC
AAC(Advanced Audio Coding),中文名:高級音頻編碼,出現于1997年,基于MPEG-2的音頻編碼技術。由Fraunhofer IIS、杜比實驗室、AT&T、Sony等公司共同開發,目的是取代MP3格式。2000年,MPEG-4標準出現后,AAC重新集成了其特性,加入了SBR技術和PS技術,為了區別于傳統的MPEG-2 AAC又稱為MPEG-4 AAC。
12、H264、H265
https://blog.csdn.net/fireroll/article/details/77827156
H.264,同時也是MPEG-4第十部分,是由ITU-T視頻編碼專家組(VCEG)和ISO/IEC動態圖像專家組(MPEG)聯合組成的聯合視頻組(JVT,Joint Video Team)提出的高度壓縮數字視頻編解碼器標準。這個標準通常被稱之為H.264/AVC(或者AVC/H.264或者H.264/MPEG-4 AVC或MPEG-4/H.264 AVC)而明確的說明它兩方面的開發者。
H264標準各主要部分有Access Unit delimiter(訪問單元分割符),SEI(附加增強信息),primary coded picture(基本圖像編碼),Redundant Coded Picture(冗余圖像編碼)。還有Instantaneous Decoding Refresh(IDR,即時解碼刷新)、Hypothetical Reference Decoder(HRD,假想參考解碼)、Hypothetical Stream Scheduler(HSS,假想碼流調度器)。
H.265是ITU-T VCEG繼H.264之后所制定的新的視頻編碼標準。H.265標準圍繞著現有的視頻編碼標準H.264,保留原來的某些技術,同時對一些相關的技術加以改進。新技術使用先進的技術用以改善碼流、編碼質量、延時和算法復雜度之間的關系,達到最優化設置。具體的研究內容包括:提高壓縮效率、提高魯棒性和錯誤恢復能力、減少實時的時延、減少信道獲取時間和隨機接入時延、降低復雜度等。H.264由于算法優化,可以低于1Mbps的速度實現標清(分辨率在1280P720以下)數字圖像傳送;H.265則可以實現利用1~2Mbps的傳輸速度傳送720P(分辨率1280720)普通高清音視頻傳送。
13、IVS
IVS,是基于DSP的單路視頻編碼器,同時內嵌了智能視覺監控功能,其自動檢測、即時報警通告和即時視頻確認等功能可以大幅提高安全監控水平,同時基于三維視場檢測,能自動區分目標種類、大小、速度、移動方向等特征,具有出色的非平坦地形上的目標檢測能力,能可靠的檢測遙遠距離的目標,采用先進的模式識別技術和特定的行為分析算法,保持高檢測率(99.9%)的同時只有很低的誤報率*(少于1個/天)*。IVS結合監控攝像機或PTZ球機可對智能視覺分析數據聯網進行報警運營,實現“事先預警+事中處置+事后取證”,是“智能視覺+物聯網”的真正的物聯網。
總結
- 上一篇: 微信分享公共js
- 下一篇: 2022 年红队工具和模拟工具包