音视频技术开发周刊 | 206
每周一期,縱覽音視頻技術(shù)領(lǐng)域的干貨。
新聞投稿:contribute@livevideostack.com。
小提示:鏈接跳轉(zhuǎn)僅支持公眾號(hào)相關(guān)鏈接
準(zhǔn)確評(píng)估音畫質(zhì)量,七牛云將發(fā)布音視頻質(zhì)量分析系統(tǒng)——對(duì)話七牛云陳輝
近些年來,隨著音視頻的不斷普及,終端用戶對(duì)于音視頻的質(zhì)量要求越來越高:從最初的通話、觀看流暢,到現(xiàn)在對(duì)音視頻畫質(zhì)的高清需求及節(jié)省流量訴求。日益高漲的用戶需求,將給音視頻技術(shù)領(lǐng)域帶來哪些挑戰(zhàn)?如何更加客觀、準(zhǔn)確地評(píng)估音視頻音畫質(zhì)量?未來音視頻領(lǐng)域還會(huì)發(fā)生哪些大的變化?LiveVideoStack近期采訪了七牛云直播與實(shí)時(shí)互動(dòng)技術(shù)總監(jiān)陳輝,和他一起討論了七牛云視頻質(zhì)量分析的具體情況、優(yōu)勢(shì)與挑戰(zhàn),音視頻的未來發(fā)展等問題。
賦能普通用戶,面向?qū)I(yè)級(jí)的視頻內(nèi)容制作技術(shù)
隨著人們對(duì)視頻的依賴程度日益增長(zhǎng),對(duì)專業(yè)級(jí)視頻內(nèi)容的制作要求、批量制作視頻的需求也在不斷提高。在制作視頻中,如何即保證效率,又保證效果;即有模板支持,又能自由化的搭配設(shè)計(jì)。對(duì)此,LiveVideoStack采訪了視杏科技CEO——李志強(qiáng)(節(jié)子),一同聊一聊在視頻設(shè)計(jì)中視杏科技為用戶提供了哪些賦能方案。
淘寶直播低延遲架構(gòu)演進(jìn)和實(shí)踐
本文根據(jù)楊寬(阿里巴巴淘系技術(shù) 音視頻技術(shù)專家)于 2021 年 6 月 26 日舉辦的 ECUG Meetup 第 1 期 | 2021 音視頻技術(shù)最佳實(shí)踐·杭州站上的分享整理而成。本文將從傳統(tǒng)直播技術(shù)痛點(diǎn)、低延遲架構(gòu)演進(jìn)、互動(dòng)體驗(yàn)升級(jí)和關(guān)鍵技術(shù)四個(gè)方向展開。
ICME2021:基于VVC的角度加權(quán)預(yù)測(cè)
加權(quán)預(yù)測(cè)是視頻編碼的重要技術(shù),但是傳統(tǒng)的固定權(quán)重?zé)o法滿足兩個(gè)物體斜邊的處理。現(xiàn)存的方法計(jì)算逐像素的權(quán)重需要大量計(jì)算,它要為每個(gè)像素計(jì)算它到分界線的距離。本文利用角度預(yù)測(cè)生產(chǎn)每個(gè)像素的權(quán)重,復(fù)用了幀內(nèi)預(yù)測(cè)的邏輯來簡(jiǎn)化計(jì)算。
DVB 為先進(jìn)的 4K 和 8K 廣播和寬帶電視鋪平道路
DVB初步確定的三個(gè)下一代候選商業(yè)視頻編解碼器為先進(jìn)4K、8K廣播寬帶電視做準(zhǔn)備,分別是AV1、AVS3、VVC。目前將開始評(píng)估候選視頻編解碼器的技術(shù)合規(guī)性以及制定 DVB 規(guī)范草案的工作。
直播時(shí)代的下一個(gè)江湖
1993年6月24日,一個(gè)由施樂公司的科學(xué)家和工程師組成的樂隊(duì)Severe Tire Damage向互聯(lián)網(wǎng)直播了他們的演出。他們成為第一個(gè)通過互聯(lián)網(wǎng)直播表演的樂隊(duì),而這次演出正是通過施樂公司研發(fā)的MBone網(wǎng)絡(luò)發(fā)布的。
基于 Nginx 和 FFmpeg 搭建流媒體服務(wù)器
實(shí)時(shí)流式傳輸可以解決順序流式傳輸無法快進(jìn)的問題,它與Http流式傳輸不同,它必須使用流媒體服務(wù)器并 且使用流媒體協(xié)議來傳輸視頻,它比Http流式傳輸復(fù)雜。常見的實(shí)時(shí)流式傳輸協(xié)議有RTSP、RTMP、RSVP 等。
論文推介:語音合成中可見和不可見語音風(fēng)格的遷移
論文提出了一種新的針對(duì)訓(xùn)練數(shù)據(jù)中見過的和未見過的語音風(fēng)格遷移方法,利用不相交的多風(fēng)格數(shù)據(jù)可以有效地實(shí)現(xiàn)見過的和未見過的風(fēng)格的風(fēng)格遷移。
直播時(shí)各種背景是怎么實(shí)現(xiàn)的?聊一聊虛擬背景背后的技術(shù)
2020 年一場(chǎng)突如其來的疫情闖進(jìn)了我們的生活,上網(wǎng)課、在家辦公逐漸成為了一種常態(tài),為了更好地保護(hù)用戶隱私、提升用戶體驗(yàn),各大在線辦公軟件相繼推出了虛擬背景功能,營(yíng)造學(xué)習(xí)、辦公氛圍的同時(shí),又能避免家中環(huán)境不夠正式的窘境。那么今天我們就來說道說道虛擬背景的相關(guān)技術(shù)。
高光譜成像技術(shù)的介紹
高光譜成像技術(shù)的應(yīng)用價(jià)值已在一些非民用領(lǐng)域得到了證明,但仍存在一些限制其推廣進(jìn)入更多領(lǐng)域的困難,主要有:1)高光譜相機(jī)系統(tǒng)復(fù)雜、成本高;2)體積大重量沉;3)使用體驗(yàn)是否便捷。
ICCV 2021 | Vision Transformer中的相對(duì)位置編碼
相對(duì)位置編碼(RelativePosition Encoding)能夠顯式地對(duì)Transformer輸入序列中,任意兩個(gè)Tokens的位置關(guān)系進(jìn)行建模。近來,中山大學(xué)與微軟亞洲研究院的研究人員回顧了先前相對(duì)位置編碼的相關(guān)工作,針對(duì)Vision Transformer,提出了簡(jiǎn)單且輕量的二維相對(duì)位置編碼。
基于深度學(xué)習(xí)的圖異常檢測(cè)技術(shù)綜述
本文首先對(duì)圖上的異常定義做了全面的分析, 然后詳細(xì)介紹了基于深度神經(jīng)網(wǎng)絡(luò)的圖表示學(xué)習(xí)方法, 接著從靜態(tài)圖和動(dòng)態(tài)圖的角度出發(fā),對(duì)現(xiàn)有基于深度學(xué)習(xí)的圖異常檢測(cè)方法進(jìn)行系統(tǒng)地總結(jié)和歸 類,并討論相關(guān)方法的局限性。
支持動(dòng)態(tài)變焦,劍橋大學(xué)基于LiDAR的全息HUD方案解析
為了進(jìn)一步提升AR HUD的體驗(yàn)感,由劍橋大學(xué)、牛津大學(xué)、倫敦大學(xué)學(xué)院的科研人員組成的團(tuán)隊(duì)研發(fā)了一種,基于LiDAR和全息技術(shù)的AR HUD方案。據(jù)悉,該方案并未采用向前擋風(fēng)玻璃投影的形式,而是將AR圖像直接投影到人眼中,好處是視場(chǎng)角更大,支持動(dòng)態(tài)變焦,不過需要對(duì)人眼的位置進(jìn)行校正。
淺談自動(dòng)駕駛中的行為風(fēng)險(xiǎn)識(shí)別(一)
我們可以通過一個(gè)比喻來解釋什么是行為風(fēng)險(xiǎn)識(shí)別:自動(dòng)駕駛的機(jī)器大腦在參加一場(chǎng)考試,他遇到一道難題,在兩個(gè)答案之間猶豫不決。盡管這道難題他不會(huì)做,但我們可以通過許多方式得知他“拿不準(zhǔn)”這件事本身,例如題目描述的場(chǎng)景復(fù)雜或者之前不熟悉,并進(jìn)一步針對(duì)這道題目請(qǐng)求“人類教練”的幫助。
IROS 2021最新開源!深度學(xué)習(xí)三維激光雷達(dá)動(dòng)態(tài)物體分割
本文介紹的是德國(guó)波恩大學(xué)在讀博士陳謝沅澧的最新工作。該方法的論文,代碼,數(shù)據(jù)集以及視頻都已經(jīng)公開。
用于自動(dòng)駕駛?cè)S目標(biāo)檢測(cè)的從二維提升到三維的學(xué)習(xí)方法
文章解決了自動(dòng)駕駛場(chǎng)景中從二維單目圖像中提取三維目標(biāo)的問題,提出使用基于學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)將二維圖像提升到三維表示,并直接利用現(xiàn)有工作在三維上的神經(jīng)網(wǎng)絡(luò)來執(zhí)行三維目標(biāo)檢測(cè)和定位。
SSC:基于點(diǎn)云語義上下文的大規(guī)模激光SLAM的位置識(shí)別方法
本文提出了一個(gè)新的全局描述子,點(diǎn)云語義上下文信息,它可以更有效地挖掘語義信息來表示場(chǎng)景,本文還提出了一種兩步全局語義ICP算法來獲得三維姿態(tài)(x,y,yaw),用于點(diǎn)云的對(duì)齊以提高匹配性能,我們?cè)贙ITTI數(shù)據(jù)集上的實(shí)驗(yàn)表明,我們的方法比現(xiàn)有的方法有很大的優(yōu)勢(shì)。
推薦閱讀
W3C Web 中文興趣組 · 沉浸式 Web 線上研討會(huì)
本次線上研討會(huì)對(duì)WebXR相關(guān)的工作進(jìn)行了一個(gè)比較深入的討論,從新的內(nèi)容呈現(xiàn)形式、內(nèi)容制作的方式到產(chǎn)品硬件的一系列設(shè)計(jì)考量,包括跨平臺(tái)的一些考慮,從工業(yè)界到學(xué)術(shù)界都進(jìn)行了一些深入的研討,碰撞出一些新的想法和潛在的標(biāo)準(zhǔn)機(jī)會(huì)。
https://www.w3.org/2021/07/chinese-ig-xr/minutes.html
專訪扎克伯格:萬字解讀Facebook為何將轉(zhuǎn)型為元宇宙公司
六月末,Facebook CEO馬克·扎克伯格向員工介紹了一項(xiàng)雄心勃勃的新計(jì)劃。根據(jù)這項(xiàng)計(jì)劃,該公司的業(yè)務(wù)范疇將遠(yuǎn)遠(yuǎn)超出當(dāng)前的一系列社交應(yīng)用以及相關(guān)的硬件項(xiàng)目。他說,Facebook將打造一套包羅萬象、互聯(lián)互通的科幻體驗(yàn)集合,簡(jiǎn)言之,即打造一個(gè)被稱為元宇宙的世界。
活動(dòng)推薦
【免費(fèi)報(bào)名】挑戰(zhàn)與機(jī)遇同在,大步邁進(jìn)全真互聯(lián)網(wǎng)時(shí)代
隨著云計(jì)算的普及與高速發(fā)展,5G網(wǎng)絡(luò)、VR技術(shù)的日益成熟,我們正向著全真互聯(lián)網(wǎng)時(shí)代大步邁進(jìn)。伴隨著新時(shí)代的到來,“元宇宙”、“沉浸式”等概念橫空出世,挑戰(zhàn)與機(jī)遇同在,我們不得不思考,哪些行業(yè)、產(chǎn)品和商業(yè)模式將最早受到全真互聯(lián)網(wǎng)的影響?
騰訊云音視頻基于在音視頻領(lǐng)域21年的積累,構(gòu)建了全球領(lǐng)先的RT-ONE?音視頻通信基礎(chǔ)網(wǎng)絡(luò)、完整的音視頻PaaS平臺(tái)及終端SDK產(chǎn)品矩陣,9月3日 | 北京,LiveVideoStack聯(lián)合騰訊云共邀5位技術(shù)大牛,將為大家?guī)砣耡ll in one終端引擎、跨平臺(tái)能力、海外直播技術(shù)、云渲染技術(shù)、多媒體處理等技術(shù)的最新動(dòng)向。
? 活動(dòng)時(shí)間:2021/09/03 14:00-18:00
???? 參與方式:線下參與 (掃描上圖二維碼,立即免費(fèi)報(bào)名~)
【免費(fèi)報(bào)名】從多維度出發(fā) 保障&提升實(shí)時(shí)音視頻質(zhì)量
9月4日 | 北京 LiveVideoStack將攜手七牛云共邀4位技術(shù)大咖,圍繞著實(shí)時(shí)音視頻場(chǎng)景下,七牛云如何從多個(gè)維度來保障和提升音畫質(zhì)量展開。我們所理解的音畫質(zhì)量,不僅包括最基礎(chǔ)的服務(wù)質(zhì)量,還包括我們的觀感體驗(yàn),本場(chǎng)將會(huì)從服務(wù)端、客戶端、編解碼等多個(gè)領(lǐng)域展開,對(duì)保障和提升音視頻質(zhì)量相關(guān)的經(jīng)驗(yàn)進(jìn)行分享。
此外,我們還會(huì)發(fā)布七牛云音視頻質(zhì)量分析系統(tǒng),更客觀專業(yè)得對(duì)音畫質(zhì)量進(jìn)行評(píng)測(cè)和優(yōu)化。
? 活動(dòng)時(shí)間:2021/09/04 9:30-12:00
???? 參與方式:線下參與 (掃描上圖二維碼,立即免費(fèi)報(bào)名~)
插圖源自Pexels
總結(jié)
以上是生活随笔為你收集整理的音视频技术开发周刊 | 206的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 眺望全真互联时代!TVP音视频技术闭门会
- 下一篇: 【线上分享】WebRTC传输与服务质量