AMiner会议论文推荐第三十五期
AMiner平臺由清華大學計算機系研發(fā),擁有我國完全自主知識產權。平臺包含了超過2.3億學術論文/專利和1.36億學者的科技圖譜,提供學者評價、專家發(fā)現、智能指派、學術地圖等科技情報專業(yè)化服務。系統(tǒng)2006年上線,吸引了全球220個國家/地區(qū)1000多萬獨立IP訪問,數據下載量230萬次,年度訪問量超過1100萬,成為學術搜索和社會網絡挖掘研究的重要數據和實驗平臺。
AAAI 2021 論文推薦
Semantic MapNet: Building Allocentric SemanticMaps and Representations from Egocentric Views
論文鏈接:https://www.aminer.cn/pub/5f7c348e91e0117ac2a78860/?conf=aaai2021
推薦理由:該工作研究語義映射任務–具體來說,該任務給一個具身代理(機器人或以自我為中心的人工智能助手)新的環(huán)境,要求其從一個位置已知的RGB-D相機的自我中心觀察中(通過定位傳感器)建立一個分配中心的語義地圖(“什么在哪里?”)。為了實現這一目標,作者提出了SemanticMapNet(SMNet),該模型由以下部分組成。(1)一個以自我中心的視覺編碼器,它對每個以自我為中心的RGB-D幀進行編碼;(2)一個特征投影器,它將以自我為中心的特征投射到平面圖上的適當位置;(3)一個空間記憶張量,其大小為平面圖長x寬x特征半徑,可以學習積累投射的自我中心特征;(4)一個地圖解碼器,它使用記憶張量來生成語義自上而下的地圖。SMNet結合了投影相機幾何學和神經表征學習的優(yōu)勢,在Matterport3D數據集的語義映射任務上的部分表現顯著優(yōu)于其他基線。此外,作者還展示了如何將SMNet建立的神經表象記憶和空間語義分配中心表征用于同一空間的后續(xù)任務。
DIRV: Dense Interaction Region Voting for End-to-End Human-Object Interaction Detection
論文鏈接:https://www.aminer.cn/pub/5f7aef0c91e011983cc81ee5/?conf=aaai2021
推薦理由:近年來,人機交互( human-object interaction,HOI)檢測取得了令人矚目的進展。然而,傳統(tǒng)的兩階段方法通常推理速度較慢,現有的單階段方法主要集中在交互的聯合區(qū)域,這對HOI檢測引入了不必要的視覺信息作為干擾。為了解決上述問題,作者在本文中基于交互區(qū)域這一概念提出了一種新型的單階段HOI檢測方法DIRV。與以往的方法不同的是,該方法集中在對每對人-物不同尺度的密集采樣交互區(qū)域,從而捕捉到交互最本質的細微視覺特征。此外,為了彌補單一交互區(qū)域的檢測缺陷,作者引入了一種新型的投票策略,充分利用這些重疊的交互區(qū)域來代替?zhèn)鹘y(tǒng)的非最大抑制(Non-Maximal Suppression,NMS)。
Vid-ODE: Continuous-Time Video Generation with Neural Ordinary Differential Equation
論文鏈接:https://www.aminer.cn/pub/5f8d5f6d91e0116f3d44db04/?conf=aaai2021
推薦理由:視頻生成模型通常是在固定幀率的假設下運行的,這導致在處理靈活的幀率(例如,增加視頻中更多動態(tài)部分的幀率以及處理丟失的視頻幀)時,性能不理想。為了解決現有視頻生成模型在處理任意時間步長方面的局限性,作者提出了將神經ODE(Vid-ODE)與像素級視頻處理技術相結合的連續(xù)時間視頻生成方法。該方法以最近提出的神經ODE的卷積版本ODE-ConvGRU作為編碼器,使模型Vid-ODE可以學習靈活幀率的輸入視頻的時空動態(tài)。解碼器將學習到的動態(tài)函數集成到任意給定時間步長的視頻幀中進行合成,其中像素級合成技術用于保持單個幀的清晰度。作者通過在四個真實世界的視頻數據集上的大量實驗,驗證了Vid-ODE在各種視頻生成設置下的性能優(yōu)于最先進的方法。
ICLR 2021 論文推薦
Co-Mixup: Saliency Guided Joint Mixup with Supermodular Diversity
論文鏈接: https://www.aminer.cn/pub/600831499e795ed227f530a5/?conf=iclr2021
推薦理由:雖然深度神經網絡在對訓練分布的擬合上表現出了良好性能,但提高網絡對測試分布的泛化性能和對輸入擾動敏感性的魯棒性仍是挑戰(zhàn)。雖然已有研究提出了一些基于混疊的增強策略來解決上述問題,但如何最好地利用每個輸入數據內的監(jiān)理信號進行混疊仍不清楚。該工作提出了一種新的批量混疊觀點,并制定了優(yōu)化構建一批混疊數據的方法,最大限度地提高每個單獨混疊數據的數據顯著性度量,并鼓勵構建的混疊數據之間的超模態(tài)多樣性。為此,作者提出了一個新型的離散優(yōu)化問題,即最小化子模態(tài)函數之間的差異。同時,該工作還描述了一種基于模塊近似的迭代子模態(tài)最小化算法,用于每一個minibatch的高效混搭計算,適合基于minibatch的神經網絡訓練。
Evolving Reinforcement Learning Algorithms
論文鏈接: https://www.aminer.cn/pub/600833a89e795ed227f531aa/?conf=iclr2021
推薦理由:該工作提出了一種元學習強化學習方法,通過在計算圖的空間上搜索,計算出基于價值的無模型RL代理優(yōu)化的損失函數。上述方法學習到的算法是不分領域的,能夠泛化到訓練過程中未見的新環(huán)境。同時,該方法既可以從頭開始學習,也可以從已知的現有算法(如DQN)上進行自舉,從而實現可解釋的修改。通過在經典控制和網格世界任務上進行從頭學習,該工作重新發(fā)現了時差(temporal-difference,TD)算法。在DQN的引導下,作者強調了兩個學習算法,它們在經典控制任務、網格世界類型任務和Atari游戲上擁有良好的泛化性能。
Rao-Blackwellizing the Straight-Through Gumbel-Softmax Gradient Estimator
論文鏈接: https://www.aminer.cn/pub/5f85722e91e011ff328095d7/?conf=iclr2021
推薦理由:最簡單的無偏估計器往往具有高方差,因此離散潛變量模型中的梯度估計極具挑戰(zhàn)性。為解決上述問題,現代估計器或引入偏差,或依賴多個函數評估,或使用依賴于輸入的基線。因此,急需一種僅用最小調整、計算成本低、均方差小的估計器。在本文中,作者展示了流行的Gumbel-Softmax估計器的直通變體的方差可以通過Rao-Blackwellization減少,而不增加函數評估的次數。同時,作者通過實證證明,該方法能夠減小兩個無監(jiān)督潛變量模型的方差,提高收斂速度。
Contrastive Explanations for Reinforcement Learning via Embedded Self Predictions
論文鏈接: https://www.aminer.cn/pub/5f8581a591e011ff3280972d/?conf=iclr2021
推薦理由:作者研究了一種深度強化學習(reinforcement learning,RL)架構,它能夠解釋為什么一個學習代理喜歡一個動作而非另一個動作。其關鍵思想是學習人類可理解的預期未來屬性直接表示的行動值。上述方法通過嵌入式自我預測(embedded self-prediction,ESP)模型來實現,該模型能夠根據人類提供的特征來學習其屬性。同時,行動偏好可以通過對比每個行動所預測的未來屬性來闡述。為了解決大量特征存在的情況,作者開發(fā)了一種新的方法,用于計算最小充分的ESP解釋。在三個領域的案例研究表明該ESP模型可以有效地學習并提供有洞察力的解釋。
Complex Query Answering with Neural Link Predictors
論文鏈接: https://www.aminer.cn/pub/5fa9175f91e011e83f7407f4/?conf=iclr2021
推薦理由:神經鏈接預測器對于識別大規(guī)模知識圖譜中的缺失邊緣非常有效。然而,如何使用這些模型來回答在一些領域中更復雜的查詢仍然不清楚(例如使用邏輯連詞、不連詞和存在性定量器的查詢,并考慮缺失的邊緣)。在這項工作中,作者提出了一個框架,用于高效回答不完整知識圖譜上的復雜查詢。該框架將每個查詢轉化為一個端到端可區(qū)分的目標,其中每個原子的真值由一個預先訓練的神經鏈接預測器計算。在實驗中,所提出的方法比最先進的方法–在數百萬個生成的查詢上訓練的黑盒神經模型–產生了更準確的結果,而不需要在大量和多樣化的復雜查詢上進行訓練。
DiffWave: A Versatile Diffusion Model for Audio Synthesis
論文鏈接:https://www.aminer.cn/pub/5f69e4bc91e011a2f0270974/?conf=iclr2021
推薦理由:在本文中,作者提出了DiffWave,一個多功能的Diffusion概率模型,用于有條件和無條件的Waveform生成。該模型是非自回歸的,在合成時通過一個恒定步數的馬爾可夫鏈將白噪聲信號轉換為結構化波形,并通過優(yōu)化數據似然的變異約束有效地進行訓練。DiffWave可以在不同的波形生成任務中產生高保真的音頻,包括以旋律譜圖為條件的神經聲碼、類條件生成和無條件生成。同時,作者證明了DiffWave在語音質量方面可以與強的WaveNet vocoder相媲美,同時合成速度快了一個數量級。在具有挑戰(zhàn)性的無條件生成任務中,從各種自動和人工評估的音頻質量和樣本多樣性來看,該模型明顯優(yōu)于自回歸和基于GAN的波形模型。
訂閱了解更多論文信息,定制您的個人科研動態(tài)信息流:https://www.aminer.cn/user/notification?f=mt
總結
以上是生活随笔為你收集整理的AMiner会议论文推荐第三十五期的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【PDF】《操盘手》
- 下一篇: 9.2 react受控组件和非受控组件