當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

AMiner会议论文推荐第三十五期

發布時間：2024/1/8 编程问答 43 豆豆

生活随笔收集整理的這篇文章主要介紹了 AMiner会议论文推荐第三十五期小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

AMiner平臺由清華大學計算機系研發，擁有我國完全自主知識產權。平臺包含了超過2.3億學術論文/專利和1.36億學者的科技圖譜，提供學者評價、專家發現、智能指派、學術地圖等科技情報專業化服務。系統2006年上線，吸引了全球220個國家/地區1000多萬獨立IP訪問，數據下載量230萬次，年度訪問量超過1100萬，成為學術搜索和社會網絡挖掘研究的重要數據和實驗平臺。

AAAI 2021 論文推薦

Semantic MapNet: Building Allocentric SemanticMaps and Representations from Egocentric Views

論文鏈接：https://www.aminer.cn/pub/5f7c348e91e0117ac2a78860/?conf=aaai2021

推薦理由：該工作研究語義映射任務–具體來說，該任務給一個具身代理（機器人或以自我為中心的人工智能助手）新的環境，要求其從一個位置已知的RGB-D相機的自我中心觀察中（通過定位傳感器）建立一個分配中心的語義地圖（“什么在哪里？”）。為了實現這一目標，作者提出了SemanticMapNet（SMNet），該模型由以下部分組成。(1)一個以自我中心的視覺編碼器，它對每個以自我為中心的RGB-D幀進行編碼；(2)一個特征投影器，它將以自我為中心的特征投射到平面圖上的適當位置；(3)一個空間記憶張量，其大小為平面圖長x寬x特征半徑，可以學習積累投射的自我中心特征；(4)一個地圖解碼器，它使用記憶張量來生成語義自上而下的地圖。SMNet結合了投影相機幾何學和神經表征學習的優勢，在Matterport3D數據集的語義映射任務上的部分表現顯著優于其他基線。此外，作者還展示了如何將SMNet建立的神經表象記憶和空間語義分配中心表征用于同一空間的后續任務。

DIRV: Dense Interaction Region Voting for End-to-End Human-Object Interaction Detection

論文鏈接：https://www.aminer.cn/pub/5f7aef0c91e011983cc81ee5/?conf=aaai2021

推薦理由：近年來，人機交互（ human-object interaction，HOI）檢測取得了令人矚目的進展。然而，傳統的兩階段方法通常推理速度較慢，現有的單階段方法主要集中在交互的聯合區域，這對HOI檢測引入了不必要的視覺信息作為干擾。為了解決上述問題，作者在本文中基于交互區域這一概念提出了一種新型的單階段HOI檢測方法DIRV。與以往的方法不同的是，該方法集中在對每對人-物不同尺度的密集采樣交互區域，從而捕捉到交互最本質的細微視覺特征。此外，為了彌補單一交互區域的檢測缺陷，作者引入了一種新型的投票策略，充分利用這些重疊的交互區域來代替傳統的非最大抑制（Non-Maximal Suppression，NMS）。

Vid-ODE: Continuous-Time Video Generation with Neural Ordinary Differential Equation

論文鏈接：https://www.aminer.cn/pub/5f8d5f6d91e0116f3d44db04/?conf=aaai2021

推薦理由：視頻生成模型通常是在固定幀率的假設下運行的，這導致在處理靈活的幀率(例如，增加視頻中更多動態部分的幀率以及處理丟失的視頻幀)時，性能不理想。為了解決現有視頻生成模型在處理任意時間步長方面的局限性，作者提出了將神經ODE(Vid-ODE)與像素級視頻處理技術相結合的連續時間視頻生成方法。該方法以最近提出的神經ODE的卷積版本ODE-ConvGRU作為編碼器，使模型Vid-ODE可以學習靈活幀率的輸入視頻的時空動態。解碼器將學習到的動態函數集成到任意給定時間步長的視頻幀中進行合成，其中像素級合成技術用于保持單個幀的清晰度。作者通過在四個真實世界的視頻數據集上的大量實驗，驗證了Vid-ODE在各種視頻生成設置下的性能優于最先進的方法。

ICLR 2021 論文推薦

Co-Mixup: Saliency Guided Joint Mixup with Supermodular Diversity

論文鏈接: https://www.aminer.cn/pub/600831499e795ed227f530a5/?conf=iclr2021

推薦理由：雖然深度神經網絡在對訓練分布的擬合上表現出了良好性能，但提高網絡對測試分布的泛化性能和對輸入擾動敏感性的魯棒性仍是挑戰。雖然已有研究提出了一些基于混疊的增強策略來解決上述問題，但如何最好地利用每個輸入數據內的監理信號進行混疊仍不清楚。該工作提出了一種新的批量混疊觀點，并制定了優化構建一批混疊數據的方法，最大限度地提高每個單獨混疊數據的數據顯著性度量，并鼓勵構建的混疊數據之間的超模態多樣性。為此，作者提出了一個新型的離散優化問題，即最小化子模態函數之間的差異。同時，該工作還描述了一種基于模塊近似的迭代子模態最小化算法，用于每一個minibatch的高效混搭計算，適合基于minibatch的神經網絡訓練。

Evolving Reinforcement Learning Algorithms

論文鏈接: https://www.aminer.cn/pub/600833a89e795ed227f531aa/?conf=iclr2021

推薦理由：該工作提出了一種元學習強化學習方法，通過在計算圖的空間上搜索，計算出基于價值的無模型RL代理優化的損失函數。上述方法學習到的算法是不分領域的，能夠泛化到訓練過程中未見的新環境。同時，該方法既可以從頭開始學習，也可以從已知的現有算法（如DQN）上進行自舉，從而實現可解釋的修改。通過在經典控制和網格世界任務上進行從頭學習，該工作重新發現了時差（temporal-difference，TD）算法。在DQN的引導下，作者強調了兩個學習算法，它們在經典控制任務、網格世界類型任務和Atari游戲上擁有良好的泛化性能。

Rao-Blackwellizing the Straight-Through Gumbel-Softmax Gradient Estimator

論文鏈接: https://www.aminer.cn/pub/5f85722e91e011ff328095d7/?conf=iclr2021

推薦理由：最簡單的無偏估計器往往具有高方差，因此離散潛變量模型中的梯度估計極具挑戰性。為解決上述問題，現代估計器或引入偏差，或依賴多個函數評估，或使用依賴于輸入的基線。因此，急需一種僅用最小調整、計算成本低、均方差小的估計器。在本文中，作者展示了流行的Gumbel-Softmax估計器的直通變體的方差可以通過Rao-Blackwellization減少，而不增加函數評估的次數。同時，作者通過實證證明，該方法能夠減小兩個無監督潛變量模型的方差，提高收斂速度。

Contrastive Explanations for Reinforcement Learning via Embedded Self Predictions

論文鏈接: https://www.aminer.cn/pub/5f8581a591e011ff3280972d/?conf=iclr2021

推薦理由：作者研究了一種深度強化學習（reinforcement learning，RL）架構，它能夠解釋為什么一個學習代理喜歡一個動作而非另一個動作。其關鍵思想是學習人類可理解的預期未來屬性直接表示的行動值。上述方法通過嵌入式自我預測(embedded self-prediction，ESP)模型來實現，該模型能夠根據人類提供的特征來學習其屬性。同時，行動偏好可以通過對比每個行動所預測的未來屬性來闡述。為了解決大量特征存在的情況，作者開發了一種新的方法，用于計算最小充分的ESP解釋。在三個領域的案例研究表明該ESP模型可以有效地學習并提供有洞察力的解釋。

Complex Query Answering with Neural Link Predictors

論文鏈接: https://www.aminer.cn/pub/5fa9175f91e011e83f7407f4/?conf=iclr2021

推薦理由：神經鏈接預測器對于識別大規模知識圖譜中的缺失邊緣非常有效。然而，如何使用這些模型來回答在一些領域中更復雜的查詢仍然不清楚（例如使用邏輯連詞、不連詞和存在性定量器的查詢，并考慮缺失的邊緣）。在這項工作中，作者提出了一個框架，用于高效回答不完整知識圖譜上的復雜查詢。該框架將每個查詢轉化為一個端到端可區分的目標，其中每個原子的真值由一個預先訓練的神經鏈接預測器計算。在實驗中，所提出的方法比最先進的方法–在數百萬個生成的查詢上訓練的黑盒神經模型–產生了更準確的結果，而不需要在大量和多樣化的復雜查詢上進行訓練。

DiffWave: A Versatile Diffusion Model for Audio Synthesis

論文鏈接:https://www.aminer.cn/pub/5f69e4bc91e011a2f0270974/?conf=iclr2021

推薦理由：在本文中，作者提出了DiffWave，一個多功能的Diffusion概率模型，用于有條件和無條件的Waveform生成。該模型是非自回歸的，在合成時通過一個恒定步數的馬爾可夫鏈將白噪聲信號轉換為結構化波形，并通過優化數據似然的變異約束有效地進行訓練。DiffWave可以在不同的波形生成任務中產生高保真的音頻，包括以旋律譜圖為條件的神經聲碼、類條件生成和無條件生成。同時，作者證明了DiffWave在語音質量方面可以與強的WaveNet vocoder相媲美，同時合成速度快了一個數量級。在具有挑戰性的無條件生成任務中，從各種自動和人工評估的音頻質量和樣本多樣性來看，該模型明顯優于自回歸和基于GAN的波形模型。

訂閱了解更多論文信息，定制您的個人科研動態信息流：https://www.aminer.cn/user/notification?f=mt

總結

以上是生活随笔為你收集整理的AMiner会议论文推荐第三十五期的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：【PDF】《操盘手》
下一篇： 9.2 react受控组件和非受控组件