當(dāng)前位置：首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

MVS文章持续更新中~

發(fā)布時(shí)間：2023/12/20 编程问答 39 豆豆

生活随笔收集整理的這篇文章主要介紹了 MVS文章持续更新中~ 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

多視角立體（MVS）相關(guān)文章總結(jié)

文章目錄

多視角立體（MVS）相關(guān)文章總結(jié)
前言
1.MVSNet: Depth Inference for Unstructured Multi-view Stereo[ECCV2018]
2.Cascade Cost Volume for High-Resolution Multi-View Stereo and Stereo Matching[CVPR2020]
3.PatchmatchNet: Learned Multi-View Patchmatch Stereo[CVPR2021 Oral]

前言

作者：cxy
郵箱：1023499614@qq.com
根據(jù)本人的學(xué)習(xí)情況，持續(xù)更新~

1.MVSNet: Depth Inference for Unstructured Multi-view Stereo[ECCV2018]

文章鏈接: https://arxiv.org/pdf/1804.02505.pdf
pytorch代碼:https://github.com/xy-guo/MVSNet_pytorch

MVS系列的開(kāi)山鼻祖，輸入為N張Source Image（后用sou)和1張Reference Image(后用Ref)來(lái)推斷ref的深度圖，即ref每個(gè)點(diǎn)與相機(jī)光心的距離值。
先利用ResNet（共享權(quán)重）提取每張圖像（N+1張）的特征。
劃分Z個(gè)預(yù)設(shè)深度值，假設(shè)ref上的每個(gè)像素點(diǎn)都處于同一個(gè)深度值，因此將ref前的空間劃分為了Z個(gè)平面。然后利用每張相片的相機(jī)參數(shù)根據(jù)單應(yīng)性變換將N+1張圖片上每個(gè)點(diǎn)的特征（H,W維度）基于不同預(yù)設(shè)深度值（Z維度）warp到ref對(duì)應(yīng)的位置上，對(duì)于任一深度預(yù)設(shè)值d，使得ref圖像上的一個(gè)點(diǎn)和其他每張sou上的一個(gè)點(diǎn)產(chǎn)生了聯(lián)系。對(duì)這N個(gè)點(diǎn)的特征計(jì)算方差得到了ref上這個(gè)點(diǎn)在深度d的差異性，由此我們得到了Cost Volume（后用cost)
后面對(duì)cost經(jīng)過(guò)U-Net來(lái)完成正則化操作（對(duì)cost做平滑），輸出一個(gè)probability volume，表示每個(gè)點(diǎn)在各個(gè)不同深度的概率值，這也對(duì)后面判斷這個(gè)點(diǎn)的深度估計(jì)置信提供了依據(jù)。沿著Z維度回歸得到初始的深度圖。
作者認(rèn)為前面的U-Net正則化，使得邊界過(guò)于平滑了，因此將原圖像的RGB通道concate到初始深度圖上經(jīng)過(guò)一些2D卷積使得邊界更尖銳，最后加上原始深度圖的響應(yīng)，得到了最終的深度圖。

2.Cascade Cost Volume for High-Resolution Multi-View Stereo and Stereo Matching[CVPR2020]

文章鏈接: https://arxiv.org/pdf/1912.06378.pdf
pytorch代碼:https://github.com/alibaba/cascade-stereo

本文與MVS-Net不同之處主要有二：
1.提取多張圖像特征時(shí)，采用了FPN，提取多個(gè)尺度的特征
2.第一階段先采用最小尺寸的特征生成cost volume再做正則化（和MVSNet一摸一樣），第二階段利用較高尺寸的特征，此處利用上一個(gè)階段得到的深度圖上采樣獲得每個(gè)點(diǎn)的初始深度，在初始深度的基礎(chǔ)上精細(xì)劃分預(yù)設(shè)深度（Cascade體現(xiàn)的淋漓盡致），得到cost volume以后如MVS-Net一摸一樣，此處不再贅述。
和MVSNet相比是又快又好啊。。。

3.PatchmatchNet: Learned Multi-View Patchmatch Stereo[CVPR2021 Oral]

文章鏈接: https://arxiv.org/pdf/2012.01411.pdf
pytorch代碼:https://github.com/FangjinhuaWang/PatchmatchNet

利用cascade層級(jí)化思想，并且每一個(gè)stage會(huì)額外迭代一次，每個(gè)點(diǎn)的預(yù)設(shè)深度考慮為這個(gè)點(diǎn)的周?chē)c(diǎn)的深度（從上一步的深度圖得到）（此處運(yùn)用可變形卷積考慮邊界不連續(xù)性），在patchmatch的模塊當(dāng)中將c通道特征分為G個(gè)group兩兩（一張source，一張reference）計(jì)算相似性，最后結(jié)合N個(gè)相似性張量得到cost volume，在cost volumn正則化的時(shí)候再次利用可變形卷積考慮邊界不連續(xù)性，每個(gè)點(diǎn)的代價(jià)應(yīng)當(dāng)對(duì)周?chē)鷰讉€(gè)點(diǎn)的cost做一個(gè)加權(quán)，最后回歸得到深度圖。

# 總結(jié)

總結(jié)

以上是生活随笔為你收集整理的MVS文章持续更新中~的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： Using the Hardware S
下一篇：阿里短信服务 JAVA