日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

论文笔记:PRIN: Pointwise Rotation-Invariant Networks

發布時間:2025/3/21 编程问答 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 论文笔记:PRIN: Pointwise Rotation-Invariant Networks 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

PRIN: Pointwise Rotation-Invariant Networks

1、四個問題

  • 要解決什么問題?
    • 使用特殊結構的神經網絡來提取具有旋轉不變性的點云特征。
  • 用了什么方法解決?
    • 提出了一套新的網絡結構:Pointwise Rotation-Invariant Network(PRIN),所提取的特征具有旋轉不變性。
    • 預處理階段,使用密度感知自適應采樣(Density-Aware Adaptive Sampling,DAAS)從稀疏點云上采樣球形信號(spherical signals)。
    • 隨后采用Spherical Voxel Convolution(SVC)從點云提取旋轉不變特征。
  • 效果如何?
    • 在目標分類、部件分割等任務上,可以不進行額外的數據增強,就能有效地處理旋轉變化,并取得了SOTA(state-of-the-art)的效果。
  • 還存在什么問題?
    • 關于旋轉不變性的部分基本上是照搬Spherical CNN里的那一套東西,給人的感覺更像是把被人的東西用到了點云分類、點云部件分割等任務上,但是球形信號的采樣方法還是比較有參考價值的。
  • 2、論文概述

    2.1、簡介

    • 盡管PointNet和PointNet++都在點云感知和形狀分析相關的任務中取得了相當不錯的效果,但是他們都只關注于理想的情況,即不考慮旋轉變換,假定所有物體都是出于同一個固定視角下。然后實際中,往往還存在旋轉變換,而PointNet這類的方法肯定就會失效,因為我們事先無法知道物體的方向以及旋轉角度。示意圖如圖1所示,旋轉變換會導致PointNet系的網絡失效。
    • 因此這篇論文就提出了一系列應對旋轉變化的方法。
      • 提出了一個具有旋轉不變性的網絡:PRIN(pointwise rotation-invariant network)。
      • 使用密度感知自適應采樣(density-aware adaptive sampling,DAAS)來采樣球形信號。
      • 使用球形體素卷積(spherical voxel convolution,SVC)來提取旋轉不變特征。

    2.2、準備知識

    • 球形卷積。
      • 球形卷積是在Spherical CNN中提出的,主要思想是實現等變性。如果輸入信號旋轉了,那么卷積后的輸出也相應地旋轉。接著再進行全局最大池化就可以得到全局旋轉不變特征了。
      • 如果有興趣進一步了解,可以查看我之前的博客:論文筆記:Spherical CNN
      • 示意圖如圖2所示。

    2.3、密度感知自適應采樣(DAAS)

    • Spherical CNN中已經通過理論推導和實驗證明了球形卷積具有旋轉等變性,但是它是應用在mesh結構的數據上,無法直接用來處理不規則的點云數據。所以還需要對點云進行預處理,即將點云轉換為歐式結構的球形體素。
    • 作者認為直接對點云進行均勻采樣是不合理的,因為在兩極附近的點相對稀疏,而在赤道附近的點則更加稠密。我們應該將這個點云分布的不均勻性也考慮進去,根據分布的稠密程度自適應地對點進行采樣,構建球形體素。
    • 一些定義如下:
      • 單位球:
        • 單位球S2S^2S2上的任意點為p∈R3p \in \mathbb{R}^{3}pR3,點的模長為1。這是一個二維流型,我們使用球面坐標(α,β)(\alpha, \beta)(α,β)來定義。α∈[0,2π]\alpha \in[0,2 \pi]α[0,2π]指的是XY平面上的方位角。β∈[0,π]\beta \in[0, \pi]β[0,π]指的是到正Z軸的極距角。
      • 球形體素空間:
        • 一個球形體素定義為S2×HS^2 \times HS2×H,其中(α,β)∈S2(\alpha, \beta) \in S^{2}(α,β)S2表示點被投影到單位球上的坐標,而h∈Hh \in HhH表示點到球體中心的距離。
    • 給定了一個離散球形體素的位置(α[i],β[j],h[k])(\alpha[i], \beta[j], h[k])(α[i],β[j],h[k]),我們要計算信號f:S2×H→Rf : S^{2} \times H \rightarrow \mathbb{R}f:S2×HR,其中i∈{0,1,…,I}i \in\{0,1, \ldots, I\}i{0,1,,I}j∈{0,1,…,J}j \in\{0,1, \ldots, J\}j{0,1,,J}K∈{0,1,…,K}K \in \{0,1, \ldots, K\}K{0,1,,K},并且IIIJJJKKK都是預先定義好的分辨率。在S2×HS^{2} \times HS2×H上的第nnn個點的坐標為(αn,βn,hn)\left(\alpha_{n}, \beta_{n}, h_{n}\right)(αn?,βn?,hn?),且總共有NNN個點。采樣函數fff的計算公式如下:
      • f(α[i],β[j],h[k])=∑n=1Nwn?(δ?∥h[k]?hn∥)∑n=1Nwnf(\alpha[i], \beta[j], h[k])=\frac{\sum_{n=1}^{N} w_{n} \cdot\left(\delta-\left\|h[k]-h_{n}\right\|\right)}{\sum_{n=1}^{N} w_{n}}f(α[i],β[j],h[k])=n=1N?wn?n=1N?wn??(δ?h[k]?hn?)?
      • 其中:wn=1(∥α[i]?αn∥&lt;δ)?1(∥β[j]?βn∥&lt;ηδ)?1(∥h[k]?hn∥&lt;δ)\begin{aligned} w_{n}=&amp; \mathbf{1}\left(\left\|\alpha[i]-\alpha_{n}\right\|&lt;\delta\right) \\ &amp; \cdot \mathbf{1}\left(\left\|\beta[j]-\beta_{n}\right\|&lt;\eta \delta\right) \\ &amp; \cdot \mathbf{1}\left(\left\|h[k]-h_{n}\right\|&lt;\delta\right) \end{aligned}wn?=?1(α[i]?αn?<δ)?1(β[j]?βn?<ηδ)?1(h[k]?hn?<δ)?
      • δ\deltaδ是預先定義好的濾波器寬度。
      • 每個球形體素的信號都是(δ?∥h[k]?hn∥)∈[0,δ]\left(\delta-\left\|h[k]-h_{n}\right\|\right) \in[0, \delta](δ?h[k]?hn?)[0,δ],表示沿著HHH軸的信息,與S2S^2S2正交,同時對于旋轉變換是不變的。
    • 密度感知系數:
      • η=sin?(β)\eta=\sin (\beta)η=sin(β)用來控制fff自適應地對非均勻密度下的點集進行采樣。示意圖間圖4。

    2.4、球形體素卷積(SVC)

    • 旋轉:
      • 旋轉群SO(3)SO(3)SO(3),也被叫作特殊正交群,是一個三維流型,可以參數化為ZYZ歐拉角(α,β,γ)(\alpha, \beta, \gamma)(α,β,γ),其中α∈[0,2π]\alpha \in[0,2 \pi]α[0,2π]β∈[0,π]\beta \in[0, \pi]β[0,π]γ∈[0,2π]\gamma \in[0,2 \pi]γ[0,2π]。
    • 球形體素信號的旋轉:
      • 定義球形體素信號的旋轉操作子LRL_RLR?。
      • [LRf](x,h)=f(R?1x,h)\left[L_{R} f\right](x, h)=f\left(R^{-1} x, h\right)[LR?f](x,h)=f(R?1x,h)
      • 其中,R∈SO(3)R \in S O(3)RSO(3)x∈S2x \in S^{2}xS2h∈Hh \in HhH并且f:S2×H→Rf : S^{2} \times H \rightarrow \mathbb{R}f:S2×HR。
      • 這里的旋轉只會影響球面坐標,而不會對HHH域有影響。
    • 球形體素卷積(spherical voxel convolution):
      • 兩個球面信號相互卷積的計算公式如下:
        • [ψ?f](p)=?Lp~ψ,f?=∫h∫xψ(p~?1x,h)f(x,h)dxdh\begin{aligned}[\psi \star f](p) &amp;=\left\langle L_{\tilde{p}} \psi, f\right\rangle \\ &amp;=\int_{h} \int_{x} \psi\left(\tilde{p}^{-1} x, h\right) f(x, h) d x d h \end{aligned}[ψ?f](p)?=?Lp~??ψ,f?=h?x?ψ(p~??1x,h)f(x,h)dxdh?
        • 其中p∈S2×Hp \in S^{2} \times HpS2×Hp~∈SO(3)\tilde{p} \in S O(3)p~?SO(3)x∈S2x \in S^{2}xS2h∈Hh \in HhH,還有ψ,f:S2×H→R\psi, f : S^{2} \times H \rightarrow \mathbb{R}ψ,f:S2×HR。
      • 具體實現部分請參考Spherical CNN。
    • 等變性:
      • [ψ?[LRf]](p)=[LR[ψ?f]](p)\left[\psi \star\left[L_{R} f\right]\right](p)=\left[L_{R}[\psi \star f]\right](p)[ψ?[LR?f]](p)=[LR?[ψ?f]](p)
      • 上式對于任意的R∈SO(3)R \in S O(3)RSO(3)都成立。
    • 旋轉不變KL散度損失:
      • 對于每個點ppp的損失函數定義為:Loss?(p)=KL([ψ?f](p),y(p))\operatorname{Loss}(p)=K L([\psi \star f](p), y(p))Loss(p)=KL([ψ?f](p),y(p))
        • fff是輸入信號,ψ\psiψ是要學習的卷積核,yyy是ground truth的one-hot標簽。
      • 旋轉不變性證明:
        • 假設點ppp旋轉了RRR,得到:f′=LRff^{\prime} = L_R ff=LR?fp′=Rpp^{\prime} = R pp=Rp。
        • 拿過來前面定義的幾個公式:
          • 等變性公式:[ψ?[LRf]](p)=[LR[ψ?f]](p)(Equation?5)\left[\psi \star\left[L_{R} f\right]\right](p)=\left[L_{R}[\psi \star f]\right](p) \text { (Equation } 5 )[ψ?[LR?f]](p)=[LR?[ψ?f]](p)?(Equation?5)
          • 球形信號旋轉公式:[LRf](x,h)=f(R?1x,h)(Equation?3)\left[L_{R} f\right](x, h)=f\left(R^{-1} x, h\right) \text { (Equation } 3 )[LR?f](x,h)=f(R?1x,h)?(Equation?3)
        • 代入前面兩個公式:
          • Loss?(p′)=Loss?(Rp)=KL([ψ?f′](Rp),y(p′))=KL([ψ?[LRf]](Rp),y(p′))=KL([LR[ψ?f]](Rp),y(p′))(Equation?5)=KL([LR?1LR[ψ?f]](p),y(p′))(Equation?3)?=KL([ψ?f](p),y(p′))=KL([ψ?f](p),y(p))(label?stays?the?same)?=Loss?(p)\begin{aligned} \operatorname{Loss}\left(p^{\prime}\right) &amp;=\operatorname{Loss}(R p) \\ &amp;=K L\left(\left[\psi \star f^{\prime}\right](R p), y\left(p^{\prime}\right)\right) \\ &amp;=K L\left(\left[\psi \star\left[L_{R} f\right]\right](R p), y\left(p^{\prime}\right)\right) \\ &amp;=K L\left(\left[L_{R}[\psi \star f]\right](R p), y\left(p^{\prime}\right)\right) \quad \text { (Equation } 5 ) \\ &amp;=K L\left(\left[L_{R^{-1}} L_{R}[\psi \star f]\right](p), y\left(p^{\prime}\right)\right) \quad \text { (Equation 3) } \\ &amp;=K L\left([\psi \star f](p), y\left(p^{\prime}\right)\right) \\ &amp;=K L([\psi \star f](p), y(p)) \quad \text { (label stays the same) } \\ &amp;=\operatorname{Loss}(p) \end{aligned}Loss(p)?=Loss(Rp)=KL([ψ?f](Rp),y(p))=KL([ψ?[LR?f]](Rp),y(p))=KL([LR?[ψ?f]](Rp),y(p))?(Equation?5)=KL([LR?1?LR?[ψ?f]](p),y(p))?(Equation?3)?=KL([ψ?f](p),y(p))=KL([ψ?f](p),y(p))?(label?stays?the?same)?=Loss(p)?
    • 實際實現時采用了FFT先將球形信號與濾波器信號都轉換到頻域,相乘后再做逆變換轉換回原先的空域。主要目的是加速計算。

    2.5、網絡結構

    • 上圖是PRIN的分類網絡和分割網絡示意圖。
    • 分類網絡比較簡單,就是SVC提取旋轉不變特征,然后接上一個全局最大池化,然后進行分類。
    • 分割網絡在SVC提取特征后,還需要重新上采樣回原始點集,這里用到了三線性插值。每個點的特征是其最近鄰的8個體素的加權平均和,權重是距離的倒數。

    2.6、實驗

    3,參考資料

  • PRIN: Pointwise Rotation-Invariant Network
  • 總結

    以上是生活随笔為你收集整理的论文笔记:PRIN: Pointwise Rotation-Invariant Networks的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。