日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

stn,spatial transformer network总结

發布時間:2025/3/20 编程问答 26 豆豆
生活随笔 收集整理的這篇文章主要介紹了 stn,spatial transformer network总结 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

對整篇paper的一個總結:https://blog.csdn.net/xbinworld/article/details/69049680

github:1.https://github.com/Dive-frank/caffe_stn 有prototxt,并且prototxt看起來寫的還不錯

?????????? 2.https://github.com/christopher5106/last_caffe_with_stn,最原始的用caffe寫stn的

?

stn就是一個模塊,可以加在任何兩個卷積之間,是無監督學習的.通過localisation net學theta參數,6個值用來做仿射變換.可以這樣認為,localisation net之前是輸入,暫且叫feature map i,之后就是輸出,暫且叫feature map o.必須清楚一點是:經過stn處理之后,feature map的大小保持不變,localisation net之后的feature map雖然沒有像素值,但是是有坐標值的.這些localisation net之后的feature map(里面所有的坐標點)通過仿射變換找到在輸入feature map上的坐標點,然后從這些坐標點取出像素值給輸出的feature map,一一對應.可以這樣理解,其實輸出的feature map就是從輸入的feature map里面摳出的一部分放大,所以,輸出的feature map的所有點都會在輸入上有相應的映射點.這時你在想,實際上輸入輸出是一樣大的,把輸出的所有點映射到輸入的一部分區域,那肯定在輸出落在輸入的點肯定不全是整數點,因為個數不夠,所以會有許多浮點數的點,這個時候就利用插值來求這些點的像素值了.

?

stn這種主要是解決分類問題,因為是整張圖來做,如果用在detection,我覺得可以把那個物體摳出來單獨做stn

總結

以上是生活随笔為你收集整理的stn,spatial transformer network总结的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。