日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

光流估计和物体跟踪

發(fā)布時間:2025/1/21 编程问答 17 豆豆
生活随笔 收集整理的這篇文章主要介紹了 光流估计和物体跟踪 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

光流估計和物體 跟蹤

1:視頻的基礎(chǔ)概念

  • 視頻:由一系列的圖片拼接而成的,按照一定的速度順序播放

  • 幀:組成視頻的靜態(tài)圖像

  • 幀率:每一秒鐘內(nèi)視頻內(nèi)靜態(tài)圖像的數(shù)量

    • 24,人眼是認為動態(tài)的視頻
    • 人眼的極限是55幀,一般的視頻都是30幀。倍速的話,是幀率的提高嗎?
  • 視頻的壓縮

    • 幀內(nèi)的壓縮
      • 每一幀之間可能有顏色或者是樣式相似的區(qū)域
    • 幀間的壓縮
      • 相似視頻幀之間可能只有很小的變化
  • 幀的分類

    • I幀(關(guān)鍵幀):幀內(nèi)壓縮
    • P幀(預(yù)測):參考前一個I幀 / P幀來進行壓縮
    • B幀(雙向預(yù)測):參考前一個和后一個的 I 幀/ P 幀來進行壓縮

2:光流

  • 光流:相對于觀察者的運動所造成的觀測目標,表面或者是邊緣的運動

  • 光流估計:估計視頻幀中的每一個點的光流

    • purpose:估計視頻幀中的每一個點的光流
    • input:視頻
    • output:光流
    • challenge:準確性,計算量
  • Lucas & Kanade

    • 假設(shè)在連續(xù)的幀中,同一個運動物體的亮度不變,也就是像素值不變
    • 像素點(x,y)及周圍領(lǐng)域內(nèi)的像素點的運動方向是一致的,采用最小二乘法進行求解。
  • 深度學(xué)習(xí)的方法

    • FlowNetSimple:將兩張圖片簡單排列在一起作為CNN encoder的輸入

    • :分別先對兩張圖像進行卷積,獲得較為高層的feature之后,再引入人為定義的規(guī)則將信息合并

    • LOSS:給定每個像素的groundTruth的光流,每個像素的損失定義為預(yù)測的和groundtruth之間的歐氏距離

    • FlowNet2.0

      • 疊加了多個FlowNet網(wǎng)絡(luò),實現(xiàn)了由粗到細的光流估計
      • 針對于較小的物體估計不準,減小了卷積核的大小,并且縮短了卷積的步長
      • 得到了新的數(shù)據(jù)
    • PWC net

      • 采用了圖像金字塔
      • 做到了視頻上的實時光流估計
    • MaskFlowNet

      • 在被遮擋的情況下,也能夠進行工作
    • 應(yīng)用

      • 視頻分析
        • 每幀獨立的處理是比較慢的
        • 復(fù)用上一次的,精度會有損失
      • 對行為進行預(yù)測
      • 物體檢測
      • 分割

    3:目標跟蹤 / 物體跟蹤(Object Tracking)

    • purpose:對于指定的物體,給出他在每個視頻幀中的位置

    • input:輸入一個視頻,一個或者是多個物體

    • output:指定物體的邊界線軌跡

    • challenge:姿態(tài)改變;亮度;遮擋

    • 基本思路

      • 輸入初始化的目標框,選取一些候選框,并對候選框進行評分,在這些候選框中得到一個得分最高的作為預(yù)測的目標
        • 怎么樣產(chǎn)生候選框框
        • 怎么樣提取特征
        • 怎么樣為候選框評分
        • 怎么更新模型
        • 怎么集成決策
    • 評價基準

      • OTB:OTB50 和 OTB100
      • VOT:ICCV + ECCV
        • OTB VOT
          • VOT
          • VOT是比較好的,他是全是彩色的,但是OTB有 25 %是灰色的
          • VOT的分辨率普遍比較好
          • 并且你如果跟蹤丟了,他會在五幀后會給你調(diào)回來,
          • OTB是隨機幀開始,但是VOT是一直從第一幀開始
    • 相關(guān)濾波

      • 利用濾波的模板和目標候選區(qū)域做相關(guān)的運算,最大輸出響應(yīng)的位置就是當(dāng)前幀的目標位置
    • 深度學(xué)習(xí)

      • 底層的特征具有較高的分辨率,能夠?qū)δ繕诉M行精準的定位
      • 高層的特征則包含更多的語義信息,處理較大的變換和防止跟蹤器漂移,對目標進行范圍定位
      • 訓(xùn)練和速度
    • 物體軌跡提議

      • purpose:給出視頻中可能包含物體的邊界框的軌跡
      • 輸入:視頻
      • output:一組邊界框的軌跡
      • challenge:組合爆炸,似物性估計

總結(jié)

以上是生活随笔為你收集整理的光流估计和物体跟踪的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。