日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

CV 复习(大纲)

發(fā)布時間:2025/1/21 编程问答 21 豆豆
生活随笔 收集整理的這篇文章主要介紹了 CV 复习(大纲) 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

文章目錄

  • 計(jì)算機(jī)視覺導(dǎo)論
    • 1:提出
  • 7:文字檢測和識別
    • 1:OCR
  • 6:行人檢測,重識別和姿態(tài)估計(jì)
  • 5:人臉檢測和識別

  • 計(jì)算機(jī)視覺課程完全不知道怎么復(fù)習(xí),由于沒有咋讀過論文,所以PPT里面的東西基本都看不懂。
  • 以后碰到PPT里面有論文的,還是要提前讀一讀

計(jì)算機(jī)視覺導(dǎo)論

1:提出

  • 1966年的MIT的一個暑假項(xiàng)目,構(gòu)建視覺系統(tǒng)的主體部分

  • 20世紀(jì)70年代

    • 在解決推理和規(guī)劃等問題之前,視覺輸入的處理
    • 與數(shù)字圖像處理相區(qū)別的是從圖像中恢復(fù)場景的三維結(jié)構(gòu)并更好的理解場景
    • 數(shù)字圖像處理,計(jì)算機(jī)圖像處理,將圖像信號轉(zhuǎn)變?yōu)閿?shù)字信號并且利用計(jì)算機(jī)進(jìn)行處理的過程,通過計(jì)算機(jī)對圖像進(jìn)行去除噪聲,增強(qiáng),復(fù)原,分割,提取特征。
    • Block word
    • 線條標(biāo)注(line labeling)
    • 邊緣檢測(edge detection)
    • 非多邊形的三維建模
      • 采用廣義錐作為部件,通過圖案結(jié)構(gòu)彈性安排部件
    • 圖像分割
  • 20實(shí)際80年代

    • 利用本征圖像,理解亮度和陰影的變化
    • 立體視覺對應(yīng)
    • 基于亮度的光流
    • 圖像金字塔
    • 由X到形狀
    • 更好的邊緣檢測算法:動態(tài)演化輪廓跟蹤器
    • 三維數(shù)據(jù)的處理
    • 利用變分優(yōu)化的思想,是用正則化來加強(qiáng)魯棒性
    • 馬爾可夫隨機(jī)場來表達(dá)
  • 20世界90年代

    • 光流
    • 多視角重建
    • 跟蹤:粒子濾波
    • SIFT(手工提取的一個巔峰,基于局部匹配,能夠找到圖片的穩(wěn)定點(diǎn)和關(guān)鍵點(diǎn))
    • 統(tǒng)計(jì)學(xué)習(xí)方法,CV技術(shù)首先使用在照相機(jī)上,用于對焦
  • 21世紀(jì)

    • 圖割

7:文字檢測和識別

1:OCR

  • purpose:識別圖像中的文字信息

  • input:一張圖像

  • output:圖像中的文字

  • evaluation:

    • 平均編輯距離:衡量整篇文章的指標(biāo),反映順序,多識別,漏識別
    • 字符識別準(zhǔn)確率:所以字符的正確率,但是無法反應(yīng)漏識別
    • 文本行識別成功率:
  • 簡單理解

    • 漢字,十萬個字
    • 阿拉伯?dāng)?shù)字:10
    • 英語52 大小寫
    • 特征提取(還是是用滑動窗口或者是候選框嗎?分割)
    • 字符分類器,不同語種的字符數(shù)量差異巨大,并且相似度不同
  • 印刷體文字識別

    • 字符排列規(guī)整:易于檢測
      • 基于模板
  • 手寫體文字識別

    • 聯(lián)機(jī)手寫文字識別 / 實(shí)時手寫識別 / 在線手寫體識別
    • 人在手寫文字的時候,及其根據(jù)所書寫文字的比劃,筆順等特征
  • 脫機(jī)手寫 / 離線手寫文字識別

    • 先寫在紙上,然后掃描成圖像,再識別文字
    • 脫機(jī)識別和印刷體識別相似,但是手寫隨意性太大,對字符檢測和識別都很難
  • STR (Scene Text recognition)

    • 多種語言文本混合
    • 方向
    • 模糊,變形
  • 傳統(tǒng)文本檢測 + 識別

    • 先進(jìn)行壁畫和字符的檢測,基于連接組件和基于滑動窗口的兩種方法,再進(jìn)行非文本過濾。
    • 手工特征SWT,MSER無法利用上下文的信息
    • 預(yù)測過程中,前端使用標(biāo)準(zhǔn)的CNN提取文本圖像的特征,利用BLSTM將特征向量進(jìn)行融合以提取字符序列的上下文特征,然后將每列的特征改了吧分布,最后通過轉(zhuǎn)錄層CTC進(jìn)行預(yù)測得到文本的序列。
  • SegLink

    • 角度的靈活檢測,模型不僅能夠?qū)W習(xí)和輸出邊框的位置,還能夠輸出文本框的旋轉(zhuǎn)角度誰他
    • 切片,然后連接各個字的中心點(diǎn),得到旋轉(zhuǎn)角度
    • 增加了對于角度的檢測,使得對于各種角度的文本都具有魯棒性
  • 基于候選框

  • 基于分割

  • CRNN

  • 端到端的

6:行人檢測,重識別和姿態(tài)估計(jì)

  • 基于手工提取特征
  • 基于部件檢測
  • 基于深度學(xué)習(xí)
    • joint
  • 行人的重識別
    • 基于手工特征
    • 深度學(xué)習(xí)
  • 姿態(tài)估計(jì)
    • 單人姿態(tài)估計(jì)
    • 多人姿態(tài)估計(jì)

5:人臉檢測和識別

  • 基于模板的方法
  • 基于ADBOOST
  • 非約束環(huán)境下的人臉檢測
  • 深度學(xué)習(xí)
  • 人臉識別
    • 基于特診匹配基于深度學(xué)習(xí)
    • 人臉的對其
  • 美顏
  • GAN

總結(jié)

以上是生活随笔為你收集整理的CV 复习(大纲)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。