日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

计算机视觉 - 知识点总结(面试、笔试)

發布時間:2025/3/15 编程问答 15 豆豆
生活随笔 收集整理的這篇文章主要介紹了 计算机视觉 - 知识点总结(面试、笔试) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

目錄

  • 聲明:十分歡迎轉載,但須先征求本人同意。
  • 本博客將持續不定時更新。
  • 常見cv面試題
    • DropOut的作用和原理
    • 過擬合與欠擬合
    • 正則化(L0、L1、L2)
    • 線性回歸(LR)和SVM的異同
    • GDBT、XGBoost
    • Bagging、Boosting、Stacking
    • 正負樣本數目不均衡
  • 機器學習
    • SVM
    • 決策樹
    • EM算法
    • HMM(隱馬爾可夫)
    • CRF(條件隨機場)
    • 最小二乘法
    • 樸素貝葉斯
    • GMM(高斯混合模型)
  • 圖像特征
    • 顏色特征
    • SIFT
    • HOG
    • LBP
    • Haar
    • SURF
  • 濾波器
    • 箱式濾波器
    • 高斯濾波器
    • 差分濾波器
    • 最大值濾波器
    • 最小值濾波器
    • 中值濾波器
    • 梯度銳化算子濾波器
  • 邊緣提取算子
    • Sobel
    • prewitt
    • robert
    • Laplacian
    • Log/Marr
    • Canny
    • 對比
  • 激活函數
    • Sigmoid
    • tanh
    • ReLU
    • Leaky ReLU
    • PReLU
    • ELU
    • Swish
    • Maxout
  • 損失函數
    • 交叉熵
    • logstic loss
    • hinge loss
    • focus loss
    • triple loss
  • Normalization
    • whitening(白化)
    • Batch Normalization
    • Group Normalization
  • 網絡優化方法
    • BGD
    • SGD
    • Mini-batch SGD
    • Momentum
    • RMSProp
    • ADAM
  • 常見網絡結構
    • AlexNet
    • VGG
    • ResNet
    • Inception
    • SENet
    • DenseNet
    • MobileNet
  • 目標跟蹤
    • KCF
    • SiamFC
    • SiamRPN
    • ATOM
  • 目標檢測
    • R-CNN
    • Fast R-CNN
    • Faster R-CNN
    • YOLOv1
    • YOLOv2
    • YOLOv3
    • CenterNet
    • GuidedAnchor
    • FCOS
  • 超分辨率重建
    • DBPN
    • EDSR
    • WDSR
    • EDVR
  • 智力題
    • 老鼠喝藥問題
    • 已知點線個數,求三角形個數


聲明:十分歡迎轉載,但須先征求本人同意。

本博客將持續不定時更新。




常見cv面試題

DropOut的作用和原理

過擬合與欠擬合

正則化(L0、L1、L2)

線性回歸(LR)和SVM的異同

GDBT、XGBoost

Bagging、Boosting、Stacking

正負樣本數目不均衡


機器學習

SVM

決策樹

EM算法

HMM(隱馬爾可夫)

CRF(條件隨機場)

最小二乘法

樸素貝葉斯

GMM(高斯混合模型)


圖像特征

顏色特征

SIFT

HOG

LBP

Haar

SURF


濾波器

前三個為線性濾波器。

箱式濾波器

高斯濾波器

差分濾波器

以下為非線性濾波器。

最大值濾波器

最小值濾波器

中值濾波器

梯度銳化算子濾波器

Soble算子、Roberts算子、Prewitt算子

邊緣提取算子

前三個為一階提取算子。

Sobel

prewitt

robert

以下為二階提取算子。

Laplacian

Log/Marr

Canny

對比


激活函數

Sigmoid

tanh

ReLU

Leaky ReLU

PReLU

ELU

Swish

Maxout


損失函數

交叉熵

logstic loss

hinge loss

focus loss

triple loss


Normalization

whitening(白化)

Batch Normalization

BN層解決的是Internal Covariate Shift問題,簡稱ICS問題。

  • ICS問題

Group Normalization


網絡優化方法

BGD

SGD

Mini-batch SGD

Momentum

RMSProp

ADAM


常見網絡結構

AlexNet

VGG

ResNet

Inception

SENet

DenseNet

MobileNet


目標跟蹤

KCF

SiamFC

SiamRPN

主要思想:

  • 在SiamFC上加入RPN結構,能夠直接回歸出bbox,無需多尺度search
  • local one-shot learning(其實從SiamFC開始就是one-shot learning)

RPN:

  • RPN階段的損失函數、回歸的值均與Faster R-CNN中相同
  • anchor個數:w×h×5×1w \times h \times 5 \times 1w×h×5×1
  • RPN階段正負樣本篩選閾值:0.3、0.6(在Faster R-CNN中為0.3、0.7)
  • RPN訓練階段正負樣本比例16:48

后處理(篩選proposals):

  • 只保留與中心坐標距離小于7的bbox
  • 對于上一步篩選得到的proposals使用余弦窗口進行抑制
  • 對于上一步篩選得到的proposals進行NMS
  • 對于上一步篩選得到的最終bbox,使用線性插值進行平滑處理。

ATOM


目標檢測

R-CNN

檢測流程:

  • 使用selective search提取proposals
  • 將proposals進行resize,統一尺寸
  • 將proposals送入卷積層,進行特征提取
  • 使用SVM進行分類,使用脊回歸對位置進行修正

缺點:

  • proposals提取過程太慢
  • 對于每個proposal都要經過卷積運算,會帶來重復計算
  • 步驟過多,訓練麻煩

Fast R-CNN

檢測流程:

  • 對于圖片i,使用selective search提取proposals
  • 將圖片i輸入特征提取網絡,得到特征圖
  • 在特征圖上裁出每個proposals對應的區域,得到RoIs
  • 對RoIs進行RoI Pooling,得到相同大小的特征
  • 使用fc進行分類,使用脊回歸對位置進行修正

缺點:

  • proposals的提取過慢
  • RoI Pooling有取整過程,有精度損失

Faster R-CNN

檢測流程:

  • 對于圖片i,送入共享卷積層(Fast R-CNN和RPN共享),得到特征圖
  • 將特征圖輸入RPN網絡,得到proposals
  • 對于得到的proposals,根據得分進行排序,再取topn,經過NMS后,得到的proposals稱為RoIs,送入RoIpooling
  • 使用fc進行分類,使用脊回歸對位置進行修正
  • 對于最終預測的bboxes進行后處理(限制框在圖像內、NMS)
  • 以下圖片轉自鏈接

RPN網絡:

  • 對于大小為[w,h][w, h][w,h]的特征圖,每個點有kkk個anchor,全圖共計k×w×hk\times w\times hk×w×h個anchor
  • 對anchor進行正負樣本劃分:(1)與gt具有最大IoU的anchors為正樣本;(2)與gt的IoU大于0.7的anchors為正樣本;(3)與gt的IoU小于0.3的anchors為負樣本。
  • 隨機抽取128個正樣本、128個負樣本,訓練RPN網絡
  • 精修anchors的結果為(回歸dx,dy,dw,dhd_x,d_y,d_w,d_hdx?,dy?,dw?,dh?):
    Gx′=Ax+dxAwG_{x}^{'}=A_x+d_xA_wGx?=Ax?+dx?Aw?
    Gy′=Ay+dyAhG_{y}^{'}=A_y+d_yA_hGy?=Ay?+dy?Ah?
    Gw′=AwedwG_{w}^{'}=A_we^{d_w}Gw?=Aw?edw?
    Gh′=AhedhG_{h}^{'}=A_he^{d_h}Gh?=Ah?edh?

訓練過程:

  • RPN網絡和分類回歸網絡交替訓練

損失函數:

  • 第一部分:RPN的損失函數
  • 第二部分:分類回歸的損失函數

YOLOv1

YOLOv2

YOLOv3

CenterNet

GuidedAnchor

FCOS


超分辨率重建

DBPN

EDSR

WDSR

EDVR

NTIRE 2019視頻恢復比賽四項冠軍。

  • 整體結構
  • PCD對齊模塊
    使用金字塔形、級聯的可變性卷積進行多幀對齊。
  • TSA融合模塊
    對不同幀的特征進行融合,相當于學習了spatial attention和channel attention。

智力題

老鼠喝藥問題

  • 題意:有100個瓶子,其中99個瓶子中是水,1瓶是毒藥。我們有無限只老鼠,老鼠喝了毒藥第二天會死。給你一天時間,最少需要多少只老鼠才可以測出哪瓶是毒藥。
  • 答案:找到滿足2x>=1002^x>=1002x>=100的最小xxx即可,本題即為7。
  • 解析:我們把100個瓶子使用二進制進行編號,第一個瓶子編號為0,第二個瓶子編號為1,第三個瓶子編號為10,第四個瓶子編號為11… 依此類推。讓第一只老鼠喝下編號最后一位為1的所有瓶子,第二只老鼠喝下編號倒數第二位為1的所有瓶子…依此類推。第二天,活著的老鼠對應位置1,死了的老鼠對應位置0,即得到了毒藥瓶子編號。

已知點線個數,求三角形個數

  • 題意:已知有12個點,由其中任意兩點相連可以構成59條不同的直線,求這些點能夠組成多少個不同的三角形。
  • 答案:C123?C33?C43=220?1?4=215C_{12}^{3}-C_{3}^{3}-C_{4}^{3} = 220-1-4 = 215C123??C33??C43?=220?1?4=215
  • 解析:加入這12個點都不共線,則應可構成C122=66C_{12}^{2} = 66C122?=66條線,題意中說構成59條線,少了7條線,說明有三點共線、四點共線、五點共線等情況出現。
    如果三點共線,總線數應減少:C32?1=2C_{3}^{2}-1=2C32??1=2
    如果四點共線,總線數應減少:C42?1=5C_{4}^{2}-1=5C42??1=5
    哇,2+5=7,說明出現了一組三點共線,一組四點共線。
    計算三角形個數:C123?C33?C43=215C_{12}^{3}-C_{3}^{3}-C_{4}^{3} = 215C123??C33??C43?=215

總結

以上是生活随笔為你收集整理的计算机视觉 - 知识点总结(面试、笔试)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。