计算机视觉 - 知识点总结(面试、笔试)
生活随笔
收集整理的這篇文章主要介紹了
计算机视觉 - 知识点总结(面试、笔试)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
目錄
- 聲明:十分歡迎轉載,但須先征求本人同意。
- 本博客將持續不定時更新。
- 常見cv面試題
- DropOut的作用和原理
- 過擬合與欠擬合
- 正則化(L0、L1、L2)
- 線性回歸(LR)和SVM的異同
- GDBT、XGBoost
- Bagging、Boosting、Stacking
- 正負樣本數目不均衡
- 機器學習
- SVM
- 決策樹
- EM算法
- HMM(隱馬爾可夫)
- CRF(條件隨機場)
- 最小二乘法
- 樸素貝葉斯
- GMM(高斯混合模型)
- 圖像特征
- 顏色特征
- SIFT
- HOG
- LBP
- Haar
- SURF
- 濾波器
- 箱式濾波器
- 高斯濾波器
- 差分濾波器
- 最大值濾波器
- 最小值濾波器
- 中值濾波器
- 梯度銳化算子濾波器
- 邊緣提取算子
- Sobel
- prewitt
- robert
- Laplacian
- Log/Marr
- Canny
- 對比
- 激活函數
- Sigmoid
- tanh
- ReLU
- Leaky ReLU
- PReLU
- ELU
- Swish
- Maxout
- 損失函數
- 交叉熵
- logstic loss
- hinge loss
- focus loss
- triple loss
- Normalization
- whitening(白化)
- Batch Normalization
- Group Normalization
- 網絡優化方法
- BGD
- SGD
- Mini-batch SGD
- Momentum
- RMSProp
- ADAM
- 常見網絡結構
- AlexNet
- VGG
- ResNet
- Inception
- SENet
- DenseNet
- MobileNet
- 目標跟蹤
- KCF
- SiamFC
- SiamRPN
- ATOM
- 目標檢測
- R-CNN
- Fast R-CNN
- Faster R-CNN
- YOLOv1
- YOLOv2
- YOLOv3
- CenterNet
- GuidedAnchor
- FCOS
- 超分辨率重建
- DBPN
- EDSR
- WDSR
- EDVR
- 智力題
- 老鼠喝藥問題
- 已知點線個數,求三角形個數
聲明:十分歡迎轉載,但須先征求本人同意。
本博客將持續不定時更新。
常見cv面試題
DropOut的作用和原理
過擬合與欠擬合
正則化(L0、L1、L2)
線性回歸(LR)和SVM的異同
GDBT、XGBoost
Bagging、Boosting、Stacking
正負樣本數目不均衡
機器學習
SVM
決策樹
EM算法
HMM(隱馬爾可夫)
CRF(條件隨機場)
最小二乘法
樸素貝葉斯
GMM(高斯混合模型)
圖像特征
顏色特征
SIFT
HOG
LBP
Haar
SURF
濾波器
前三個為線性濾波器。
箱式濾波器
高斯濾波器
差分濾波器
以下為非線性濾波器。
最大值濾波器
最小值濾波器
中值濾波器
梯度銳化算子濾波器
Soble算子、Roberts算子、Prewitt算子
邊緣提取算子
前三個為一階提取算子。
Sobel
prewitt
robert
以下為二階提取算子。
Laplacian
Log/Marr
Canny
對比
激活函數
Sigmoid
tanh
ReLU
Leaky ReLU
PReLU
ELU
Swish
Maxout
損失函數
交叉熵
logstic loss
hinge loss
focus loss
triple loss
Normalization
whitening(白化)
Batch Normalization
BN層解決的是Internal Covariate Shift問題,簡稱ICS問題。
- ICS問題
Group Normalization
網絡優化方法
BGD
SGD
Mini-batch SGD
Momentum
RMSProp
ADAM
常見網絡結構
AlexNet
VGG
ResNet
Inception
SENet
DenseNet
MobileNet
目標跟蹤
KCF
SiamFC
SiamRPN
主要思想:
- 在SiamFC上加入RPN結構,能夠直接回歸出bbox,無需多尺度search
- local one-shot learning(其實從SiamFC開始就是one-shot learning)
RPN:
- RPN階段的損失函數、回歸的值均與Faster R-CNN中相同
- anchor個數:w×h×5×1w \times h \times 5 \times 1w×h×5×1
- RPN階段正負樣本篩選閾值:0.3、0.6(在Faster R-CNN中為0.3、0.7)
- RPN訓練階段正負樣本比例16:48
后處理(篩選proposals):
- 只保留與中心坐標距離小于7的bbox
- 對于上一步篩選得到的proposals使用余弦窗口進行抑制
- 對于上一步篩選得到的proposals進行NMS
- 對于上一步篩選得到的最終bbox,使用線性插值進行平滑處理。
ATOM
目標檢測
R-CNN
檢測流程:
- 使用selective search提取proposals
- 將proposals進行resize,統一尺寸
- 將proposals送入卷積層,進行特征提取
- 使用SVM進行分類,使用脊回歸對位置進行修正
缺點:
- proposals提取過程太慢
- 對于每個proposal都要經過卷積運算,會帶來重復計算
- 步驟過多,訓練麻煩
Fast R-CNN
檢測流程:
- 對于圖片i,使用selective search提取proposals
- 將圖片i輸入特征提取網絡,得到特征圖
- 在特征圖上裁出每個proposals對應的區域,得到RoIs
- 對RoIs進行RoI Pooling,得到相同大小的特征
- 使用fc進行分類,使用脊回歸對位置進行修正
缺點:
- proposals的提取過慢
- RoI Pooling有取整過程,有精度損失
Faster R-CNN
檢測流程:
- 對于圖片i,送入共享卷積層(Fast R-CNN和RPN共享),得到特征圖
- 將特征圖輸入RPN網絡,得到proposals
- 對于得到的proposals,根據得分進行排序,再取topn,經過NMS后,得到的proposals稱為RoIs,送入RoIpooling
- 使用fc進行分類,使用脊回歸對位置進行修正
- 對于最終預測的bboxes進行后處理(限制框在圖像內、NMS)
- 以下圖片轉自鏈接
RPN網絡:
- 對于大小為[w,h][w, h][w,h]的特征圖,每個點有kkk個anchor,全圖共計k×w×hk\times w\times hk×w×h個anchor
- 對anchor進行正負樣本劃分:(1)與gt具有最大IoU的anchors為正樣本;(2)與gt的IoU大于0.7的anchors為正樣本;(3)與gt的IoU小于0.3的anchors為負樣本。
- 隨機抽取128個正樣本、128個負樣本,訓練RPN網絡
- 精修anchors的結果為(回歸dx,dy,dw,dhd_x,d_y,d_w,d_hdx?,dy?,dw?,dh?):
Gx′=Ax+dxAwG_{x}^{'}=A_x+d_xA_wGx′?=Ax?+dx?Aw?
Gy′=Ay+dyAhG_{y}^{'}=A_y+d_yA_hGy′?=Ay?+dy?Ah?
Gw′=AwedwG_{w}^{'}=A_we^{d_w}Gw′?=Aw?edw?
Gh′=AhedhG_{h}^{'}=A_he^{d_h}Gh′?=Ah?edh?
訓練過程:
- RPN網絡和分類回歸網絡交替訓練
損失函數:
- 第一部分:RPN的損失函數
- 第二部分:分類回歸的損失函數
YOLOv1
YOLOv2
YOLOv3
CenterNet
GuidedAnchor
FCOS
超分辨率重建
DBPN
EDSR
WDSR
EDVR
NTIRE 2019視頻恢復比賽四項冠軍。
- 整體結構
- PCD對齊模塊
使用金字塔形、級聯的可變性卷積進行多幀對齊。
- TSA融合模塊
對不同幀的特征進行融合,相當于學習了spatial attention和channel attention。
智力題
老鼠喝藥問題
- 題意:有100個瓶子,其中99個瓶子中是水,1瓶是毒藥。我們有無限只老鼠,老鼠喝了毒藥第二天會死。給你一天時間,最少需要多少只老鼠才可以測出哪瓶是毒藥。
- 答案:找到滿足2x>=1002^x>=1002x>=100的最小xxx即可,本題即為7。
- 解析:我們把100個瓶子使用二進制進行編號,第一個瓶子編號為0,第二個瓶子編號為1,第三個瓶子編號為10,第四個瓶子編號為11… 依此類推。讓第一只老鼠喝下編號最后一位為1的所有瓶子,第二只老鼠喝下編號倒數第二位為1的所有瓶子…依此類推。第二天,活著的老鼠對應位置1,死了的老鼠對應位置0,即得到了毒藥瓶子編號。
已知點線個數,求三角形個數
- 題意:已知有12個點,由其中任意兩點相連可以構成59條不同的直線,求這些點能夠組成多少個不同的三角形。
- 答案:C123?C33?C43=220?1?4=215C_{12}^{3}-C_{3}^{3}-C_{4}^{3} = 220-1-4 = 215C123??C33??C43?=220?1?4=215
- 解析:加入這12個點都不共線,則應可構成C122=66C_{12}^{2} = 66C122?=66條線,題意中說構成59條線,少了7條線,說明有三點共線、四點共線、五點共線等情況出現。
如果三點共線,總線數應減少:C32?1=2C_{3}^{2}-1=2C32??1=2
如果四點共線,總線數應減少:C42?1=5C_{4}^{2}-1=5C42??1=5
哇,2+5=7,說明出現了一組三點共線,一組四點共線。
計算三角形個數:C123?C33?C43=215C_{12}^{3}-C_{3}^{3}-C_{4}^{3} = 215C123??C33??C43?=215
總結
以上是生活随笔為你收集整理的计算机视觉 - 知识点总结(面试、笔试)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 使用C/C++解析json文件
- 下一篇: 2019年, image caption