GitHub上有哪些比较好的计算机视觉/机器视觉的项目?
來源:Unsplash,作者:?JR Korpa?
來源:知乎問題
今天分享一下 Github 上不錯的計算機視覺或者機器視覺方面的項目,包括入門的教程、非常經典的算法和實戰項目等等。
今日推薦文章
github標星11600+:最全的吳恩達機器學習課程資源(完整筆記、中英文字幕視頻、python作業,提供百度云鏡像!)
計算機視覺聯盟
https://www.zhihu.com/question/30049772/answer/831391266
從個人經歷出發,全部都是自己在成長過程中所收集到的干貨項目,很多都是自己經過篩選自己總結的,保證你能獲取的是干貨,拿走不謝!本王只需您的點贊和關注!
【1】機器學習西瓜書手推筆記(PDF可打印版本)
自己的純手推筆記,附PDF可打印版本
https://github.com/Sophia-11/Machine-Learning-Notes
【2】計算機視覺領域資源匯總
匯集了計算機視覺資源匯總,包含計算機視覺方向算法匯總、論文匯總
https://github.com/Sophia-11/Awesome-CV-Resources
【3】計算機視覺頂會ICCV2019論文集(標星90)
持續更新收集所有ICCV2019論文集,做科研,搞算法,跟蹤最前沿論文思路,少不了這些頂會論文,附下載鏈接
https://github.com/Sophia-11/Awesome-ICCV2019
【4】再幾個目標檢測經典算法鏈接:
YOLO darknet版本:
https://pjreddie.com/darknet/yolo/
YOLO Keras版本:
https://github.com/qqwweee/keras-yolo3
YOLO mobilenet:
caffe Linux 和Windows 版本:
https://github.com/eric612/MobileNet-YOLO
https://github.com/eric612/Caffe-YOLOv3-Windows
Keras版本:
https://github.com/Adamdad/keras-YOLOv3-mobilenet
MXNET版本:
https://gluon-cv.mxnet.io/model_zoo/detection.html#yolo-v3
https://github.com/sufeidechabei/gluon-mobilenet-yolov3
機器學習西瓜書手推筆記(PDF可打印版本)
Table of Contents
第一章緒論
第一章 緒論
高清圖見GitHub鏈接:https://github.com/Sophia-11/Machine-Learning-Notes
第二章 模型評估與選擇
計算機視覺領域資源匯總
Table of Contents
全球高校計算機視覺實驗室名單
計算機視覺算法資源匯總
AI頂會(2019~2020)
寫了這么多的,希望得到您的關注和點贊,如果想獲取更多,可以查看GitHub或關注公眾號【計算機視覺聯盟】!
量子位的回答
https://www.zhihu.com/question/30049772/answer/741863783
谷歌大腦Quoc Le團隊,又訓練出了一只地表最強的模型。
那是一個目標檢測模型,從前并不是最強大。
但自從用機器學習解鎖了特別的數據擴增策略,再用自動擴增來的新數據集訓練目標檢測模型,事情就完全不同了。
注意:目標檢測和分類不一樣,分類不需要標注邊界框,而目標檢測需要。
△ 左邊是自動擴增數據,右邊是成績提升
模型在COCO目標檢測任務上,拿到了50.7 mAP的最高分,刷新從前的紀錄。
谷歌的方法,并沒有改變模型本身,但有效提升了準確率,+2.3 mAP以上。
團隊還強調,AI在COCO數據集里學到的擴增策略,直接遷移到其他數據集上,同樣可以提升準確率。
現在,算法已經開源了,AI學到的擴增策略也在里面。
是怎樣的擴增策略?
論文寫到,這里的數據擴增只涉及了一些簡單變換 (Simple Transformations) :
有應用在整張圖片上、但不會影響邊界框的那種變換,比如從圖像分類里借來的顏色變換 (Color Transformations)。
也有不影響整張圖片、但改變邊界框位置的那種變換,比如圖像平移 (Translating) 或剪切 (Shearing) 。
注意,這些變換只用在訓練過程中,不會用到測試環節里。
研究人員說,當變換的數量越來越龐大的時候,就很難手動把它們有效組合到一起了。
所以,就要用機器學習,搜索出更適合目標檢測任務的組合策略。
思路是這樣的:
團隊把數據擴增搜索?(Data Augmentation Search) 看做一個離散的優化問題,優化的是模型的泛化表現。
在自家的另一篇論文 (arXiv:1805.09501) 基礎上,把重點轉移到針對目標檢測的擴增策略上。
比起圖像分類任務的數據擴增,目標檢測的難點在于,要保持邊界框和發生形變的圖像之間的一致性(Consistency) 。
而邊界框的標注,也為數據擴增提供了一種新的方式:只在邊界框里面修改圖像。就像上文講的那樣。
另外,團隊還探索了在圖片發生幾何變換?(Geometric Transformations) 的情況下,怎樣去改變邊界框的位置。
具體方法是這樣的:
把擴增策略定義成一組無序的子策略?(Sub-Policy) 。
在訓練過程中,每個子策略都會被隨機選中,應用到當前的圖片里去。
每個子策略里,有N個圖片變換,依次在同一張圖上進行。
要把這個搜索過程,變成一個離散的優化問題,就要創建一個搜索空間。
空間里面,有5個種策略,每種子策略有2種圖像變換運算。
另外,每個運算還和兩個超參數相關聯,一個是代表應用這個運算的可能性 (Probability) ,二是這個運算的大小 (Magnitude) 。
初步實驗之后,團隊定下了22種圖像變換運算。
學習完成的子策略,成效是這樣的:
肉眼可見,成效顯著。
一是在COCO目標檢測中,以50.7 mAP拔得頭籌,(比策略訓練前) 提升了2.3 mAP。
二是在PASCAL VOC目標檢測中,提升了2.7 mAP。
也就是說,在COCO上訓練好的策略,直接搬到其他數據集上也有效。
團隊說,這個方法尤其適合在小數據集中避免過擬合。
代碼開源了,你也去試一下吧。
論文傳送門:
https://arxiv.org/abs/1906.11172
代碼傳送門:
https://github.com/tensorflow/tpu/tree/master/models/official/detection
— 完 —
量子位
「已注銷」
https://www.zhihu.com/question/30049772/answer/127460083
非常多啊
先說說較大的框架項目:
**OpenCV **https://github.com/opencv/opencv
dlib?https://github.com/davisking/dlib
Caffe?https://github.com/BVLC/caffe
Mxnet?https://github.com/dmlc/mxnet
tensorflowhttps://github.com/search%3Futf8%3D%25E2%259C%2593%26q%3Dtensorflow
視覺這塊最主要的檢測以及追蹤
檢測:
RCNN,Fast-RCNN,Faster-RCNN 現在最主流的檢測框架,https://github.com/rbgirshick/py-faster-rcnn -- see https://github.com/ShaoqingRen/faster_rcnn for the official MATLAB version
SSD,達到實時的檢測算法,https://github.com/weiliu89/caffe/tree/ssd
DPM,早期的檢測算法,使用latent SVM GitHub - https://github.com/rbgirshick/voc-dpm.?
追蹤:
TLD,非常魯棒的跟蹤算法 https://github.com/zk00006/OpenTLD
孔濤
https://www.zhihu.com/question/30049772/answer/107232336
我來回答幾個,以下的幾個代碼我都實際運行過,有一部分仔細讀過。
pdollar (Piotr Dollar) https://github.com/pdollar
Piotr's Computer Vision Matlab Toolbox,里邊包含各種各樣的算法,包括特征提取、分割、分類稍等等。
DL系列
Caffe: https://github.com/BVLC/caffe: a fast open framework for deep learning.
model zoo: https://github.com/BVLC/caffe/wiki/Model-Zoo,這個里邊包含了基于caffe實現的各種各樣的模型。
voc-dpm
鉛筆畫的自動生成,把一副圖像變成鉛筆水粉畫,感覺很酷很酷炫有木有
匿名用戶
https://www.zhihu.com/question/30049772/answer/47066644
https://github.com/jbhuang0604/awesome-computer-vision
來自 https://github.com/bayandin/awesome-awesomeness ,各種領域的 Awesome。
雖然絕大多數情況下都是馬了不看
歡迎關注我的微信公眾號--算法猿的成長,或者掃描下方的二維碼,大家一起交流,學習和進步!
如果覺得不錯,在看、轉發就是對小編的一個支持!
推薦閱讀:
Github項目|幾行代碼即可實現人臉檢測、目標檢測的開源計算機視覺庫
你有哪些deep learning(rnn、cnn)調參的經驗?
國內有哪些不錯的CV(計算機視覺)團隊
實戰|手把手教你訓練一個基于Keras的多標簽圖像分類器
總結
以上是生活随笔為你收集整理的GitHub上有哪些比较好的计算机视觉/机器视觉的项目?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 为什么超 80% 的开源开发者苦苦挣扎在
- 下一篇: 怎么学计算机制作ppt教程,ppt 制作