當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

GitHub上有哪些比较好的计算机视觉/机器视觉的项目？

發(fā)布時間：2023/12/10 编程问答 50 豆豆

生活随笔收集整理的這篇文章主要介紹了 GitHub上有哪些比较好的计算机视觉/机器视觉的项目？小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

來源：Unsplash，作者：?JR Korpa?

來源：知乎問題

今天分享一下 Github 上不錯的計算機視覺或者機器視覺方面的項目，包括入門的教程、非常經(jīng)典的算法和實戰(zhàn)項目等等。

今日推薦文章

github標(biāo)星11600+：最全的吳恩達機器學(xué)習(xí)課程資源（完整筆記、中英文字幕視頻、python作業(yè)，提供百度云鏡像！）

計算機視覺聯(lián)盟

https://www.zhihu.com/question/30049772/answer/831391266

從個人經(jīng)歷出發(fā)，全部都是自己在成長過程中所收集到的干貨項目，很多都是自己經(jīng)過篩選自己總結(jié)的，保證你能獲取的是干貨，拿走不謝！本王只需您的點贊和關(guān)注！

【1】機器學(xué)習(xí)西瓜書手推筆記（PDF可打印版本）

自己的純手推筆記，附PDF可打印版本

https://github.com/Sophia-11/Machine-Learning-Notes

【2】計算機視覺領(lǐng)域資源匯總

匯集了計算機視覺資源匯總，包含計算機視覺方向算法匯總、論文匯總

https://github.com/Sophia-11/Awesome-CV-Resources

【3】計算機視覺頂會ICCV2019論文集（標(biāo)星90）

持續(xù)更新收集所有ICCV2019論文集，做科研，搞算法，跟蹤最前沿論文思路，少不了這些頂會論文，附下載鏈接

https://github.com/Sophia-11/Awesome-ICCV2019

【4】再幾個目標(biāo)檢測經(jīng)典算法鏈接：

YOLO darknet版本：

https://pjreddie.com/darknet/yolo/

YOLO Keras版本：

https://github.com/qqwweee/keras-yolo3

YOLO mobilenet：

caffe Linux 和Windows 版本：

https://github.com/eric612/MobileNet-YOLO

https://github.com/eric612/Caffe-YOLOv3-Windows

Keras版本：

https://github.com/Adamdad/keras-YOLOv3-mobilenet

MXNET版本：

https://gluon-cv.mxnet.io/model_zoo/detection.html#yolo-v3

https://github.com/sufeidechabei/gluon-mobilenet-yolov3

機器學(xué)習(xí)西瓜書手推筆記（PDF可打印版本）

Table of Contents

第一章緒論

高清圖見GitHub鏈接：https://github.com/Sophia-11/Machine-Learning-Notes

第二章模型評估與選擇

計算機視覺領(lǐng)域資源匯總

Table of Contents

全球高校計算機視覺實驗室名單

計算機視覺算法資源匯總

AI頂會（2019~2020）

寫了這么多的，希望得到您的關(guān)注和點贊，如果想獲取更多，可以查看GitHub或關(guān)注公眾號【計算機視覺聯(lián)盟】！

量子位的回答

https://www.zhihu.com/question/30049772/answer/741863783

谷歌大腦Quoc Le團隊，又訓(xùn)練出了一只地表最強的模型。

那是一個目標(biāo)檢測模型，從前并不是最強大。

但自從用機器學(xué)習(xí)解鎖了特別的數(shù)據(jù)擴增策略，再用自動擴增來的新數(shù)據(jù)集訓(xùn)練目標(biāo)檢測模型，事情就完全不同了。

注意：目標(biāo)檢測和分類不一樣，分類不需要標(biāo)注邊界框，而目標(biāo)檢測需要。

△ 左邊是自動擴增數(shù)據(jù)，右邊是成績提升

模型在COCO目標(biāo)檢測任務(wù)上，拿到了50.7 mAP的最高分，刷新從前的紀(jì)錄。

谷歌的方法，并沒有改變模型本身，但有效提升了準(zhǔn)確率，+2.3 mAP以上。

團隊還強調(diào)，AI在COCO數(shù)據(jù)集里學(xué)到的擴增策略，直接遷移到其他數(shù)據(jù)集上，同樣可以提升準(zhǔn)確率。

現(xiàn)在，算法已經(jīng)開源了，AI學(xué)到的擴增策略也在里面。

是怎樣的擴增策略？

論文寫到，這里的數(shù)據(jù)擴增只涉及了一些簡單變換 (Simple Transformations) ：

有應(yīng)用在整張圖片上、但不會影響邊界框的那種變換，比如從圖像分類里借來的顏色變換 (Color Transformations)。

也有不影響整張圖片、但改變邊界框位置的那種變換，比如圖像平移 (Translating) 或剪切 (Shearing) 。

注意，這些變換只用在訓(xùn)練過程中，不會用到測試環(huán)節(jié)里。

研究人員說，當(dāng)變換的數(shù)量越來越龐大的時候，就很難手動把它們有效組合到一起了。

所以，就要用機器學(xué)習(xí)，搜索出更適合目標(biāo)檢測任務(wù)的組合策略。

思路是這樣的：

團隊把數(shù)據(jù)擴增搜索?(Data Augmentation Search) 看做一個離散的優(yōu)化問題，優(yōu)化的是模型的泛化表現(xiàn)。

在自家的另一篇論文 (arXiv:1805.09501) 基礎(chǔ)上，把重點轉(zhuǎn)移到針對目標(biāo)檢測的擴增策略上。

比起圖像分類任務(wù)的數(shù)據(jù)擴增，目標(biāo)檢測的難點在于，要保持邊界框和發(fā)生形變的圖像之間的一致性(Consistency) 。

而邊界框的標(biāo)注，也為數(shù)據(jù)擴增提供了一種新的方式：只在邊界框里面修改圖像。就像上文講的那樣。

另外，團隊還探索了在圖片發(fā)生幾何變換?(Geometric Transformations) 的情況下，怎樣去改變邊界框的位置。

具體方法是這樣的：

把擴增策略定義成一組無序的子策略?(Sub-Policy) 。

在訓(xùn)練過程中，每個子策略都會被隨機選中，應(yīng)用到當(dāng)前的圖片里去。

每個子策略里，有N個圖片變換，依次在同一張圖上進行。

要把這個搜索過程，變成一個離散的優(yōu)化問題，就要創(chuàng)建一個搜索空間。

空間里面，有5個種策略，每種子策略有2種圖像變換運算。

另外，每個運算還和兩個超參數(shù)相關(guān)聯(lián)，一個是代表應(yīng)用這個運算的可能性 (Probability) ，二是這個運算的大小 (Magnitude) 。

初步實驗之后，團隊定下了22種圖像變換運算。

學(xué)習(xí)完成的子策略，成效是這樣的：

肉眼可見，成效顯著。

一是在COCO目標(biāo)檢測中，以50.7 mAP拔得頭籌，(比策略訓(xùn)練前) 提升了2.3 mAP。

二是在PASCAL VOC目標(biāo)檢測中，提升了2.7 mAP。

也就是說，在COCO上訓(xùn)練好的策略，直接搬到其他數(shù)據(jù)集上也有效。

團隊說，這個方法尤其適合在小數(shù)據(jù)集中避免過擬合。

代碼開源了，你也去試一下吧。

論文傳送門：

https://arxiv.org/abs/1906.11172

代碼傳送門：

https://github.com/tensorflow/tpu/tree/master/models/official/detection

— 完 —

量子位

「已注銷」

https://www.zhihu.com/question/30049772/answer/127460083

非常多啊

先說說較大的框架項目：

**OpenCV **https://github.com/opencv/opencv
dlib?https://github.com/davisking/dlib
Caffe?https://github.com/BVLC/caffe
Mxnet?https://github.com/dmlc/mxnet
tensorflowhttps://github.com/search%3Futf8%3D%25E2%259C%2593%26q%3Dtensorflow

視覺這塊最主要的檢測以及追蹤

檢測：

RCNN，Fast-RCNN，Faster-RCNN 現(xiàn)在最主流的檢測框架，https://github.com/rbgirshick/py-faster-rcnn -- see https://github.com/ShaoqingRen/faster_rcnn for the official MATLAB version
SSD，達到實時的檢測算法，https://github.com/weiliu89/caffe/tree/ssd
DPM，早期的檢測算法，使用latent SVM GitHub - https://github.com/rbgirshick/voc-dpm.?

追蹤：

TLD，非常魯棒的跟蹤算法 https://github.com/zk00006/OpenTLD

孔濤

https://www.zhihu.com/question/30049772/answer/107232336

我來回答幾個，以下的幾個代碼我都實際運行過，有一部分仔細讀過。

pdollar (Piotr Dollar) https://github.com/pdollar

Piotr's Computer Vision Matlab Toolbox，里邊包含各種各樣的算法，包括特征提取、分割、分類稍等等。

DL系列

Caffe: https://github.com/BVLC/caffe: a fast open framework for deep learning.
model zoo: https://github.com/BVLC/caffe/wiki/Model-Zoo，這個里邊包含了基于caffe實現(xiàn)的各種各樣的模型。

voc-dpm

鉛筆畫的自動生成，把一副圖像變成鉛筆水粉畫，感覺很酷很酷炫有木有

匿名用戶

https://www.zhihu.com/question/30049772/answer/47066644

https://github.com/jbhuang0604/awesome-computer-vision

來自 https://github.com/bayandin/awesome-awesomeness ，各種領(lǐng)域的 Awesome。

雖然絕大多數(shù)情況下都是馬了不看

歡迎關(guān)注我的微信公眾號--算法猿的成長，或者掃描下方的二維碼，大家一起交流，學(xué)習(xí)和進步！

如果覺得不錯，在看、轉(zhuǎn)發(fā)就是對小編的一個支持！

推薦閱讀：

Github項目|幾行代碼即可實現(xiàn)人臉檢測、目標(biāo)檢測的開源計算機視覺庫
你有哪些deep learning（rnn、cnn）調(diào)參的經(jīng)驗？
國內(nèi)有哪些不錯的CV（計算機視覺）團隊
實戰(zhàn)|手把手教你訓(xùn)練一個基于Keras的多標(biāo)簽圖像分類器

總結(jié)

以上是生活随笔為你收集整理的GitHub上有哪些比较好的计算机视觉/机器视觉的项目？的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：为什么超 80% 的开源开发者苦苦挣扎在
下一篇：怎么学计算机制作ppt教程,ppt 制作