用计算机视觉可以做什么项目,程序员必看:13个GitHub开源又炫酷的计算机视觉项目...
在這篇文章中,我們列出了一些令人敬畏的計算機視覺GitHub庫,希望這些庫能激勵所有的AI開發(fā)者們像這樣去構(gòu)建自己的項目。
計算機視覺GitHub知識庫
1、使用CNN進行三維人臉重建(★–4.1k)
這個GitHub存儲庫有一個項目,其中卷積神經(jīng)網(wǎng)絡(luò)用于使用2D圖像重建3D人臉模型。這是一個全面的存儲庫,我們可以選擇使用不同的語言(如MATLAB、Python等)來使用這個模型。為了使它更有趣,我們甚至可以使用我們自己的圖像或我們自己的例子,并在這個模型上測試它們。
2、實時多人位姿估計與跟蹤系統(tǒng) ( ★–4k )
這種實時多人位姿估計跟蹤系統(tǒng)稱為AlphaPose。這個系統(tǒng)基本上是一種實時繪制個人運動的方法。除此之外,它還可以估計個人會做出的姿勢。同樣,這個存儲庫可以幫助理解關(guān)于這種系統(tǒng)如何工作的更深刻的見解。這也可以成為構(gòu)建利用這種姿態(tài)估計和跟蹤能力的軟件的起點。
3、使用深度神經(jīng)網(wǎng)絡(luò)對照片進行自動著色(★–2.3k )
另一個有趣的計算機視覺項目是使用深層神經(jīng)網(wǎng)絡(luò)對黑白照片進行著色。這個計算機視覺GitHub存儲庫在Jupyter筆記本中包含python代碼,使其易于理解。除此之外,還有豐富的圖像數(shù)據(jù)集,用于訓(xùn)練和測試為此任務(wù)構(gòu)建的模型。
4、使用生成神經(jīng)網(wǎng)絡(luò)編輯自然照片(★–1.9k)
這個存儲庫是研究論文“帶有內(nèi)省對抗網(wǎng)絡(luò)的神經(jīng)照片編輯”的代碼host。這個項目包括一個簡單的界面,我們可以使用生成神經(jīng)網(wǎng)絡(luò)編輯自然照片。當前版本與python 2.7版本兼容,與python最新版本仍有一些不一致之處。
5、用于圖像識別的卷積遞歸神經(jīng)網(wǎng)絡(luò)(★–1.7k)
這是一個非常有趣的GitHub庫,在這里你可以使用卷積遞歸神經(jīng)網(wǎng)絡(luò)構(gòu)建一個圖像識別系統(tǒng)。該項目在建筑場景文本識別和光學(xué)字符識別方面也很有用。存儲庫包含用于培訓(xùn)和測試目的的數(shù)據(jù)集,此外還有演示示例。
6、使用生成對抗網(wǎng)絡(luò)的圖像去除模糊(★–7.8k)
很多時候我們會因為模糊的圖像而煩惱,這個GitHub庫有一個解決方案。這篇題為“去模糊”的論文的PyTorch實現(xiàn)基本上采用模糊圖像作為輸入,并使用生成對抗網(wǎng)絡(luò)產(chǎn)生輸入的清晰圖像。同樣,這個存儲庫有完整的源代碼和不同種類的數(shù)據(jù)集,它們可以幫助您更好地理解和適當?shù)販y試所構(gòu)建的模型。
7、繪畫人工智能——深度強化學(xué)習(xí)模型,使用筆畫生成繪畫(★–1.7k)
繪畫AI GitHub庫包含一個基于深度強化學(xué)習(xí)的模型,該模型教機器通過使用更少的筆畫來繪制人類繪畫的圖片。由于它是基于強化學(xué)習(xí),該項目不需要數(shù)據(jù)用于培訓(xùn)目的。特工們像人類一樣自學(xué)繪畫。我強烈建議你去看看這個倉庫,并嘗試一下。
8、讀懂唇語–使用3D架構(gòu)的交叉視聽識別(★–1.4k)
唇讀是一個計算機視覺項目,旨在解決音頻和視頻流中遇到的問題。該項目使用視聽識別來映射音頻和視頻。所有這些都是使用3D卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)進行映射操作實現(xiàn)的。這個倉庫肯定有助于建立模型,打擊假視頻和其他此類不當行為。
9、快速繪圖–交互式繪圖識別工具(★–677)
Quickdraw是一個計算機視覺項目,可用于識別使用鋼筆繪制的一組對象(類似的對象)。通過個人電腦的網(wǎng)絡(luò)攝像頭識別圖形,然后模型試圖從它被訓(xùn)練識別的對象列表中預(yù)測對象。Quickdraw基本上是谷歌開發(fā)的網(wǎng)絡(luò)游戲。這個項目的另一個版本是識別在畫布上繪制的項目。
10、使用一階運動模型的圖像動畫(★–3.9k)
這是一個非常驚人的計算機視覺GitHub項目,在這里我們可以用我們自己的臉作為模擬物,從視頻或圖像中制作人臉動畫。該模型拍攝駕駛視頻,并將其運動映射到靜態(tài)圖像上,以使運動看起來真實。同樣的概念也適用于時尚數(shù)據(jù)集。
11、Fashion MNIST ( ★–7.8k)
這個GitHub存儲庫由人們穿的不同種類的衣服的圖像組成。該存儲庫有一個包含60,000個圖像的訓(xùn)練集和一個包含10,000個圖像的測試集。每個圖像都是28×28的灰度圖像。它包含使用可用數(shù)據(jù)集構(gòu)建的模型。通常,這個存儲庫也有助于通過在數(shù)據(jù)集上使用它來驗證您自己的機器學(xué)習(xí)算法。這是一個初學(xué)者友好的數(shù)據(jù)集,因此他們可以從這個存儲庫中獲得對計算機視覺項目的感受。
12、酷炫的計算機視覺項目 Cool Computer Vision Projects ( ★–37)
該庫包含許多有趣的計算機視覺項目,如人臉識別、數(shù)字識別、面部表情檢測、對象檢測、對象跟蹤等。通過這個庫,你可以了解一些非常酷的計算機視覺的東西。你可以從這些項目中獲得靈感,或者添加擴展它們的功能。這將真正有助于學(xué)習(xí)很多東西,并增加你的個人項目經(jīng)驗。
13、中級計算機視覺項目 Intermediate Level Computer Vision Projects(★–13)
這是另一個有用的GitHub庫,它有多個計算機視覺項目,如手勢識別、人臉識別、基于內(nèi)容的圖像檢索等。這些是中級水平的好項目,將有助于提高你的計算機視覺領(lǐng)域的經(jīng)驗。
結(jié)論
在這篇文章中,我們看到了許多計算機視覺項目的GitHub庫來啟發(fā)你。我們希望它能幫助你創(chuàng)建自己的計算機視覺項目,讓別人大吃一驚,并提高你的學(xué)習(xí)經(jīng)歷。
總結(jié)
以上是生活随笔為你收集整理的用计算机视觉可以做什么项目,程序员必看:13个GitHub开源又炫酷的计算机视觉项目...的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: linux 修改文件可执行,linux下
- 下一篇: 计算机视觉培训网站