日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) >

计算机视觉的发展历史

發(fā)布時(shí)間:2025/5/22 51 豆豆
生活随笔 收集整理的這篇文章主要介紹了 计算机视觉的发展历史 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

“看”是人類與生俱來(lái)的能力。剛出生的嬰兒只需要幾天的時(shí)間就能學(xué)會(huì)模仿父母的表情,人們能從復(fù)雜結(jié)構(gòu)的圖片中找到關(guān)注重點(diǎn)、在昏暗的環(huán)境下認(rèn)出熟人。隨著人工智能的發(fā)展,機(jī)器視覺(jué)技術(shù)也試圖在這項(xiàng)能力上匹敵甚至超越人類,那么你對(duì)計(jì)算機(jī)視覺(jué)的發(fā)展歷史了解么?知道它是如何應(yīng)用于圖像檢測(cè)、缺陷檢測(cè)等領(lǐng)域的么?

發(fā)展歷史過(guò)程

1966年,人工智能學(xué)家Minsky在給學(xué)生布置的作業(yè)中,要求學(xué)生通過(guò)編寫(xiě)一個(gè)程序讓計(jì)算機(jī)告訴我們它通過(guò)攝像頭看到了什么,這也被認(rèn)為是計(jì)算機(jī)視覺(jué)最早的任務(wù)描述。

七八十年代,隨著現(xiàn)代電子計(jì)算機(jī)的出現(xiàn),計(jì)算機(jī)視覺(jué)技術(shù)也初步萌芽。人們開(kāi)始嘗試讓計(jì)算機(jī)回答出它看到了什么東西,于是首先想到的是從人類看東西的方法中獲得借鑒。

借鑒之一是當(dāng)時(shí)人們普遍認(rèn)為,人類能看到并理解事物,是因?yàn)槿祟愅ㄟ^(guò)兩只眼睛可以立體地觀察事物。因此要想讓計(jì)算機(jī)理解它所看到的圖像,必須先將事物的三維結(jié)構(gòu)從二維的圖像中恢復(fù)出來(lái),這就是所謂的“三維重構(gòu)”的方法。

借鑒之二是人們認(rèn)為人之所以能識(shí)別出一個(gè)蘋(píng)果,是因?yàn)槿藗円呀?jīng)知道了蘋(píng)果的先驗(yàn)知識(shí),比如蘋(píng)果是紅色的、圓的、表面光滑的,如果給機(jī)器也建立一個(gè)這樣的知識(shí)庫(kù),讓機(jī)器將看到的圖像與庫(kù)里的儲(chǔ)備知識(shí)進(jìn)行匹配,是否可以讓機(jī)器識(shí)別乃至理解它所看到的東西呢,這是所謂的“先驗(yàn)知識(shí)庫(kù)”的方法。

這一階段的應(yīng)用主要是一些光學(xué)字符識(shí)別、工件識(shí)別、顯微/航空?qǐng)D片的識(shí)別等等,

九十年代,計(jì)算機(jī)視覺(jué)技術(shù)取得了更大的發(fā)展,也開(kāi)始廣泛應(yīng)用于工業(yè)領(lǐng)域。一方面原因是CPU、DSP等圖像處理硬件技術(shù)有了飛速進(jìn)步;另一方面是人們也開(kāi)始嘗試不同的算法,包括統(tǒng)計(jì)方法和局部特征描述符的引入。

進(jìn)入21世紀(jì),得益于互聯(lián)網(wǎng)興起和數(shù)碼相機(jī)出現(xiàn)帶來(lái)的海量數(shù)據(jù),加之機(jī)器學(xué)習(xí)方法的廣泛應(yīng)用,計(jì)算機(jī)視覺(jué)發(fā)展迅速。以往許多基于規(guī)則的處理方式,都被機(jī)器學(xué)習(xí)所替代,自動(dòng)從海量數(shù)據(jù)中總結(jié)歸納物體的特征,然后進(jìn)行識(shí)別和判斷。

這一階段涌現(xiàn)出了非常多的應(yīng)用,包括典型的相機(jī)人臉檢測(cè)、安防人臉識(shí)別、車牌識(shí)別等等。

2010年以后,借助于深度學(xué)習(xí)的力量,計(jì)算機(jī)視覺(jué)技術(shù)得到了爆發(fā)增長(zhǎng)和產(chǎn)業(yè)化。通過(guò)深度神經(jīng)網(wǎng)絡(luò),各類視覺(jué)相關(guān)任務(wù)的識(shí)別精度都得到了大幅提升。

在全球最權(quán)威的計(jì)算機(jī)視覺(jué)競(jìng)賽ILSVR(ImageNet Large Scale VisualRecognition Competition)上,千類物體識(shí)別Top-5錯(cuò)誤率在2010年和2011年時(shí)分別為28.2%和25.8%,從2012年引入深度學(xué)習(xí)之后,后續(xù)4年分別為16.4%、11.7%、6.7%、3.7%,出現(xiàn)了顯著突破。

計(jì)算機(jī)視覺(jué)技術(shù)的應(yīng)用場(chǎng)景也快速擴(kuò)展,除了在比較成熟的安防領(lǐng)域應(yīng)用外,也有應(yīng)用在金融領(lǐng)域的人臉識(shí)別身份驗(yàn)證、電商領(lǐng)域的商品拍照搜索、醫(yī)療領(lǐng)域的智能影像診斷、機(jī)器人/無(wú)人車上作為視覺(jué)輸入系統(tǒng)等,包括許多有意思的場(chǎng)景:照片自動(dòng)分類(圖像識(shí)別+分類)、圖像描述生成(圖像識(shí)別+理解)等等。

計(jì)算機(jī)視覺(jué)中的三個(gè)概念

計(jì)算機(jī)視覺(jué):指對(duì)圖像進(jìn)行數(shù)據(jù)采集后提取出圖像的特征,一般處理的圖像的數(shù)據(jù)量很大,偏軟件層

機(jī)器視覺(jué):處理的圖像一般不大,采集圖像數(shù)據(jù)后僅進(jìn)行較低數(shù)據(jù)流的計(jì)算,偏硬件層,多用于工業(yè)機(jī)器人、工業(yè)檢測(cè)等

圖像處理:對(duì)圖像數(shù)據(jù)進(jìn)行轉(zhuǎn)換變形,方式包括降噪、、傅利葉變換、小波分析等,圖像處理技術(shù)的主要內(nèi)容包括圖像壓縮,增強(qiáng)和復(fù)原,匹配、描述和識(shí)別3個(gè)部分。

計(jì)算機(jī)視覺(jué)是指利用計(jì)算機(jī)來(lái)模擬人的視覺(jué),是人工智能中的“看”。從技術(shù)流程上來(lái)說(shuō),分為目標(biāo)檢測(cè)、目標(biāo)識(shí)別、行為識(shí)別三個(gè)部分。根據(jù)識(shí)別的目標(biāo)種類可以分為圖像識(shí)別、物體識(shí)別、人臉識(shí)別、文字識(shí)別等。在智能機(jī)器人領(lǐng)域,計(jì)算機(jī)視覺(jué)可以對(duì)靜態(tài)圖片或動(dòng)態(tài)視頻中的物體進(jìn)行特征提取、識(shí)別和分析,從而為后續(xù)的動(dòng)作和行為提供關(guān)鍵的信息。

近年來(lái),基于計(jì)算機(jī)視覺(jué)的智能視頻監(jiān)控和身份識(shí)別等市場(chǎng)逐漸成熟擴(kuò)大,機(jī)器視覺(jué)的技術(shù)和應(yīng)用趨于成熟,廣泛應(yīng)用于制造、 安檢、圖像檢索、醫(yī)療影像分析、人機(jī)交互等領(lǐng)域。

總結(jié)

以上是生活随笔為你收集整理的计算机视觉的发展历史的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。