机器人抓取方式,值得研究。
1
智能抓取
有人跟機器人說:
“嗨,機器人,我想要吃東西。”機器人去桌上拿起一個水果。
“嗨,機器人,我想要看書。”機器人又拿來一本書。
“嗨,機器人,我想要喝水”機器人遞給我一瓶水。
看看個人服務機器人的視頻:
這是目前美國近年來正在研究的PR2個人服務機器人,它具有智能抓取的特點,能夠聽人說話,知道你的意圖,給你拿來相應的物品。
視覺與圖像技術是智能的重要組成部分。
視覺細胞的數量是人類聽覺細胞數量的三千多倍,是皮膚感覺細胞的100多倍。
人的視覺信息處理是分級的:視網膜獲得圖像,之后從低層到高層,先在V1區看到物體的邊緣特征,再到V2區看到局部和簡單形狀,再到高層整體,最后是更高層前額葉皮層(PFC),在那里做判斷和分類。
大腦的理解實物也是從低到高,越往上越抽象,大腦也如此,從戰術層面到戰略層面,從局部到整體,從單個現象的認識到多個現象的整合。
前不久,清華大學iCenter人工智能創新創業輔修專業和清華大學學生科協都在征集各專業領域的比較重要的科學問題。
我想起來我們實驗室正在開發的智能抓取研究方向,這也是目前機器人領域的重要研究方向:
機器人如何更好地抓取?
來看看機器人智能抓取實驗情況:
(清華大學碩士生梁達堯2016年開發)
這樣的抓取任務是我們期待的,機器人能夠很好地抓取不同的物體。
來看看臺灣清華大學的智能抓取實驗情況:
看來大家都在研究智能抓取問題。其實在人工智能技術近些年來興起以來,智能抓取問題就成為了一個研究的熱點。
2
人工智能
1948年,美國諾伯特·維納(Norbert Wiener)出版了《控制論——關于在動物和機器中控制和通信的科學》,標志著控制論的誕生。
1948年,美國克勞德·香農在《Bell System Technical Journal》(貝爾系統技術學報)上發表了重要論文:
“A Mathematical Theory of Communication”(通訊的數學原理),
標志著信息論的誕生。
1950年,美國《時代》雜志就刊登文章提出了機器會給人們帶來某種威脅。
“現代人已經適應了擁有超人肌肉的機器,不過擁有超人大腦的機器將更加嚇人。設計這些機器的人試圖否認他們正在創造像他們自己一樣擁有智慧的競爭者。”
——Time,?1950年1月23日
1956年在美國達特茅斯學院召開了一次會議(稱為達特茅斯會議)。會議首次提出了人工智能(Artificial Intelligence, AI)的概念,標志著人工智能誕生。
參會學者:麥卡錫(John McCarthy)、馬文·明斯基(Marvin Minsky)、羅切斯特(Nathaniel Rochester)、克勞德·香農(Claude E. Shannon)……
2006年,會議50年后,當事人重聚達特茅斯。
左起:摩爾、麥卡錫、明斯基、賽弗里奇、所羅門諾夫
幾十年來,人工智能技術經歷了多次起伏。
1957年,心理學家羅森布拉特發明Perception感知機,神經網絡模型被提出來。人工智能處于起步階段。
1969年,貝爾實驗室(Bell Lab)Willard S. Boyle和George E. Smith發明了數字圖像傳感器:電荷耦合器件(CCD)。幾十年后,圖像傳感器給人類帶來了巨大且深遠的影響。2009年他們獲得諾貝爾物理獎。
CCD上植入的微小光敏物質稱作像素(Pixel),CCD上有許多排列整齊的電容,能感應光線,并將影像轉變成數字信號。經由外部電路的控制,每個小電容能將其所帶的電荷轉給它相鄰的電容。
1970年,馬文·明斯基指出當前一段時間內將無法解決XOR異或問題,受限于計算能力,人工智能陷入第一個寒冬。
1975年柯達美國分公司申請了拜爾濾鏡發明專利(US3971065),1976年獲得授權,數碼相機走入彩色的世界。未來人人皆使用的手機拍照催生了對于海量圖像信息的挖掘和實時處理。
拜爾濾鏡(Bayer filter)
70年代,伯克利教授Jitendra Malik。Jitendra把計算機視覺這個領域從圖像處理帶進了AI。Jitendra是最早一批看到了視覺本身在智能這個問題上的重要性。
1979年hill和park提出了視覺伺服(visual servo)的概念。通過光學的裝置和非接觸的傳感器自動地接收和處理一個真實物體的圖像,通過圖像反饋的信息,來讓機器系統對機器做進一步控制或相應的自適應調整的行為。
1982年,霍普菲爾德神經網絡提出,遞歸(復發型)網絡算法出現。1986年,Rumelhar、Hinton等人提出了反向傳播BP算法,解決了兩層神經網絡所需要的復雜計算量問題,基于BP方法的神經網絡方法開始興起。
20世紀90年代,DARPA(美國國防部高級研究計劃署)人工智能計算機研究失敗。
SVM(Support Vector Machines,支持向量機)算法誕生,迅速打敗了傳統的神經網絡算法成為主流,神經網絡方法跌入低谷。SVM算法也為后來的卷積神經網絡的出現奠定了基礎。
2006年,Hinton發表了論文,首次提出了“深度學習”神經網絡。
2010年,斯坦福教授李飛飛建立了ImageNet數據庫,并發起了ImageNet圖像識別大賽。2012年,Hinton和其研究生 Alex Krizhevsky、 Illya Sutskever 開發的基于卷積神經網絡的深度學習算法用到 ImageNet圖像識別大賽上,贏得第一名,同時超過第二名10個百分點,贏得空前成功,引發全球熱潮。神經網絡使得人工智能再次興起。
2013年,深度學習再圖像識別和語音識別方面均取得歷史性的突破。霍金與埃隆·馬斯克展開AI大討論,各執一詞。霍金主張大力發展AI技術,馬斯克認為AI未來將毀滅人類,極度危險。
2018年3月27日,ACM(美國計算機協會)宣布,Yoshua Bengio、Yann LeCun、Geoffrey Hinton共同獲得2018年圖靈獎。
三位科學家被稱為“深度學習三巨頭”。
隨時芯片硬件和計算機性能的不斷提升,軟件及算法研究的不斷深入,數字化、信息化、大數據、云計算、智能制造、非工業環境的服務機器人與特種機器人市場需求的不斷高漲,美國、歐盟、日本、韓國和中國政府紛紛出臺人工智能研發計劃,大量的資金涌入人工智能技術公司,人工智能領域得到了突飛猛進的發展。
還有人工智能語音識別也方興未艾,大量具有語音識別功能的機器人成功開發出來,走進了日常生活之中。
盡管目前有人將人工智能理解為“人工”+“智能”,開玩笑說,沒有人工,就沒有智能。但是,人工智能的這一次興起,很難會像前幾次興起一樣也會跌入低谷。
這次的人工智能技術雖屬于“弱人工智能”,存在嚴重弱點(不可解釋,有后門,難以穩定可靠),已經遇到了技術更進一步發展的重大瓶頸,但是與前幾次跌落低谷的技術相比,這次有了很大的不同,能夠在相當長的時間內不斷改變幾乎所有的產業。
就像計算機、互聯網給人類的影響一般,人工智能技術的發展是一個通用的技術基礎,大量學者和相關工程師正在逐漸將深度學習、增強學習等人工智能方法應用和轉化落地在各行各業中……
據估計到2050年,世界范圍內將有50%的工作由機器和人工智能替代,而這一數字在中國將是70%。
3
抓取問題
不少學者將人工智能的突破算法放在機器人抓取問題上來研究。
期望在機器人抓取上取得突破,已有一些進展,但是還遠遠沒有徹底解決這個問題。我相信,前方一定有一個巨大的成果等著我們。
抓取是機器人的基本和重要的任務之一。
目前上海正在推行垃圾分類,其他的地區也快要開展了。垃圾分類就有無數的物體需要由機器人分揀出來,可是這些物體的種類繁多,物體的形狀、大小、位置、方位各異,需要的抓取方式也不一樣,難倒了目前水平的自動化機器,包括機器人。
如何開發出能夠輕松進行垃圾分類的機器人這是一個比較具體的設備開發領域。其中潛藏著最大的難題就是怎樣突破抓取這些物體。
抓取是需要視覺配合,還有力覺觸感,此外需要有一個機械手爪以及一個機械臂。
目前機械臂就是工業機器人,已經有了幾十年成熟的應用,大量在汽車、消費電子產品生產制造流水線上使用著。
機器視覺和圖像處理技術有了長足的進步,加之人工智能方法的進步,機器人開始能夠輕松的辨識物體的顏色、大小,能夠輕松將物體從圖像上與周圍的環境分割開來,這個技術也將逐步走進各種設備當中。
機械手爪(也稱為機器人手、機器手)是末端執行器的一種,開展著人手的作用。已經開發出來很多的種類:
1)多指仿生機器人手具有多個手指和多個關節,能夠實現跟人手相似的靈巧動作,用手套進行控制。
比如,美國Utah/MIT手、美國Robonaut手、英國Shadow手、哈工大DLR/HIT-II手、日本Gifu-III手、北航BH-III手、日本高速三指手、華盛頓仿生多指手等。
2)欠驅動機器人手具有少量電機驅動多個手指的多個關節,可以實現平行開合抓取和自適應包絡抓取等抓取模式。
比如,用于人工假肢的德國Openbionics假手、德國Bebionics手、英國iLimb手、上交大人工假手、哈工大欠驅動手、日本Double手、等。
比如,用于工業生產的加拿大Robotiq手、因時機器人手、深圳大寰自適應手等。
3)軟體手指,具有多個手指,手指為柔性,彎曲抓取各種物體具有自適應特性,而且對物體的損傷小,自身很輕便,利用流體驅動。
比如,北航SRT手、康奈爾球形手
4)在物流行業抓取紙箱常用的吸盤陣列手,具有多個吸盤,氣動驅動,能夠較好吸取表面為平面的物體以及各種局部平面的塑料袋軟包裝。
要實現抓取桌面上的一杯水,我們人是如何做到的,首先眼睛看到水杯,然后去拿去水杯,臂部多個關節同時協調運動,當手到達物體的邊上時,伸開手指,靠近水杯,再閉合手指,接觸到物體,并稍加用力,臂部多關節運動,拿回水杯,此時,手指還是保持用力的狀態。
如何讓機器來達到這個動作?
核心是反饋的機制。
首先攝像機觀察的場景中有水杯,通過圖像處理算法,將物體與周圍的環境分割開來,計算出物體的位置和姿態,將手指對于該物體的抓取方式估計出來,將手在抓取的最終位置和姿態作為目標,規劃出一個可行的末端執行路徑,分解為臂部各個關節的執行路徑,開動臂部電機協調運動,于是重復出與人的手臂執行動作類似的移動抓取等動作。
當有人將物體的位置移動了一下位置,人手也可以隨時調整目標,最終可以拿到水杯。
在過程之中,人們是如何把水杯拿到的呢?在人眼的一瞥之中,就已經電光火石之中將物體在腦海里面成了像,該像能夠迅速在腦海里提取出物體在哪里,物體是什么,物體怎么抓,抓取路徑是怎樣的……然后,人手去抓取的過程中,人其實可以稍微休息一下視覺,在大范圍移動手臂的過程中就是如此,在靠近物體的小范圍內時,局部精細的抓取動作開展之前,視覺才稍微又一瞥,接觸的手感從很多方面印證了這次抓取是否成功,物體是不是視覺觀察所了解的那個物體。
就在人手接近物體的過程中,人會有一種內在的估算,這個物體與人手的距離在縮小。
當物體被人中途挪動時,視覺就會被突然增強一下,因為有情況發生,視覺就會突然加強。于是會進行一個補充的計算,但是它會忘記(不再關心)手臂從以前的位置是怎么動作到現在這個位置的,它會思考從當下怎么到達未來——抓取物體并完成拿回物體的任務。
這個未來只跟現在開始的狀態和時間相關的現象稱為馬爾可夫現象。
馬爾可夫過程(Markov process)指這樣一種隨機過程,在已知它目前狀態(現在)條件下,它未來的演變(將來)不依賴于它以往的演變(過去)。這種已知“現在”的條件下,“將來”與“過去”無關的特性稱為馬爾可夫性。
抓取物體的過程就具有馬爾可夫性。
我們人的大腦也具有很多這樣的工作特性,比如一段時間以來的事情很清楚,但是很久以前的事情大量的都忘記了。只有反復的記憶,方能形成一種長久的記憶,長久的記憶也可能被動大量地想起,最終形成了潛意識,連自己都不知道的一種感覺。
機器執行的過程中,如果物體在手臂執行的過程中發生的變動(比如有人將物體移動了位置),手臂不能及時發現和調整,就會抓取失敗。
盡管現有的工業機器人已經能夠抓取物體,并能夠很好的適應物體可能會被移動的情形,但是上述人手與機器所進行的抓取這兩個過程,仍然存在著巨大的本質不同。
人是非常模糊的,但是卻能夠電光火石之間進行著無數的計算。人的方式并沒有精確量化地計算,但是最終卻抓取物體成功,執行得很好。錢學森在1950年代寫的《工程控制論》一書中提到,人是一個不好的系統,但是因為有了某種控制策略,可以執行得很好。比如人走路,如果沒有這個控制策略,單單靠機械裝置的運動會走到路外,走到溝里,但是因為有了傳感與控制,我們能一直保持走在馬路上而不離開馬路,也不會撞向墻壁。
機器的方式處處在量化地計算,但是最終卻依然抓取物體失敗。
有人覺得是因為人能夠認識物體。
人是如何認識物體的呢?
如果搞清楚了,機器就能夠模仿出來,于是能夠做得跟人一樣好,甚至更好。這正是科學家們夢寐以求的事情。
據說人的大腦的神經元有870億個,目前比較好的大型計算機也很難趕上,關鍵是還這么小的體積,這么小的能耗,這么高的可靠性,這樣的一種——生物的方式。
因此,有人說21世紀是腦科學的世紀,這里面有生命科學、神經科學、心理學、人工智能、軟科學、機器人、自動控制、電子學、量子學……等許多個交叉學科的工作要做。
盡管在短時間內沒有可能突破這個世界難題,但是想一想,現在相比遠古時候,更有條件解決這個問題,也是最接近解決這個難題的關鍵時代了。
-END-
﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌
免責聲明:本文轉自網絡,版權歸原作者所有,如涉及作品版權問題,請及時與我們聯系,謝謝!
往期好文合集
他說他是具有文學氣息的工科屌絲男(900字文言文,碩士論文致謝)
清華博士告訴你 “0Ω電阻”的系列應用
干貨 | 雙目攝像頭實現手勢識別,完美還原人體運動手勢。
這篇文章后,不要再問我怎么做一臺智能車了。
群體智能,多個機器人協同搬運!
??最 后??
?若覺得文章不錯,轉發分享,也是我們繼續更新的動力。
5T資源大放送!包括但不限于:C/C++,Linux,Python,Java,PHP,人工智能,PCB、FPGA、DSP、labview、單片機、等等!
在公眾號內回復「更多資源」,即可免費獲取,期待你的關注~
長按識別圖中二維碼關注
創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎總結
以上是生活随笔為你收集整理的机器人抓取方式,值得研究。的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 怎样输入磁盘扫描命令(Linux命令)
- 下一篇: 经济寒冬?毕业生找不到好工作?来看看这个