OpenAI“单手解魔方”被公开质疑,Gary Marcus称七大问题涉嫌误导
全世界只有3.14 %?的人關(guān)注了
青少年數(shù)學(xué)之旅
近日,“OpenAI的機(jī)器手在4分鐘內(nèi)單手成功還原魔方”引起刷屏,然而,這一成就被著名機(jī)器學(xué)習(xí)懷疑論者馬庫(kù)斯質(zhì)疑了,馬庫(kù)斯逐條列舉OpenAI的誤導(dǎo)性說(shuō)法,機(jī)器學(xué)習(xí)圈卻都撐OpenAI。你支持哪方?歡迎來(lái)與大咖一起討論~
?
這幾天,人工智能領(lǐng)域最令人興奮的進(jìn)展莫過(guò)于?“OpenAI 的機(jī)器手學(xué)會(huì)了單手解魔方”。
OpenAI 在 10?月 15 日發(fā)布這一成果,立即引起大量討論。轉(zhuǎn)魔方的視頻被瘋狂刷屏,僅 YouTube 的視頻就有 20?萬(wàn)觀看,網(wǎng)友紛紛表示:人工智能機(jī)器人的一個(gè)新里程碑誕生了!這是機(jī)器人在機(jī)體靈活性以及機(jī)器學(xué)習(xí)軟件方面的飛躍!
機(jī)器手還原一個(gè)三階魔方全程只花了4分鐘
即使兩根手指被綁住了也沒(méi)問(wèn)題
OpenAI 使用強(qiáng)化學(xué)習(xí)和 Kociemba 算法訓(xùn)練神經(jīng)網(wǎng)絡(luò)來(lái)模擬解決魔方問(wèn)題。
研究人員專注于一個(gè)機(jī)器目前難以掌握的問(wèn)題:感知和靈巧的操作。他們訓(xùn)練神經(jīng)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)由法生成的還原所需的旋轉(zhuǎn)和翻轉(zhuǎn),并開(kāi)發(fā)了一種稱為自動(dòng)域隨機(jī)化的新方法,該算法能夠無(wú)休止地在仿真中生成越來(lái)越困難的環(huán)境,從而讓神經(jīng)網(wǎng)絡(luò)在模擬環(huán)境中學(xué)習(xí)解魔方,再遷移應(yīng)用到現(xiàn)實(shí)世界。
“用機(jī)器手解決魔方”?的背后有許多人手
OpenAI 訓(xùn)練類人機(jī)器手來(lái)解魔方的嘗試,早在 2017 年 5 月就開(kāi)始了。之所以對(duì)解魔方情有獨(dú)鐘,是因?yàn)檠芯咳藛T認(rèn)為,如果能成功訓(xùn)練這樣一只機(jī)器手來(lái)完成復(fù)雜的操作任務(wù),就能為通用型機(jī)器人奠定基礎(chǔ)。
OpenAI 同時(shí)公開(kāi)了一個(gè)機(jī)器手解魔方的完整視頻,視頻未經(jīng)任何剪輯,可以看到,機(jī)器手靈活地操作魔方,在約 4 分鐘的時(shí)間里成功還原了一個(gè)三階魔方。
機(jī)器手還原魔方的完整過(guò)程,視頻未經(jīng)任何編輯
然而,這一成果遭到了紐約大學(xué)心理學(xué)與認(rèn)知科學(xué)教授、暢銷書作家加里?·?馬庫(kù)斯?(Gary Marcus)?的質(zhì)疑?——OpenAI 聲稱?“解決”?了魔方,真的是這樣嗎?馬庫(kù)斯認(rèn)為 OpenAI 還原魔方的博客內(nèi)容存在誤導(dǎo)性,他說(shuō):
鑒于 OpenAI 仍然沒(méi)有更改關(guān)于?“解決魔方”?的誤導(dǎo)性博客帖子?(博客標(biāo)題是?“Solving Rubik’s Cube with a Robot Hand),所以我附上了詳細(xì)的分析,將他們的說(shuō)法和暗示與實(shí)際所做的進(jìn)行了比較。依我之見(jiàn),這些誤導(dǎo)性對(duì)大多數(shù)對(duì)非專業(yè)人士來(lái)說(shuō)并不明顯。
馬庫(kù)斯對(duì) OpenAI“解決魔方”?的 7 條質(zhì)疑如下:
1、這不是神經(jīng)網(wǎng)絡(luò)解決的;而是有 17 年歷史的符號(hào)算法做到的。
2、這種算法是先天的,而不是學(xué)習(xí)的。
3、強(qiáng)化學(xué)習(xí)在選擇轉(zhuǎn)向哪個(gè)方向?(即大多數(shù)人所說(shuō)的解決了魔方)?時(shí)不起作用。
4、所學(xué)到的是物體操縱,而不是解魔方。
5、只有一個(gè)物體被操縱,并且沒(méi)有測(cè)試對(duì)其他對(duì)象的可推廣性。
6、該物體裝配了大量?jī)x器?(如藍(lán)牙傳感器),機(jī)器手也安裝了 LED。
7、成功率只有 20%;魔方經(jīng)常從機(jī)器人手中掉落。
他說(shuō):“我強(qiáng)調(diào)一下,這個(gè)成果本身給人留下了深刻的印象,但描述有誤導(dǎo),更恰當(dāng)?shù)臉?biāo)題應(yīng)該是’用強(qiáng)化學(xué)習(xí)操縱魔方’或‘靈巧的機(jī)器人手操縱物體的進(jìn)展”?或類似的句子。”
OpenAI 聯(lián)合創(chuàng)始人、機(jī)器人團(tuán)隊(duì)負(fù)責(zé)人 Woj Zaremba 注意到馬庫(kù)斯的帖子,反駁道:
1. 你的前三個(gè)論點(diǎn)是一樣的。
2. 泛化是從模擬到現(xiàn)實(shí),而不是從一個(gè)物體到另一個(gè)物體。
3. 我們沒(méi)有裝配儀器得到的結(jié)果稍微弱一些。
4. 你確信我們不會(huì)將性能提升到 100%?嗎?
馬庫(kù)斯回應(yīng)道:
1. 我的前兩個(gè)論點(diǎn)完全不同:先天性≠象征性。這些是不同的。第三個(gè)論點(diǎn)有一點(diǎn)重疊,但并不明顯。
2.?我當(dāng)然知道,但是為了穩(wěn)健性,你需要推廣到新物體上
3&4:我期待看到其他結(jié)果;我相信你們最終會(huì)做得更好。
盡管是馬庫(kù)斯率先提出質(zhì)疑,但不少人的回復(fù)并不贊同馬庫(kù)斯的說(shuō)法,有人回復(fù)道:
“這是一個(gè)有缺陷的批評(píng),基于對(duì)魔方的誤解。魔方不是像圍棋那樣是一種可以學(xué)習(xí)的任務(wù),而是需要記憶解法和熟練操作的任務(wù);人類玩魔方也遵循一種算法。”
馬庫(kù)斯仍表示:總的來(lái)說(shuō),他們?(OpenAI)?沒(méi)有對(duì)我的觀點(diǎn)做出回應(yīng),我的觀點(diǎn)是那篇博客的框架與論文的內(nèi)容不相符合,雖然我同意這個(gè)工作很重要,但炒作是有誤導(dǎo)性的。
網(wǎng)友評(píng)論各執(zhí)一詞,馬庫(kù)斯是一針見(jiàn)血,還是吹毛求疵?
馬庫(kù)斯在 Twitter 上也承認(rèn)這個(gè)研究是個(gè)不錯(cuò)的研究,但博客文章中的一些說(shuō)法用詞不當(dāng),和實(shí)際不符,具有誤導(dǎo)性。
我的主要觀點(diǎn)是,現(xiàn)在被熱議的 OpenAI 的博客文章具有誤導(dǎo)性;在技術(shù)論文中精挑細(xì)選出的東西并不能解決問(wèn)題。我在推特上也詳細(xì)講了,文章本身的標(biāo)題以及開(kāi)頭的框架都具有誤導(dǎo)性。因此,文章本身有其自身的問(wèn)題。?
OpenAI 博客中的結(jié)尾表示:“強(qiáng)化學(xué)習(xí)不僅可以作為虛擬任務(wù)的工具,而且可以解決需要前所未有的靈活性的真實(shí)世界中的問(wèn)題。” 而馬庫(kù)斯認(rèn)為,如果沒(méi)有更強(qiáng)的泛化測(cè)試,就無(wú)法提出進(jìn)一步的主張。5 個(gè)略有不同的 cube 實(shí)驗(yàn),也不能讓這個(gè)機(jī)械手學(xué)會(huì)擰緊螺絲,開(kāi)鎖或給襯衫系上扣子。
所以,這些問(wèn)題的解決實(shí)際上無(wú)從談起。
?
Twitter 上有人對(duì)馬庫(kù)斯表示支持,認(rèn)為 OpenAI 的博客中的說(shuō)法和實(shí)際確實(shí)存在實(shí)際差異。這種夸大其詞可能導(dǎo)致大眾對(duì)技術(shù)的盲目信任,進(jìn)而造成消極后果,比如特斯拉的撞車事故。
?
馬庫(kù)斯自己還發(fā)了個(gè)投票:
?
不過(guò)從 600 多人的投票結(jié)果看,支持“解決魔方”應(yīng)包括認(rèn)知和操縱兩方面的占大多數(shù)。
?
在 Twitter 上不斷 “放炮” 的同時(shí),這場(chǎng)辯論的戰(zhàn)火不了避免地轉(zhuǎn)到了其他平臺(tái),比如 Reddit。
有網(wǎng)友搬運(yùn)了馬庫(kù)斯在 Twitter 上發(fā)出的對(duì) OpenAI 博客文章的 7 點(diǎn)詳細(xì)意見(jiàn),并配了貼圖。但從網(wǎng)友討論來(lái)看,支持馬庫(kù)斯的不多。更多的人認(rèn)為他這是過(guò)于苛刻,咬文嚼字,沒(méi)事找事。
?
比如下邊這位就說(shuō),他覺(jué)得馬庫(kù)斯寫的這 7 點(diǎn)摘要比 OpenAI 博客文章更具誤導(dǎo)性。
?
關(guān)注點(diǎn) 1-4:“神經(jīng)網(wǎng)絡(luò)沒(méi)有解決問(wèn)題;解決問(wèn)題的是具有 17 年歷史的符號(hào) AI 算法。”
博客:“我們使用強(qiáng)化學(xué)習(xí)和 Kociemba 的算法來(lái)選擇求解步驟,訓(xùn)練神經(jīng)網(wǎng)絡(luò)來(lái)解決仿真中的魔方。”
?
關(guān)注點(diǎn) 5:“只有一個(gè)對(duì)象被操縱,沒(méi)有對(duì)其他對(duì)象的可推廣性測(cè)試”
博客:測(cè)試使用了五種不同的原型,一個(gè)鎖緊的模仿,一個(gè)面部立方體,一個(gè)完整的立方體,一個(gè)吉克魔方和一個(gè) “常規(guī)” 魔方。這篇文章從來(lái)沒(méi)有聲稱要解決魔方的問(wèn)題。
?
關(guān)注點(diǎn) 6:“該物體已被植入大量設(shè)備(比如帶有藍(lán)牙功能傳感器)。玩魔方的手上也裝有 LED。”
博客:五個(gè)不同的原型中置入了不同級(jí)別的儀器。?“常規(guī)” 魔方?jīng)]有置入任何設(shè)備,只是從中心正方形上切除小角,以消除對(duì)稱性。
?
關(guān)注點(diǎn) 7:“成功率只有 20%;魔方經(jīng)常掉落。”
博客:“盡管如此,我們的機(jī)器人仍未完善其技術(shù),因?yàn)橹挥?60%的成功幾率(而最困難的情況下只有 20%的成功幾率)。”
?
而且下文專門開(kāi)了一段來(lái)說(shuō)這個(gè)問(wèn)題。
?
還有人認(rèn)為,馬庫(kù)斯實(shí)在是過(guò)于挑剔了,過(guò)于糾結(jié)于實(shí)際上并不重要的問(wèn)題。
?
我承認(rèn)馬庫(kù)斯是一個(gè)能言善辯的人。但我覺(jué)得他過(guò)于迂腐,以至于無(wú)視于眼前的實(shí)際問(wèn)題,大多數(shù)外行人都有能力閱讀文章的背后之意,查看研究或博客文章的內(nèi)容。
?
你可以去追求學(xué)術(shù)上的精確,但是那些真正關(guān)心這些東西的人很可能會(huì)陷入困境。我們都對(duì)他列出的幾條問(wèn)題有所了解,但至少其中大多數(shù)。在這種情況下幾乎是無(wú)關(guān)緊要的,甚至像 “泛化性”?之類的重要論點(diǎn),在機(jī)器人的高靈敏度這一主要問(wèn)題面前,也顯得不那么重要了。
?
我明白,不同的人會(huì)以不同的嚴(yán)謹(jǐn)程度來(lái)對(duì)待這個(gè)問(wèn)題,并且我也理解馬庫(kù)斯的擔(dān)憂,但我認(rèn)為,對(duì)于 OpenAI 的公開(kāi)批評(píng)過(guò)于挑剔,這些問(wèn)題本身對(duì)這次討論并不重要。?
馬庫(kù)斯是誰(shuí)?深度學(xué)習(xí)懷疑論者
Gary Marcus
加里?·?馬庫(kù)斯?(Gary Marcus)?是一位科學(xué)家、暢銷書作家和企業(yè)家。他是 Robust.AI 公司的創(chuàng)始人和首席執(zhí)行官,Geometric Intelligence 公司?(2016 年被優(yōu)步收購(gòu))?的創(chuàng)始人兼首席執(zhí)行官,出版著作包括《代數(shù)思維》、《怪誕腦科學(xué)?(Kluge)》、《思維的誕生》等,最新著作是與 Ernest Davis 合著的《Rebooting AI :?構(gòu)建我們可以信任的人工智能》。
馬庫(kù)斯也是著名的深度學(xué)習(xí)懷疑論者。作為認(rèn)知心理學(xué)家,他一直高調(diào)參與人工智能辯論,與 Yann LeCun、AAAI 前主席 Thomas Dietterich 等 AI 大牛都展開(kāi)過(guò)激烈辯論。
他曾撰文批判深度學(xué)習(xí)?(Marcus, 2018),?稱深度學(xué)習(xí)實(shí)際上并沒(méi)解決什么問(wèn)題。這篇文章引起了人工智能圈極大的反響,幾天之內(nèi),成千上萬(wàn)的人在推特上發(fā)表了自己對(duì)這個(gè)問(wèn)題的看法,有些人熱情支持馬庫(kù)斯的論點(diǎn)(例如,“這是我多年來(lái)讀到的有關(guān)深度學(xué)習(xí)和 AI 的最好的觀點(diǎn)),有些相反(例如,“有思考...... 但大部分都是錯(cuò)誤的”)。
在那篇批判深度學(xué)習(xí)的文章中,馬庫(kù)斯概括了深度學(xué)習(xí)的十大挑戰(zhàn),直言深度學(xué)習(xí)本身雖然有用,但它不可能實(shí)現(xiàn)通用人工智能。他建議把深度學(xué)習(xí)視為?“一種非普遍的解決方法,而只是一種工具。”
他說(shuō):“相比純粹的深度學(xué)習(xí),我呼吁混合模型,不僅包括深度學(xué)習(xí)的監(jiān)督形式,還包括其他技術(shù),例如符號(hào)處理(symbol-manipulation),以及無(wú)監(jiān)督學(xué)習(xí)(它本身也可能被重新概念化)。我也敦促社區(qū)考慮將更多的內(nèi)在結(jié)構(gòu)納入 AI 系統(tǒng)。”
轉(zhuǎn)載來(lái)源:新智元參考來(lái)源:https://www.reddit.com/r/MachineLearning/comments/dkd4vz/d_gary_marcus_tweet_on_openai_still_has_not部分素材源于網(wǎng)絡(luò),版權(quán)歸原作者所有如有侵權(quán)請(qǐng)留言聯(lián)系刪除,感謝合作
寫在最后
微信公眾號(hào)“少年數(shù)學(xué)家”提供豐富的數(shù)學(xué)課外知識(shí)數(shù)學(xué)人物、數(shù)學(xué)趣談、科技與數(shù)學(xué)想讓孩子懂得更多有趣的數(shù)學(xué)記得關(guān)注“少年數(shù)學(xué)家”總結(jié)
以上是生活随笔為你收集整理的OpenAI“单手解魔方”被公开质疑,Gary Marcus称七大问题涉嫌误导的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 双十一变身大型奥数竞赛现场?数学不好的你
- 下一篇: 来自女朋友的灵魂拷问!| 今日最佳