日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

浅谈机器人产品落地全过程

發(fā)布時間:2025/3/20 编程问答 19 豆豆
生活随笔 收集整理的這篇文章主要介紹了 浅谈机器人产品落地全过程 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

? ? ? ?最近這幾個月,人工智能陷入了混戰(zhàn)。大廠都在布局,或協(xié)作,或自建,或收購,各種招數(shù)應(yīng)接不暇。市場也快速被開發(fā),軟硬企業(yè)都有自己的布局Apollo、DuerOS、AliGenie、deepbrain、AIUI、DUI、Trio......Lenovo+DuerOS、Skyworth+DuerOS、 N+AIUI、 Microsoft +Element AI+Hexadite 、 Apple+Lattice Data 、 Velodyne 、NVIDIA、AMD 、INTEL GOOGLE TPU 、XILINX、Microsofl FPGA 、 Qualcomm 、Apple、ARM、IBM TrueNorth、 HiSilicon Cambricon 、Horizon Robotics ......

但是,目前落地的產(chǎn)品沒有能夠快速顛覆人們的習(xí)慣。或許正在進(jìn)化吧?(技術(shù)/成本限制了場景?)我不知道。未來不要去控制,未來是“連接” ,去中心化,單向的,自上而下的思維不適用這個時代去做產(chǎn)品了。扯遠(yuǎn)了····說機(jī)器人


[機(jī)器人] 我的理解之所以帶有一個“”字。因為是同有人的屬性,本質(zhì)是對人的意識與思維的信息過程進(jìn)行模擬。 以下同人特征:

1、輸入:

聽覺(麥克的陣列拾音得到音頻數(shù)據(jù),ADC)

語音識別:(將語音轉(zhuǎn)換為文本技術(shù))典型公司:Nuance、科大訊飛、云之聲、思必馳、捷通華聲。

語義識別:解決聽得懂,的問題)典型公司:微軟小冰、度秘、trio.ai 三角獸、 ?出門問問Mobvoi、圖靈機(jī)器人、DeepBrain出門智能360、驀然認(rèn)知等。

語料采集:(QA)典型公司:Speechocean海天瑞聲 、中科信利

視覺(攝像頭、激光雷達(dá)、紅外雷達(dá)、毫米波雷達(dá))

將三維世界到二維世界的映射。提取圖片特征,典型技術(shù)公司;SenseTime | 商湯科技、曠世科技FACE++ 、圖普科技TUPU、依圖科技、觸景無限、格林深瞳、海康、大華、思嵐等

sensor 嗅覺、觸覺等、數(shù)據(jù)采集,典型公司:freescale nxp、futaba、ON Semiconductor安森美半導(dǎo)體、歐姆龍、Sony、松下、英飛凌.....

2、存儲記憶,情感(太復(fù)雜,司馬還沒有想清楚放在哪個位置及如何描述)基于硬件CPU\GPU\NPU\TPU,云計算(CNN\RNN\GNN) 已有認(rèn)知的知識圖譜(RDF),(我同事李瑤說,假設(shè)我去吃一個宮保雞丁,這個時候我會輸入味覺,視覺,嗅覺,等,我會判斷,這個不錯,以后還要來。但是十年后,我是不會記得這些細(xì)節(jié)的,但是我會想到宮保雞丁會很好吃。流口水的表情。這是一個人類的特征。)不過12年的Google X 實驗室Jeff說:“我們在訓(xùn)練的時候從來不會告訴機(jī)器說:‘這是一只貓。’系統(tǒng)其實是自己發(fā)明或者領(lǐng)悟了“貓”的概念。” 不就的將來神經(jīng)網(wǎng)絡(luò)系統(tǒng)則是通過機(jī)器學(xué)習(xí)的方式,轉(zhuǎn)換“宮保雞丁,這個不錯以后還要來,”轉(zhuǎn)換成為,宮保雞丁很好吃,流口水的表情。當(dāng)然這只不過是設(shè)想,或許還有更好的答案。

3、行動舵機(jī)技術(shù),導(dǎo)航避障(多傳感器交叉處理)

4、思考判斷、決策輸出等(這里與第2點是緊密關(guān)聯(lián)的,主要還是算法與開源的平臺)



定 位?(產(chǎn)品的源頭,或者說一個智能硬件的源頭)

理解完筆者所認(rèn)為“機(jī)器人”,那么要做一款什么樣的產(chǎn)品呢?

需求、痛點、頻次,嗯,以目前市場來看,垂直類的場景顯得至關(guān)重要。開始一個產(chǎn)品不能做太重,否則無法聚焦核心定位。定位真的不是一個容易的決策,因為這牽扯到創(chuàng)始人對產(chǎn)品的執(zhí)著與狂熱,也有產(chǎn)品的偏執(zhí),有一個美好的愿景,也拋不開市場的了解,人性的通透,因為這不僅僅是做一個好賣的商品,而是一個改變生活的產(chǎn)品。當(dāng)然也會帶來商業(yè)價值,不談商業(yè)的產(chǎn)品都是耍流氓......

用 例:(我們一直想著突破2B市場,一直把機(jī)器人定位高端市場,假設(shè)一個酒店場景,我們會想著怎么送行李,怎么解決業(yè)務(wù)需求,NO;NO;NO;導(dǎo)航避障,激光雷達(dá)、深度視覺,建圖,這些高成本的技術(shù)目前卻沒有辦法給“高端”人群驚喜,因為這個產(chǎn)品并沒有提高效率,也不一定有驚喜。因為你們都是準(zhǔn)備賣給高端酒店的。最后服務(wù)的還是人,那么這些“高端人群”才是真正的用戶。如果一旦不能讓這些“高端用戶爽”高端酒店是不會買單的。

換個思路;我把產(chǎn)品定位在2、3星級酒店,如:7天連鎖、如家,這種快捷酒店,出一款低成本的機(jī)器人,為酒店用戶做一些服務(wù),住快捷酒店的群體是否會有驚喜呢? 這個群體是否有裝逼需求呢? 他們是否會好奇呢?(好了,可以研究一下這個群體) )


筆者還是先把行業(yè)鎖定在“AI機(jī)器人” 筆者落地教育機(jī)器人,開干吧!

1、需求

市場分析,用研,定性與定量,競品分析,二手?jǐn)?shù)據(jù)分析,頭腦風(fēng)暴,做人物與場景建模,根據(jù)用戶行為、痛點、需求,定義產(chǎn)品功能,理清業(yè)務(wù)邏輯,輸出需求文檔(如何去理解需求這事就不細(xì)說了)

需求很重要,前期的傳遞一定要清晰,要讓所有伙伴知道我們在做什么?為什么做?這么多需求,哪些做?哪些不做?為什么?是如何把用戶需求轉(zhuǎn)化為產(chǎn)品需求的?各個部門以及相關(guān)人員要統(tǒng)一傳遞,統(tǒng)一協(xié)作。以便更好的理解需求。get 到一個點,才能更好的協(xié)作,達(dá)到產(chǎn)品目標(biāo)。

2、需求評審

理想與落地之間的撕逼(溝通之前,把PRD傳遞到相關(guān)伙伴,用人話描述清楚)

什么?誰誰誰,沒看?評審時一臉懵逼? 那就看完再開。當(dāng)然產(chǎn)品經(jīng)理前期也應(yīng)該小范圍做一些溝通的。撕逼的時候請產(chǎn)品經(jīng)理自行把邏輯理清楚先。不然伙伴們發(fā)大招,暴擊9999點傷害,回不了血,自己扛著吧。

評審后,該修訂的修訂,搞定后發(fā)給所有相關(guān)伙伴。簽字畫押!哈哈哈

3、產(chǎn)品硬件規(guī)格

硬件選型:方案選型;主控用誰家? 全智?聯(lián)盛德?山景?瑞星微?MTK?intel?用幾瓦的喇叭?麥克風(fēng)?LED ?電池?。。。。。。說白了就是看第一條需求來做選型硬件。當(dāng)然,選好一個方案會決定您整個產(chǎn)品的生命周期。(一局可以玩更久)


4、硬件選型評審

理想與落地之間的撕逼 (硬件選型的大小,性能,參數(shù),與結(jié)構(gòu)設(shè)計等的,與需求都息息相關(guān)。所以ID ,結(jié)構(gòu),產(chǎn)品,硬件,會再次撕逼一次。這里產(chǎn)品就需要做好協(xié)調(diào)工作了,ID不管結(jié)構(gòu),結(jié)構(gòu)推ID的事兒長有。混戰(zhàn),可以直接放一個大招。(開玩笑,沒那么嚴(yán)重,不過確實需要良好的溝通與協(xié)作)

5、資源用誰家?哪里來?

又是需求來定義資源選型。流行音樂?兒童教育資源?視頻通話方案商,其他開放平臺等。商務(wù)談判也是產(chǎn)品控制成本的重要環(huán)節(jié)。那么行業(yè)信息,資源渠道,都至關(guān)重要。筆者之前踩了個坑,一切都談好了,配合也很不錯,這公司倒閉了。具體筆者就不多說。找靠譜的。不然全隊都game over.



6、交互設(shè)計 GUI + VUI(Voice User Interface)

信息架構(gòu)、交互流程、交互規(guī)范、原型設(shè)計、交互文檔DRD、語音交互規(guī)則

體驗層面,一定是產(chǎn)品先落地,先解決需求問題,再談體驗。但是前期做好交互設(shè)計對未來產(chǎn)品迭代會有不少幫助,能少踩很多坑。 GUI+VUI 多模態(tài)的交互,是機(jī)器人必要的趨勢。

機(jī)器人交互設(shè)計與傳統(tǒng)的交互設(shè)計有什么不同?

GUI被動,VUI主動,如此分開就比較易懂了。被動的交互是一種引導(dǎo),傳遞信息。而主動的交互不僅僅包含被動所能表現(xiàn)的,且能夠主動感知或認(rèn)知人來獲取信息,而人還是原來的行為模式。VUI的實現(xiàn)基于NLP 的技術(shù),市場需求,業(yè)務(wù)需求,產(chǎn)品形態(tài)的需求.

用例: 比如我們落地的機(jī)器人,簡單的一個人臉識別,就能做到主動語音交互。

1、主動交互,當(dāng)我在機(jī)器人端錄入了我的人臉。可以通過限定的場景,機(jī)器人識別到我的人臉的時候。進(jìn)行主動的語音交互。如:問個早上好或者主動播報今天的天氣情況。(這里就體現(xiàn)了一個非常簡單的主動交互,涵蓋了語音,表情,燈光的交互)

2、上下文也是一種交互的處理方式,用一個小冰最簡單的會話表示;

??????????????????????

3、引導(dǎo)式對話;(您可以在siri 充電情況下體驗) 嗨siri可以喚醒。

Q:我餓了

A:你想吃什么?

Q:我想吃面

A:附近離你最近的面點王評價還不錯。這是你要找的嗎?

Q:不是

A:? 第二個是 品湘樓,離你500米,營業(yè)時間xxxx 這個行么?

Q: 可以

A:好的,現(xiàn)在幫您查詢?nèi)テ废鏄堑穆肪€。

A:您是步行還是開車呢?

Q: 步行

A:好的,為您規(guī)劃步行導(dǎo)航。

以上是一些已經(jīng)落地的產(chǎn)品,但是筆者認(rèn)為,人還是對另外一個“人”正常說話表達(dá),機(jī)器人要通過算法來理解人表達(dá)的信息,而不是引導(dǎo)人應(yīng)該如何說話。 比如動作,人還是用它習(xí)慣的動作來表達(dá),而機(jī)器人要能識別和認(rèn)知人表達(dá)的意圖。而不是機(jī)器人來引導(dǎo)人如何反饋。引導(dǎo)式的體驗相對要差很多。目前只能在界面,輸出的語音,以及少量的分析數(shù)據(jù)來判斷。在未來,機(jī)器人表達(dá)的方式是人類能接受和閱讀的。表達(dá)可以是非人的,一條狗不會說人話,但是人類也能讀懂它是否友好,是否能聽我的。它有它完整的表達(dá)邏輯。相信機(jī)器人也能成為人類的一份子。不僅僅是工具,而是生活中的一員。

說白了,與機(jī)器人交互,終極目標(biāo),同人一樣交互。(超級大boss一般最后一關(guān))



參考我的另一篇《淺說語音用戶界面VUI+GUI設(shè)計》

7、視覺UI

視覺稿/一致性規(guī)范、切圖標(biāo)注/界面標(biāo)注

這一塊是比較成熟的了。但是,但是,請根據(jù)需求與產(chǎn)品目標(biāo)來。不然看我青龍偃月刀, 暴擊10000+傷害......

8、軟件系統(tǒng)設(shè)計與架構(gòu)(落地)

開發(fā)(這其中還有N次調(diào)整需求與撕逼過程,省略1萬字)

說個大坑,大部分機(jī)器人是基于RTOS 、Linux、Android開發(fā)的OS ,前期的軟件架構(gòu)至關(guān)重要。后期迭代,或是OS 運用在其它智能設(shè)備。都是至關(guān)重要的。所以一個優(yōu)秀的架構(gòu)師,會讓程序猿寶寶們工作更有效率,成果更自豪。

總結(jié)

以上是生活随笔為你收集整理的浅谈机器人产品落地全过程的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。