空无达摩院——机器智能技术的发展
一、圖像視覺(jué)——視覺(jué)技術(shù)概覽
圖像視覺(jué)技術(shù)如今被廣泛應(yīng)用在各個(gè)產(chǎn)業(yè),如影視行業(yè)。有很多方向值得我們學(xué)習(xí)
(一)圖像視覺(jué)基本介紹
1.圖像處理和理解
圖像處理和理解是圖像視覺(jué)里最基礎(chǔ)技術(shù),即使在視頻也需要依賴(lài)圖像做基礎(chǔ)處理。這包括圖像分類(lèi)、圖像分割、文字識(shí)別。圖像分類(lèi)針對(duì)大規(guī)模標(biāo)簽空間、識(shí)別和打標(biāo),解決數(shù)據(jù)分布不均勻及顆粒問(wèn)題。圖像分割在日常應(yīng)用廣泛,在各種平面圖像甚至不夠清晰的圖片結(jié)合現(xiàn)實(shí)中做到精準(zhǔn)分割。大量圖像中包含結(jié)構(gòu)化信息,如何把圖像里的信息轉(zhuǎn)化為文字這就需要依賴(lài)于圖像理解,OCR通過(guò)對(duì)圖片中有用的信息進(jìn)行定位、識(shí)別和結(jié)構(gòu)化提取,快速實(shí)現(xiàn)圖片到結(jié)構(gòu)化文字轉(zhuǎn)換。
2.視頻內(nèi)容分析
隨著5G的發(fā)展,視頻內(nèi)容越來(lái)越廣泛應(yīng)用,但是企業(yè)對(duì)視頻的應(yīng)用更多用在存儲(chǔ),缺乏對(duì)視頻內(nèi)容理解。在大家發(fā)布視頻,國(guó)家如何審核視頻就成為一個(gè)問(wèn)題,因此通過(guò)多模態(tài)及跨媒體理解,利用海量多模態(tài)數(shù)據(jù)(圖像/文本/視頻等)構(gòu)建新的學(xué)習(xí)模型,提升對(duì)圖像和視頻的理解,實(shí)現(xiàn)多模態(tài)交互,這對(duì)視頻審核能夠提供更大便利
3.自然人識(shí)別
利用計(jì)算機(jī)視覺(jué)技術(shù)判斷圖像或者視頻序列中是否存在特定的人。例如日常是身份證人臉識(shí)別
4.三維視覺(jué)
讓智能設(shè)備可以以快速物體的尺寸、體積等立體信息,精確生成3D模型,通過(guò)三維視覺(jué)構(gòu)建虛擬跟現(xiàn)實(shí)社會(huì)進(jìn)行交互和再次渲染,創(chuàng)造出脫離現(xiàn)實(shí)的內(nèi)容。
(二)圖像視覺(jué):圖像/視頻產(chǎn)品
1.圖像搜索:通過(guò)圖像識(shí)別和搜索功能,實(shí)現(xiàn)以圖搜圖,廣泛應(yīng)用在電商圖庫(kù),例如在淘寶通過(guò)圖片搜索產(chǎn)品。此外還運(yùn)用在商標(biāo)LOGO、通用圖庫(kù)、布料紡織等場(chǎng)景。
2.印刷文字識(shí)別:對(duì)圖像的文字進(jìn)行定位識(shí)別及結(jié)構(gòu)化理解,提供多種部署方式,支持復(fù)雜背景圖片、多類(lèi)型卡證票文檔。能夠應(yīng)用外貿(mào)行業(yè),海關(guān)大量的票據(jù)如果能夠進(jìn)行結(jié)構(gòu)化理解,將會(huì)節(jié)省更多時(shí)間,提高效率。
3.天巡:基于遙感衛(wèi)星進(jìn)行檢測(cè)和識(shí)別,如今在農(nóng)業(yè)、工業(yè)以及建筑等得到了更多更廣泛應(yīng)用。
4.AI安檢:在日常使用較高,由于安檢準(zhǔn)確率要求非常高,因此在使用過(guò)程中不能完全脫離人工,但是可以把有風(fēng)險(xiǎn)的情況下進(jìn)行核實(shí),輔助安檢人員識(shí)別,如今在杭州機(jī)場(chǎng)已經(jīng)開(kāi)始應(yīng)用
5.AI防損:應(yīng)用更多在商鋪中,基于人體姿態(tài)、商品檢測(cè)和跟蹤能力,預(yù)警高危行為防止損失,進(jìn)行用戶行為分析和提升營(yíng)銷(xiāo)轉(zhuǎn)換。
(三)圖像視覺(jué)——三維產(chǎn)品
1.足幫幫:以3D模型腳型掃描重構(gòu)為基礎(chǔ)的鞋類(lèi)行業(yè)解決方案,通過(guò)門(mén)店產(chǎn)品矩陣幫助品牌商或制造商等轉(zhuǎn)型
2.臨云鏡:利用三維重構(gòu),為用戶提供基于全景圖片的空間三模化重構(gòu),鏈接企業(yè)之間多維度的商業(yè)關(guān)系,創(chuàng)造優(yōu)秀的用戶體驗(yàn)。當(dāng)今廣泛應(yīng)用在對(duì)于展館、商城中。
3.圖像生成:對(duì)圖像目標(biāo)進(jìn)行去除、替換,生成2D-3D圖像;推進(jìn)圖像服務(wù)前沿方向,如自動(dòng)橫幅或廣告生成、根據(jù)文字描述自動(dòng)生成圖像等。
4.iHome:基于圖像/視頻捕捉,通過(guò)場(chǎng)景重建及三維模型嵌入,為家庭家居行業(yè)提供效果自然的圖像/視頻的混合現(xiàn)實(shí)展示,增強(qiáng)消費(fèi)體驗(yàn)。
二、語(yǔ)言交互:識(shí)別+交互
(一)基本介紹
1.語(yǔ)音識(shí)別ASR
基于工業(yè)級(jí)大規(guī)模機(jī)器學(xué)習(xí)訓(xùn)練平臺(tái),充分考慮語(yǔ)音、語(yǔ)音領(lǐng)域知識(shí)及復(fù)雜場(chǎng)景環(huán)境干擾、在數(shù)據(jù)、算法、架構(gòu)、應(yīng)用層面綜合構(gòu)建了整個(gè)能力,為用戶提供高質(zhì)量的語(yǔ)音識(shí)別能力。
在目前下,噪音對(duì)于語(yǔ)音識(shí)別的干擾問(wèn)題仍舊沒(méi)有被解決,依舊是各企業(yè)需要解決問(wèn)題。但并不阻礙目前的應(yīng)用,如今正確率已經(jīng)大幅度提升。
2.語(yǔ)音合成TTS
通過(guò)先進(jìn)的深度學(xué)習(xí)技術(shù),將文本轉(zhuǎn)換為自然流暢的語(yǔ)音。目前在天貓精靈方糖R語(yǔ)音定制智能音箱、釘釘推送語(yǔ)音信息已經(jīng)應(yīng)用了語(yǔ)音合成技術(shù)。目前語(yǔ)音合成已經(jīng)發(fā)展到與人說(shuō)話的語(yǔ)音沒(méi)有太大差別,甚至可以達(dá)到區(qū)分不了是人在說(shuō)話還是機(jī)器在說(shuō)話。
(二)語(yǔ)音交互——產(chǎn)品
1.交互設(shè)備類(lèi):地鐵語(yǔ)音售賣(mài)機(jī)、語(yǔ)音點(diǎn)餐機(jī)、天貓精靈智能音箱
2.語(yǔ)音服務(wù)類(lèi):客服機(jī)器人(如支付寶95188電話客服)、高德地圖、釘釘語(yǔ)音消息推送
三、自然語(yǔ)言處理:深度模型及語(yǔ)義計(jì)算
(一)基本介紹
1.深度語(yǔ)言模型
A.多語(yǔ)言神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯是自然語(yǔ)言處理中最早的突破,不同語(yǔ)言文字映射到統(tǒng)一語(yǔ)義空間,在編碼到解碼過(guò)程,生成不同目標(biāo)的語(yǔ)言文字。
B.機(jī)器閱讀理解,閱讀材料映射到語(yǔ)義空間,通過(guò)編碼,使得問(wèn)題答案吧語(yǔ)義匹配
2.語(yǔ)義計(jì)算
數(shù)據(jù)轉(zhuǎn)化為語(yǔ)義知識(shí):構(gòu)建服務(wù)阿里經(jīng)濟(jì)可共用語(yǔ)言表示學(xué)習(xí)底座,提供大規(guī)模語(yǔ)言模型訓(xùn)練和服務(wù),完成沉淀和創(chuàng)新,在經(jīng)濟(jì)體中各項(xiàng)經(jīng)濟(jì)中得到應(yīng)用,并產(chǎn)生增值。
(二)自然語(yǔ)言處理:應(yīng)用:
1.地址標(biāo)準(zhǔn)化:用海量地址語(yǔ)料庫(kù)及超強(qiáng)的NLP算法技術(shù)實(shí)力,用于沉淀高性能及高準(zhǔn)確率標(biāo)準(zhǔn)地址實(shí)現(xiàn)客戶地址數(shù)據(jù)的清洗治理、賦能業(yè)務(wù)及提供業(yè)務(wù)支持。對(duì)于阿里菜鳥(niǎo)物流來(lái)說(shuō),海量地址進(jìn)行標(biāo)準(zhǔn)化和應(yīng)用在匹配中,都是非常有用的。
2.智能客服:應(yīng)用非常廣泛,不僅應(yīng)用在銷(xiāo)售企業(yè),在政府也有所應(yīng)用。通過(guò)對(duì)長(zhǎng)篇文檔進(jìn)行機(jī)器理解,拆解為Q&A對(duì)話。
3.智能司法解決方案:以多模態(tài)AI算法和行業(yè)知識(shí)打造公檢法司行業(yè)AI產(chǎn)品,讓AI技術(shù)賦能公檢法司行業(yè)。
四、決策智能:大數(shù)據(jù)調(diào)查
(一)基本介紹
當(dāng)數(shù)據(jù)海量出現(xiàn)后,如何直接讓這些數(shù)據(jù)擁有洞察力,而不需要有人共分析,這是需要攻克的課題。通過(guò)數(shù)據(jù)表征融合,將數(shù)據(jù)以統(tǒng)一向量表示,根據(jù)智能的時(shí)序分析,從數(shù)據(jù)中尋找事件,進(jìn)行因果推斷,找到事件之間建立的聯(lián)系。
(二)決策智能:產(chǎn)品:
1.智能人員排班:智能構(gòu)建資源和需求模型,提供資源排班或調(diào)度方案,讓合適的資源在合適時(shí)間用于核實(shí)的位置,提升系統(tǒng)效率和降低成本。廣泛應(yīng)用在零售企業(yè)、客服排班等。
2.在線學(xué)習(xí)與決策
算法服務(wù)平臺(tái)起步于業(yè)務(wù)場(chǎng)景算法實(shí)踐,嘗試對(duì)場(chǎng)景需求背后的基本問(wèn)題進(jìn)行建模求解。例如為閑魚(yú)、優(yōu)酷、盒馬等業(yè)務(wù)場(chǎng)景提供首圖優(yōu)化、素材個(gè)性化、新品推薦、流量調(diào)控等服務(wù)
3.“達(dá)靈”計(jì)算資源優(yōu)化
綜合計(jì)算資源管理系統(tǒng),使用機(jī)器學(xué)習(xí)和運(yùn)籌優(yōu)化技術(shù)實(shí)現(xiàn)更優(yōu)化的計(jì)算資源
五、大數(shù)據(jù)+算力
AI不僅僅是算法,更多是要結(jié)合計(jì)算能力和數(shù)據(jù)的能夠進(jìn)行綜合的運(yùn)用,AI就是算力、算法和數(shù)據(jù)這三駕馬車(chē)的驅(qū)動(dòng)。當(dāng)今的AI發(fā)展都是這三種要素應(yīng)用場(chǎng)景的突破。
六、對(duì)于阿里來(lái)說(shuō)AI應(yīng)用方面
1.智能對(duì)話,
2.智能輔助
3.智能決策
4智能管理
七、關(guān)鍵技術(shù)
1.全自動(dòng)對(duì)話機(jī)器人:ALP在AI感知技術(shù)里是比較難的任務(wù),而對(duì)話是在ALP中最難的事情,在對(duì)話文本中除了拆解還需要理解,因此增加了很大難度。在全自動(dòng)對(duì)話機(jī)器人中,我們會(huì)拆解很多任務(wù),利用對(duì)話系統(tǒng)進(jìn)行管理上下文規(guī)劃,根據(jù)客戶意圖分成問(wèn)題和任務(wù),發(fā)布指令。雖然在這方面有很多研究,但這技術(shù)需要突破方面仍舊很多,現(xiàn)如今對(duì)每個(gè)企業(yè)來(lái)說(shuō)都是一個(gè)巨大挑戰(zhàn)。目前智能對(duì)話依舊需要依靠人工進(jìn)行處理。
2.智能輔助決策:在實(shí)際工作中,人需要做得決策是更加復(fù)雜的,不能依據(jù)機(jī)器來(lái)進(jìn)行決策,但對(duì)于簡(jiǎn)單但實(shí)際需要依賴(lài)數(shù)據(jù)復(fù)雜處理方面,如在營(yíng)銷(xiāo)中處理多份工單,可以AI進(jìn)行智能輔助決策,依據(jù)數(shù)據(jù)進(jìn)行分析,提高工作效率。同時(shí),由于每次進(jìn)行智能輔助決策,都在人工最后進(jìn)行校驗(yàn),這相當(dāng)于對(duì)模型進(jìn)行檢驗(yàn),這就有利于模型不斷得到修正,提高準(zhǔn)確率。
3.基于全局優(yōu)化的智能調(diào)度技術(shù)
在涉及很多人任務(wù)進(jìn)行網(wǎng)絡(luò)決策的時(shí)候,比如說(shuō)前面提到大規(guī)模的人員應(yīng)用到不同技能組織,而且任務(wù)比較多,如何實(shí)現(xiàn)群體最優(yōu)就需要運(yùn)用智能調(diào)度技術(shù),對(duì)任務(wù)預(yù)測(cè)到人員排班再到運(yùn)營(yíng)通過(guò)智能調(diào)度技術(shù)進(jìn)行全自動(dòng)化調(diào)控。
4.大規(guī)模對(duì)話和數(shù)據(jù)的預(yù)測(cè)平臺(tái)
通過(guò)用戶識(shí)別和ID識(shí)別,在對(duì)話前中后進(jìn)行問(wèn)題預(yù)測(cè),進(jìn)一步預(yù)測(cè)客戶現(xiàn)有問(wèn)題和難點(diǎn),從而實(shí)現(xiàn)更好的用戶體驗(yàn)。
八、案例:直播小蜜—助力直播間轉(zhuǎn)換
淘寶直播在電商直播算是領(lǐng)頭羊,如何利用AI助力直播間發(fā)展,將直播打造智能直播間是當(dāng)今需要研究的。面對(duì)幾百萬(wàn)的觀眾,主播無(wú)法跟這么多人互動(dòng),這時(shí)就需要機(jī)器來(lái)進(jìn)行互動(dòng),回答觀眾的問(wèn)題。另外,在直播間需要把視頻內(nèi)容提取出來(lái),這有利于更好地運(yùn)用于搜索、推薦。
原文鏈接:https://developer.aliyun.com/article/768336?
版權(quán)聲明:本文中所有內(nèi)容均屬于阿里云開(kāi)發(fā)者社區(qū)所有,任何媒體、網(wǎng)站或個(gè)人未經(jīng)阿里云開(kāi)發(fā)者社區(qū)協(xié)議授權(quán)不得轉(zhuǎn)載、鏈接、轉(zhuǎn)貼或以其他方式復(fù)制發(fā)布/發(fā)表。申請(qǐng)授權(quán)請(qǐng)郵件developerteam@list.alibaba-inc.com,已獲得阿里云開(kāi)發(fā)者社區(qū)協(xié)議授權(quán)的媒體、網(wǎng)站,在轉(zhuǎn)載使用時(shí)必須注明"稿件來(lái)源:阿里云開(kāi)發(fā)者社區(qū),原文作者姓名",違者本社區(qū)將依法追究責(zé)任。 如果您發(fā)現(xiàn)本社區(qū)中有涉嫌抄襲的內(nèi)容,歡迎發(fā)送郵件至:developer2020@service.aliyun.com 進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),本社區(qū)將立刻刪除涉嫌侵權(quán)內(nèi)容。 與50位技術(shù)專(zhuān)家面對(duì)面20年技術(shù)見(jiàn)證,附贈(zèng)技術(shù)全景圖總結(jié)
以上是生活随笔為你收集整理的空无达摩院——机器智能技术的发展的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 连续 3 年最受欢迎:Rust,香!
- 下一篇: 想咸鱼翻身不粘锅?加油