日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

一眼看清高科技,深度解析人工智能技术脉络

發布時間:2024/3/13 编程问答 49 豆豆
生活随笔 收集整理的這篇文章主要介紹了 一眼看清高科技,深度解析人工智能技术脉络 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

現在有非常多的大公司在做人工智能方面的研究,包括Google、IBM、Facebook、Apple、百度等,也有數不盡的小型創業團隊進入,使得人工智能方面變得熱鬧非凡。每一家公司都有自己的研究思路,也取得了不同程度的進展,比如百度李彥宏就透露,百度大腦已經相當于2~3歲小孩的智力水平,而按照我們對自己人工智能系統的模擬測試結果,可以達到12歲中學生的智力水平,大幅度領先百度深度學習研究院。下邊在不泄露技術機密的前提下,簡要分享我們人工智能系統的設計思路與背后基于的原理。

?

1、文字與編程語言(視頻、圖片、文字與程序的結構化分析)

1)文字的發明與價值

在介紹人工智能之前,我們首先來簡單認識一下“文字”。在人類看來,文字是人類約定創造的視覺形式,可以說文字是一個視覺系統,它以最簡單方式將視覺場景圖案再現,并且富有便于口語聲音表達的特點,因而更加清晰,可以反復閱讀,可以突破時間和空間的限制。

更準確的說,文字使人類突破口語受到時間和空間的限制,把時空的影像變化轉碼成視覺可見的符號系統,并通過書面語的方式傳承下來,使后人能通過間接的文字想象出畫面,了解歷史和學習技術經驗,從而提高自己的智慧,發展科學技術,并最終促使人類能進入有歷史記錄的文明社會。

2)編程語言與文字的區別

在了解完文字后,我們再來簡單的看一下自然語言(文字)與計算機編程語言之間的區別。顯然,自然語言是更高級的編程語言,其每一個字都有特定的含義,在現實世界中映射非常龐大視覺影像,并且具備較高容錯率的特點,而現有的計算機編程語言是簡單的命令序列與邏輯組合,本質上說,這兩者之間差別巨大。

由于在計算機語言的內在邏輯無法映射到現實事物,于是在計算機看來,文字是人類用來記錄語言的符號系統,僅僅是符號,沒有任何意義。于是,當計算機識別到“樹”這個字時,它沒有任何“樹”真實樣子、信息的概念與數據,也就無法理解“樹”這個字的真正含義。

其實,這也說明計算機和現實的接口沒有打通,所以,人工智能的關鍵環節即為幫助計算機將符號與真實視覺影響之間建立聯系,即補全每一個詞語背后的真實對象數據,填補計算機文字符號與現實影像數據之間的鴻溝。

現在技術突破方向是通過建立知識圖譜與事物組合圖譜,試圖將現實世界的景象與知識組織起來。當然,這僅僅是第一步,只有將其與自然語言解析、視覺解析結合到一起時,再結合大數據統計,才能實現真正的突破。

?

2、人工智能發展限制因素的誤解

雖然基于現有計算機發展人工智能技術仍舊面臨或多或少的限制,但將其歸結于計算性能、編程方式等原因,顯然是不正確的,因為這些都可以基于現有技術來解決,下邊依次簡要說明。

1)計算機計算性能限制的誤解

許多人認為,雖然現在處于科技發達的互聯網時代,但現有計算機的計算能力非常有限,如果要完成自然語言解析這種高海量計算的工程,或許只能依靠超級計算機、量子計算機、光子計算機、生物工程計算機等更先進的技術解決。其實這種想法是不對的,因為自己不能找到解決人工智能的解決方案,而將其歸咎于現有硬件性能低下,是一種錯誤的邏輯。雖然計算能力的提升有助于更簡單的解決人工智能問題,但計算能力并非限制人工智能發展的核心問題,而且計算能力可以靠大規模服務器集群有效解決。

2)現有編程方式與計算體制的誤解

許多人認為,現有的計算機語言僅僅是簡單的命令序列與邏輯集合,而自然語言解析所需要的編程方式注重的是視覺、聽覺、嗅覺、觸覺、味覺等為一體的編程體制,因此其并不適合解決自然語言與人工智能方面的問題,這也就意味著如果想高效的實現人工智能技術,最好開發出全新的編程模式,開發一款全新的計算機架構。

是的,我承認如果能夠開發出更加優秀的編程體制,能夠將整個系統的計算量降低超過50%,大幅度降低硬件、人力等技術設施的投入,從而使得整個過程的運算更加高效,響應速度提高一倍,但這并不意味著現有的編程體制解決不了所面臨的問題。

雖然IBM公司已經發布了基于人腦特征的全新計算架構,號稱基于此的新生態系統將為市場帶來高參數化的神經模型,能形成類人腦計算的基礎信息處理單位,以及具備對空間、時間和多模態化環境的識記、感知,或者是做出行動的能力,從而讓下一代應用在感知、行為和認知方面的效率堪比人腦,但這種計算架構仍不成熟,在現實使用過程中,仍面臨非常多的技術問題。

?

3、深度學習與知識單元

1)深度學習

深度學習的原理是通過多層次的學習而得到對于原始數據的不同抽象層度的表示,進而提高分類和預測等任務的準確性。即針對某一個“事物”,對于其圖像(或物體、聲音、嗅覺、觸覺、味覺)進行參量分解與組合,然后通過大量同類事物來重復操作,從而驗證每種參量(或參量組合)重要性(或層次性),最終獲得一組識別該事物識別數據包的一種機制。

深度學習整個訓練過程非常簡單,以機器學會在圖片上識別狗為例,我們不需要人為事先給出狗的特征定義,只需要提供足夠的相關圖片,用以劃上一個大致的識別邊界,然后機器將所看到的圖像或圖片分解成10億多個不同的參量,對這些參量的層次、權重進行概率統計,并將這些參量按照其可能性進行各種“組合”,并對這些組合的層次、權重進行概率統計,并最終形成識別數據包。

舉個簡單例子,機器反復學習桃花的特征后,就會自己找到判定一朵桃花的方法,它會將這類有顏色、有花瓣、有花蕊的物體自動和花這個單詞聯系到一起,并最終形成一個特定的識別數據包,再依據這種“識別包的數據”,就可以從千萬張圖片或視頻中識別出桃花來。

深度學習最大的特點是分層級,即在進行事物識別時,由于事物的不同特征的重要性、空間位置、時間順序等是不同的,需要對事物特征建立層級來深度認知事物,背后的理論在于,你應當有一種模式來反映想要學習的自然現象的層級。

借助這種分層級的特征識別提取機制,機器能夠像人的大腦一樣可以從多角度識別搜索目標,甚至可識別多樣且被扭曲的圖像,即當圖像發生傾斜、倒置、扭曲時,仍然具有一定的識別效果。

深度學習最終得到的是一個針對某一事物的數據識別包。當然,這個數據識別包也存在局限,就比如衣服這類物體很容易發生形變,機器通過學習雖然能夠學習判斷長袖短袖等衣服類型,然而形變過大必然降低識別概率,但即便是識別率較低的數據包,仍然具有價值。

2)三維建模

深度學習是一向基于信息提取的技術,但產生人工智能需要的基礎“數據識別”,仍需要搭配另一套技術體系,即三維建模相關技術,這是因為現實世界中的事物大多是三維的,因此在“數據識別包”提取的過程中,需要基于三維真實的事物。

最終,數據識別包要符合以下要求:

①?能夠滿足事物在不同空間位置、視角、動作的識別機制,即具備在不同情況下識別概率的描述。

②?針對同一事物,在特定的視角之下,要具備柔性識別的數據,比如可以提供99%、98%、97%……30%……1%等一系列識別概率的數據。

③?事物的意境展現,即當出現“蘋果”詞語時,能夠迅速給出“蘋果”的各種普通立體圖,并支持各種簡單操作。(畫面展現)

由蘋果詞語映射出來的各種結果

?

3)知識單元

然而,深度學習與三維建模等技術僅僅是針對某一元素進行深入分析的工具,能夠針對某一事物分層次的提取其特征庫,并能夠基于此識別其它景象是否存在這一事物,這僅僅屬于“知識單元”模型中的一個必要部分。

因此,我們需要將深度學習技術輸出的結果構建模型以使符合我們“知識單元”的范式要求,只有這樣,我們才能正確的使用這些數據,從而實現后續“知識圖譜”、“事物組合圖譜”、“視覺解析引擎”、“語境解析引擎”等的構建。

知識單元是我們搭建的一個基于事物自身相關屬性的知識組合,為了便于以后在知識單元基礎上進行更深入的數據分析操作,知識單元所應具備以下基礎功能:

① 物體“二維”、“三維”識別功能;

② 將文字符號與畫面建立連接的展現功能;

③ 物體多種名稱及“名稱與屬性”的對應關系;

如果更詳細的話,知識單元在構建時需要包含以下幾個特點:

1、視覺識別方面,需要分層次化的特征識別體系。

在數據識別包方面,要形成一種分層次的識別數據包,不僅要識別出整個事物,也要提供識別事物某一部分的識別數據包,比如:識別一朵桃花,既要提供整個花朵的數據識別包,也要提供針對花瓣的數據識別包。

2、知識單元屬性方面,事物的屬性要做的盡可能全面,分類要盡可能的精細化,這是后期在知識單元之間建立聯系的基礎。

3、知識單元的概念名稱、屬性表述可能有多種,需要詳細的羅列出來,而且概念、屬性要與所對應的視覺特性識別數據包形成一一對應關系,這是后期自然語言理解的基礎。

4、識別數據包要具備還原功能,也即當出現“桃花”這個詞時,能夠提供桃花的標準圖(普通圖)。

5、知識單元中的相關識別數據包最好是基于三維真實事物的特征采樣,這樣的數據更加真實、自然,也更加有效。

6、知識單元中的元素包括:視覺識別數據包、聲音識別包、嗅覺識別包、觸覺識別包、味覺識別包,以及事物的各種概念、屬性、行為等文字特征信息。

7、基于統計學進行優化。當我們搭建完知識單元的初級模型后,仍舊需要根據大規模數據統計的方法來逐步改善、優化知識單元的設計模型,因此,在要建立數據自動修改優化機制。

8、識別數據包是一個空間范圍內的識別結果,也即無論物體發生了變形、扭曲、拉伸、視角變換等一系列處理,仍能識別出來,雖然識別成功率不同,但這些具備一定識別率的數據仍舊具備一定的價值。

9、知識單元必須帶有空間、時間、物體、聲音、觸覺、組合等一系列信息,也即這個單元是否具有空間屬性?是否具有隨時間變化的屬性?是否是一個物體?是否具有聲音屬性?是否具有觸覺屬性?是否是一系列物體的組合?……

……

知識單元也即為知識圖譜的基元,后續視覺分析、自然語言分析、計算引擎等進行計算時直接在此調取數據,因此其設計模型至關重要,這直接決定著整個人工智能工程的成敗。

?

4、知識圖譜

1)知識圖譜的價值與意義

將眾多知識單元組合在一起,并挖掘不同知識單元之間的關聯屬性,以此為基礎使知識單元之間建立深入而廣泛的關聯,最終形成一張龐大的、具有廣泛聯系的知識單元關系網,這張網就是知識圖譜。

比如說一個明星(是一個知識單元)可以通過深度學習技術得到她的視覺特征庫(識別數據包),并基于此搜尋她所有演過的電影和唱過的歌(每一部電影、每一首歌曲都是一個知識單元),并在彼此之間建立關聯,最終通過這種模式逐漸將知識單元關聯起來。

2)知識單元分組歸類

知識單元聚合成知識圖譜的過程并非是簡單的加法過程,而是一個2的N次方的相乘過程,這個過程中能找到許多歸類的同類項,從而使它們之間建立較為廣泛的簡單聯系。

舉個簡單的例子,菊花、油菜花、桃花、荷花、迎春花、葵花、石榴花、梅花、槐花、玫瑰這十種花,如果按照顏色的角度來看,通過尋找同類項,其中,顏色偏向黃色的花為迎春花、桃花、油菜花、梅花、菊花、葵花等,顏色偏向紅色的有荷花、石榴花、玫瑰花。如果按照開花的季節來看,春季開花的有迎春花、油菜花、桃花、槐花,夏季開花的有荷花、葵花、石榴花、玫瑰,秋天開花的有菊花,冬天開花的有梅花。以類似的方法,可以在彼此之間建立非常多的關聯。

3)量化世界

知識圖譜可以說是在“量化世界”,讓以前模糊的世界變得更加清晰,這也是人類文明進步的關鍵一步,曾經人類發明了語言文字,用戶符號代表世界上各種事物,進而加以認識與區分,知識圖譜是在這個基礎上的巨大創新,從而達到量化世界的效果,讓整個世界都進入數據化時代。

另外,知識圖譜是視覺解析引擎與自然語言解析引擎的基礎,只有將知識圖譜做好,才能在此基礎上發展事物組合圖、視覺解析引擎和自然語言解析引擎,因此,知識圖譜是人工智能的基礎環節。

?

5、事物組合圖譜

“事物組合圖譜”是以知識圖譜為基礎建立的另一個異常龐大的知識庫,甚至說是比“知識圖譜”大100倍的知識體系,這個東西是人工智能的另一個基礎。

那什么是“事物組合”呢?通俗的說只要是兩個或多個事物組合在一起,發生的任何事件、情況等等,均是“事物組合”,小到“水和水龍頭”,大到“上萬人組成的騰訊公司”,都是事物組合。

1)事物組合圖譜的價值

知識圖譜是通過深度學習等方法,搭建起基于視覺數據包、三維模型、語言符號、深層關系等為一體的知識單元,但在真實的視覺識別、自然語言解析過程中,知識圖譜在很多方面都存在數據不足的特點,為了彌補這個缺陷,我們需要深度挖掘事物之間的關聯,以獲得更加豐富的數據,這也就意味著“事物組合圖譜”的誕生。

“事物組合圖譜”更多的是根據知識圖譜上邊知識單元,基于現實世界的真實組合情況,而形成的機器可以運算的數據,基于這些數據的進一步運算會做很多推理的事情,并產生更大的價值,甚至是后續視覺解析引擎和自然語言解析引擎的基礎。所以,“事物組合圖譜”的一個非常重要的應用即為做精準化推算。

2)事物組合概率統計

人每關注一個事物或場景(多個事物的組合),大腦都會對相關事物進行一次記錄,記憶程度取決于相關參量的記錄次以及記憶時間,著重記錄那些(或事物的組合)出現概率高的事物景象,而對于那些不經常出現的事物(或事物的組合),記憶中的特征也將隨著時間的流逝而逐漸減弱,這說明人是根據景象出現次數、時間的遠近、事物組合特點等來決定記憶與權重。

人工智能也是基于類似的運作原理,需要將所有的事物放到一塊,基于大量的真實、自然的生活數據,來分析其各種事物組合到一起的可能性概率,這種概率數據將對后期的人工智能運算起到關鍵作用,尤其是視覺解析、自然語言解析等領域。

對于事物組合情況的統計,除了需要獲取某些事物組合在一起的概率之外,更重要的是獲得這些事物組合在一起所具備的某些特點,比如過程的特點、過程的來源、過程的走向,以及相關環節體現的特點,這些數據非常有用,在后續人工智能體系中將產生巨大的價值。

事物組合圖譜主要包含三大基本功能:

① 統計各種事物所形成的各種真實組合,包括事物之間的組合、事物的空間位置、時間變換等等,并得出每個事物出現在各種組合中的概率;

② 統計各種組合所在過程中所具備的某些特點,無論是過程特點、來源、走向、分析等,都需要統計相關數據;

③ 將各種組合按各種類別分類,并將其結果分析數據匯總出來;

舉個簡單的例子:水杯與其它物體組合在一起的概率?

水(46.27%)

桌子(17.62%)

塑料(12.39%)

玻璃(8.18%)

……

舉個稍微復雜的例子:獲取“女孩的跑步”特點的識別包?

顯然,“女孩的跑步”是由三個事物,即人、空間、時間組成的一個過程組合,通過對上述場景的大量深度學習,可以得到隨著時間、空間變換的整個動作撲捉過程,并獲取相關的數據識別包,如果將“女孩跑步”定義為一個事物的話,則可以將相關數據模型化形成一個知識單元。

再舉個更復雜的例子:“女孩”、“失蹤”是過去一段時間新聞報道比較熱衷的話題,根據這些新聞報道,以最簡的方式,統計出下邊一個四表格的數據。如果又出現了一個女孩失去聯系了,根據這個簡單的表格數據,則該女孩有可能被囚禁、搶劫或殺害的可能性,這就是一個簡單的判斷。

有人會產生疑問,這世界上有上億個事物主體,上億個事物按照平均10個組合在一起,也就是C10個組合,即10億的十次方,最終的結果是1080次方,這是一個天文數字,現在計算量不可完成的。

但真實世界中的真實情況并非如此,而是不同元素之間經常是成組出現的,比如水杯與水等常見事物的出現組合,幾乎占到水杯與其它所有事物組合的概率上的90%以上,至于那些事物之間組合到一塊的概率過低,則不必進行統計。

3)概率統計某一具體事物的所有相關信息

以前很難準確的了解某一個人,但是在人工智能大數據統計分析的情況下,這個解決起來就太簡單了。以某一事物為主體,通過大量的數據進行分析,按照概率相關程度進行統計,可以很快得出與這一事物關系最近的一系列相關事物。

比如,以學生群體為例,可以很快得出99%的學生,每天早晨起床、洗刷、吃飯、上課、午休、上課、放學回家、吃飯、洗刷、睡覺……,因此,很容易判定“周一上午十點它們大多數都在上課”。如果以單個學生為例,通過匯總這個學生的所有生活信息,可以很快分析出這個學生的所有生活習性、愛好、思維方式,以及可能的行為等等。

4)構建全人類數據庫

在知識圖譜的基礎上,進行相關“事物組合”的概率分析,是努力去構建一個更復雜、龐大的且基于全人類的知識系統,其核心主要基于三點:

①?基于自然語言解析引擎來閱讀并理解互聯網內容,然后對其有價值的相關資料進行提取,并將其歸入到知識圖譜與事物組合圖譜里邊;

②?基于視覺解析技術能夠使計算機能夠理解所有視覺場景內的信息,并將這些信息逐一統計分析,并將其歸入知識圖譜和事物組合圖譜;

③?對人群進行精細分類,然后基于每種類型的人給出特定的事物組合圖譜。

5)組合概率引擎的分化

在自然語言解析的那部分,我們說到“當一個句子還原成一個語境后,會出現非常多的語義可能,并通過語境限制因素與大規模數據統計來獲取定向語義”,但有一點需要提出的,那就是當基于不同的解析方向、內容類型時,最終會出現不同的解析語義,從而形成種類繁多的面向特定知識的語境解析引擎,這就像不同的人看同一場景“一株玫瑰花枝上開著一朵玫瑰花”,最終得到的卻是不同的結果,有的人說“花中有刺”,而有的人卻說“刺中有花”,其實從本質上講,他們看到的場景是一樣的,但是后續的思維加工、思維計算過程卻不一致,因為他們在思維計算過程中分別強調了不同的因素,前者強調了“刺”,而后者強調了“花”。因此在后期,將針對特定人群,推出特定的組合概率識別引擎,以提升分析的成功率。

?

6、視覺解析引擎

1)視覺范圍內單個物體識別

“視覺解析引擎”是基于知識圖譜和事物組合圖譜的數據,按照一定的分析方法對視覺范圍內的事物進行解析的系統,通過“視覺識別引擎”對場景內事物的逐一識別,以及事物之間的組合分析,最終全部理解視覺場景信息的一種技術。

具體來說,通過深層學習來構建可視化知識圖譜,并通過知識圖譜的多層特征體制來分析圖片中的事物,進而我們可以解析出場景中的所有事物(不一定都準確),由于在同一類場景中,不同事物形成的組合往往具有相互限制的作用(事物組合數據),因此我們可以通過這種限制作用(事物組合數據)來分析事物,最終全部解析場景信息的一種技術,這一過程涉及到了大量基于數據的推理判斷。

如果是視頻,具有時間線緯度,那就可以獲取更多的分析數據。當場景跟隨著時間而漸進變動時,我們就可以從多個視角來觀察目標場景中的每一個事物,從而獲取更豐富的視覺數據,這將增加分析的準確度。

2)通過“事物組合圖譜”數據來對場景進行深度分析

視野場景中具有眾多事物,這些事物之間往往具有相互聯系,甚至部分事物可以構成一個組合,或者說這些事物往往以組合的方式出現,比如茶杯中的熱水與冒出的熱氣,因此可以通過它們之間的組合在一起的概率非常高,而其它可能性卻非常低,可以通過這種模式來分析事物。再比如說,一個人在一個秤上秤體重,我們很容易想到的是這個人在稱體重,而不是這個人在觀察這個秤是否美觀,是不是容易壞,它多貴,因為前一種可能性出現的概率要遠高于后者。

系統性的分析場景內的所有事物,以及這些事物之間的常見可能性組合,基于類似組合的可能性走向或特點,就可以理解圖片信息。

3)識別步驟

場景識別過程大致分為以下五個步驟:

①?針對圖像主體元素的識別,得出圖像的場景主題、主要構成元素。

②?針對每一個元素進行逐一詳細識別。

③?基于事物組合圖譜的數據,將各個事物重新組合到一起,并對所有元素的組合結構、視覺呈現等進行分析,從而完成對圖片的完整分析。

④?如果這是一個自然、真實生活中的案例,則將這個案例的相關數據進行簡要歸檔,也即歸入相關知識單元與知識圖譜里邊,對曾經的知識圖譜進行優化。

⑤?如果這種強調圖片中的那些點,則需要對這些點進行詳細的識別、分析。

4)基于類似場景分析圖片的含義

一般而言,分析場景的含義,都是通過同類場景的相似性來理解預測現在所面對的場景的,從而理解場景所表達的真實意義。

在大多情況下,同類“事物組合”或同類場景的最終可能走向,或者它們的來源于情況,或者會帶來那些結果,或者整個過程的價值(特點),這就是圖像的真正含義。

人們為什么看到懸崖,會害怕?

答:因為在這里發生意外的可能性比較大,一不小心跌落,就沒命了,于是害怕,也即出于對一種可能性危險結果的擔心。

男士為什么喜歡和陌生美女聊天?

答:因為和陌生美女聊天交流,或許有許多進一步發生的可能,比如成為朋友、一起吃飯、看電影等一系列后續的可能。

?

舉例:三口之家的郊外旅游

步驟一:

通過對這張圖片進行簡單識別,可以得出這張圖片大致包含的元素為四類:

① 、人(3個人);

② 、草坪、樹木、天空;

③ 、熱氣球;

④ 、文字(logo)。

通過這四個元素的組合分析,可以得出,這張圖大致是一個郊外游玩圖。

步驟二:

針對圖像中的某些元素組合進行具體的分析,比如以“人”這個元素為例,很顯然能夠分析出圖中一共有3個人,進行更具體的分析,可以得出一個男士、一個女士、還有一個小女孩,如果機器能夠識別出她們是手牽手,再加上男士、女士、小女孩這樣的結構,可以得出這很可能是一個三口之家。

以類似方式完成對自然景觀(草坪、樹木、天空)、熱氣球、文字的分析。

步驟三:

這是一幅什么樣的場景?

答:三口之家歡快的郊外旅游圖,“歡快”怎么來?,因為基于類似場景的統計分析,郊外旅游一般都是一件開心的事。

?

7、語境解析引擎

語句解析簡要流程

1)人基于什么進行交流?

人的所有交流都基于以下五類真實的素材:

①?視覺層面:可視化方面,素材、圖畫、動作、圖景隨時間變化……

②?味覺層面:味覺感官,如:甜、苦、澀、酸……

③?聽覺層面:聽覺感官,如:音質連續、間斷、跳躍、清晰、模糊、洪亮、清脆……

④?觸覺層面:皮膚感官,如:柔軟、堅硬、摩擦……

⑤?嗅覺層面:嗅覺感官,如:臭、香……

2)基于語境展現的語句分析

人類所有的交流都是基于事實的、能夠真實感受到的事物來進行的,當機器解析自然語言時,也需要將其轉成事實的、能夠真實感受到的事物。因此,“語境解析引擎”主要是將語言還原成一幅真實的圖畫,并基于“知識圖譜”、“事物組合圖譜”對其進行深度解析的一種技術。

基于語境解析引擎的自然語言理解主要包括以下幾個部分:

①?基于事物組合圖譜尋找話語語境中的類似事物組合場景;

②?用類似事物場景的各種屬性特點去理解話語場景;

③?如果針對話語語境中的某些點需要著重分析,則調取“知識圖譜”或“事物組合圖譜”數據進行深入分析。

舉例1:“狗走進了房間,他是毛絨絨的?!?/span>

“狗走進了房間,它布滿了家具。”

毛絨絨是狗的“外形表述”,家具是一個物體,房間更多是一個空間區域,布滿則是物體擺放的位置,因此,基于人工智能技術,我們很容易通過語境來理解語句的語義。

要基于事物組合圖譜進行可視化動態聯想,將一句話展現為一幅動態簡約語境圖畫,如下邊例子所示:

舉例2:“詠鵝”古詩用圖畫表示出來

詠鵝

鵝,鵝,鵝,曲項向天歌。

白毛浮綠水,紅掌撥清波。

基于語境解析技術將古詩語境用圖畫展示出來,如下圖所示:

3)語境分析引擎

任何一幅語境圖畫所展現的內容都是無窮多的,這無窮多的可能會帶來成千上萬種語義可能,通過將語境所有事物按照可能性組合在一起,對這種事物組合的類似場景進行分析,來獲取最有可能表達的那種語義,并最終獲取某一語句表達的真實語義。

當然,語境中的事物可能會出現多種組合形式,每一種組合形式都可能會對應相應的語義。但語境具有糾錯機制,隨著語句的持續,當發現前邊的理解有誤時,即前邊的某一語句表達的并不是概率最高的那個語義時,可以糾正前邊的語句語義理解。

其實從另一方面來講,“話語”本身是能表達多種含義的,而語境對語義具有限制作用,將一句話限制在某一確定的語義,也即話語能夠表達多種不同的含義A/B/C/D,每種含義的概率分別是35%、30%、25%、10%,語境將語義限制在其中的某一種,比如B。

語境對語義的制約有多種情況,比如,同樣一句話,不同身份的人所表達的語義不同。例如:

一位教師說:“明天上午八點我去上課。”

一個學生說:“明天上午八點我去上課。”

上面的兩個例句中,教師和學生雖然都說同樣的話,由于教師和學生的職務身份不同而決定了同樣一句話的語義不同,教師說這句話的意思是“去講課”,而學生說句話的意思是“去聽課”。

按照傳統的語句邏輯分析,很難解決這種語義分歧錯誤,但是在人工智能大數據統計分析的情況下,這個解決起來就太簡單了,通過大量的數據分析發現,“學生”與“上課”這兩個事物組合到一起,99.9%的概率是去學生去聽課,So easy!

再比如,同樣的一句話,在不同的時間、地點、場合,就有不同的語義。

例如:“都八點了!”

按照傳統的語句解析技術,這句話很難理解,由于缺乏語境,它的語義很難確定。但是按照人工智能技術,這個問題很簡單,通過大數據分析,可以直接給出,這句話出現在各種場景中的概率:

①?快點走,否則飛機晚點了(0.1%)

②?快點走,否則上班時間要遲到了(15.1%)

③?快點走,否則上課要遲到了(11.1%)

④?你沒有時間概念(14%)

……

至于最終表達的是一種什么樣的含義,無所謂,隨著語境的持續而自然解決。

舉例:交通事故

一位剛學會騎自行車的姑娘,因有急事飛駛在郊外的大馬路上。這時,她發現前面有個老人在路邊散步,她心里很慌亂,便在背后大聲叫道:“老大爺,站一下,請站住別動!”老人隨即站住,沒有回頭,只等姑娘過去。但不幸得很,姑娘三歪兩歪一下子撞在老人身上,老人摔倒了。老人爬起來說:“我說你讓我站住干什么,原來你是要瞄準呀!”

整個段子的語言解析的字數比本文所有字數還多,簡略起見,僅對其第一句話進行解析:“一位剛學會騎自行車的姑娘,因有急事飛駛在郊外的大馬路上?!?/span>

①?“姑娘”是“女孩”的另一種稱呼,這點通過知識圖譜可以得到;

②?“自行車”是一種物體,通過知識圖譜可以查到;

③?“馬路”是“公路”或“泊油路”的另一種稱呼,是一個事物,通過知識圖譜可以查到;

④?“郊外”是一個“事物組合”,通常指麥田、道路、野草、村落等組成的場景,通過“事物組合圖譜”可以查到;

⑤?“騎自行車”是“人”與“自行車”兩種事物組合在一起的一種運動狀態,在“事物組合圖譜”里邊可以

⑥?“剛學會騎自行車”是“人”與“自行車”兩種事物組合在一起的一種運動狀態的子集,這在“事物組合圖譜”里邊可以查到;

⑦?“有急事”是“人”與“事情”兩種事物組合在一的一種狀態子集,這在“事物組合圖譜”里可以查到;

⑧?“飛馳”是車輛等事物運動過程中的一種描述,這在“事物組合圖譜”里可以查到;

⑨?基于上述這些理解與數據,通過“語境解析引擎”,很容易將這句話解析出來,最后給出的是一個還原的簡略過程“描述視頻”,也即為該句話的“語境”,也即理解這句話的含義。

基于“知識單元”、“知識圖譜”、“事物組合圖譜”、“視覺解析引擎”、“語境解析引擎”等技術,已經能夠完美搭建基于自然語言的龐大數據庫,并能夠以極高準確率識別自然語言,可以說,這已經為真正實現人工智能搭建了良好的基礎,但這僅僅是整個“人工智能”技術體系中的一部分,鑒于本文篇幅,剩下的那部分將在后續的文章中展現給大家。

最后想說一句話:中國創新,改變世界!

總結

以上是生活随笔為你收集整理的一眼看清高科技,深度解析人工智能技术脉络的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。