几种软件架构
幾種軟件架構(gòu)
一.阿里云大數(shù)據(jù)架構(gòu)
二.今日頭條推薦算法架構(gòu)
推薦系統(tǒng),如果用形式化的方式去描述實(shí)際上是擬合一個(gè)用戶對(duì)內(nèi)容滿意度的函數(shù),這個(gè)函數(shù)需要輸入三個(gè)維度的變量。第一個(gè)維度是內(nèi)容。頭條現(xiàn)在已經(jīng)是一個(gè)綜合內(nèi)容平臺(tái),圖文、視頻、UGC小視頻、問答、微頭條,每種內(nèi)容有很多自己的特征,需要考慮怎樣提取不同內(nèi)容類型的特征做好推薦。第二個(gè)維度是用戶特征。包括各種興趣標(biāo)簽,職業(yè)、年齡、性別等,還有很多模型刻劃出的隱式用戶興趣等。第三個(gè)維度是環(huán)境特征。這是移動(dòng)互聯(lián)網(wǎng)時(shí)代推薦的特點(diǎn),用戶隨時(shí)隨地移動(dòng),在工作場合、通勤、旅游等不同的場景,信息偏好有所偏移。結(jié)合三方面的維度,模型會(huì)給出一個(gè)預(yù)估,即推測推薦內(nèi)容在這一場景下對(duì)這一用戶是否合適。
三.AI 的架構(gòu)
人工智能的架構(gòu)分為三層:應(yīng)用層、技術(shù)層和基礎(chǔ)層。
應(yīng)用層聚焦在人工智能和各行業(yè)各領(lǐng)域的結(jié)合。技術(shù)層是算法、模型和技術(shù)開發(fā)。基礎(chǔ)層則是計(jì)算能力和數(shù)據(jù)資源。
各層架構(gòu)再進(jìn)行細(xì)分如下:
數(shù)據(jù)收集:獲取什么類型的數(shù)據(jù),數(shù)據(jù)可以通過那些途徑獲取。常見的數(shù)據(jù)來源是采集、購買或其他方式獲取現(xiàn)有數(shù)據(jù)。
比如中山大學(xué)的資深機(jī)器學(xué)習(xí)研究專家梁浩林就分享到,城市地理學(xué)領(lǐng)域的數(shù)據(jù)采集渠道,可以同步獲取一些社交APP,比如Yahoo Flickr、Sina Webo的checkin數(shù)據(jù),手機(jī)的信號(hào)數(shù)據(jù),用戶GPS的軌跡數(shù)據(jù)等等。
數(shù)據(jù)理解:獲取到原始數(shù)據(jù)之后,分析數(shù)據(jù)里面有什么內(nèi)容、數(shù)據(jù)準(zhǔn)確性如何,為下一步的預(yù)處理做準(zhǔn)備。
比如我們拍攝的各種照片,需要從中識(shí)別出包含人臉的照片。
數(shù)據(jù)預(yù)處理:原始數(shù)據(jù)可能會(huì)有環(huán)境影響或者干擾因素,格式化也不好,所以為了保證預(yù)測的準(zhǔn)確性和有效性,需要進(jìn)行數(shù)據(jù)的預(yù)處理。
常見的比如調(diào)整照片亮度、對(duì)比度、銳化等等。
特征提取:將數(shù)據(jù)里有用的,有典型特征的抽取出來。
比如,對(duì)幾千張有效照片進(jìn)行分類,特征包括性別、頭發(fā)眼睛皮膚顏色、輪廓、臉型等等。
模型構(gòu)建:使用適當(dāng)?shù)乃惴?#xff0c;獲取預(yù)期準(zhǔn)確的值。
常用的分類算法包括:決策樹分類法(Decision Tree),樸素貝葉斯分類算法(Native Bayesian Classifier)、基于支持向量機(jī)(SVM)的分類器、神經(jīng)網(wǎng)絡(luò)法(Neural Network)、k-最近鄰法(k-nearest
neighbor,kNN) 語義樹、知識(shí)庫、各種視覺算法等等等。至于各種算法的區(qū)別,我還在學(xué)習(xí)中。
模型評(píng)估:通常對(duì)一個(gè)模型進(jìn)行評(píng)估的標(biāo)準(zhǔn)有準(zhǔn)確率、查全率。
查準(zhǔn)率 =檢索出的相關(guān)信息量/檢索出的信息總量
查全率=檢索出的相關(guān)信息量/系統(tǒng)中的相關(guān)信息總量
狹義上的理解拿人臉識(shí)別來講,假設(shè)數(shù)據(jù)庫中存在的10個(gè)用戶的照片,我對(duì)這10個(gè)用戶進(jìn)行拍照,識(shí)別出來庫中包含的人臉有7個(gè),這7個(gè)中識(shí)別正確的有5個(gè),那么查準(zhǔn)率=5/10=50%;查全率就是7/10=70%。另外就是,假設(shè)我對(duì)1個(gè)用戶,操作十次,出來的結(jié)果是否十次均和實(shí)際匹配。我認(rèn)為也是模型評(píng)估的一個(gè)標(biāo)準(zhǔn)。
模型訓(xùn)練:根據(jù)模型評(píng)估的結(jié)果,對(duì)模型進(jìn)行不斷的訓(xùn)練甚至是調(diào)整,以達(dá)到更好的效果。
模型應(yīng)用:將模型部署、應(yīng)用到實(shí)際場景中。
可以回到AI 基本概念和應(yīng)用中的人臉識(shí)別開門場景,來看看如何跟我們的 AI 架構(gòu)對(duì)應(yīng)的。
從AI 的結(jié)構(gòu)很容易可以看出來。
人工智能的核心是基礎(chǔ)層,即計(jì)算能力和refreshing data
flow (持續(xù)的數(shù)據(jù)流)。
所以大公司愿意投入人工智能和發(fā)展人工智能,因?yàn)榇蠊居袛?shù)據(jù),尤其是Google、Facebook、亞馬遜、蘋果,還有國內(nèi)的BAT。數(shù)據(jù)是大公司的一個(gè)優(yōu)勢(shì)。
于是現(xiàn)在有一個(gè)聲音會(huì)認(rèn)為:大公司不具備的醫(yī)療、基金、金融等數(shù)據(jù),可能會(huì)是小公司、人工智能初創(chuàng)企業(yè)突破的機(jī)會(huì)。
技術(shù)層的核心主要在于:特征提取, 模型與算法選擇。
總結(jié)
- 上一篇: 图像零交叉点,视频生成,视频识别,视频摘
- 下一篇: 未来几年自动驾驶预测(上)