日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

word2vec模型评估_特征工程(下)—特征评估

發(fā)布時(shí)間:2024/9/30 编程问答 26 豆豆
生活随笔 收集整理的這篇文章主要介紹了 word2vec模型评估_特征工程(下)—特征评估 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

點(diǎn)擊上方“大數(shù)據(jù)與人工智能”,“星標(biāo)或置頂公眾號(hào)”

第一時(shí)間獲取好內(nèi)容

作者丨stephenDC

編輯丨Zandy

這是作者的第15篇文章

本文是特征工程系列的第3篇最后一篇

作者會(huì)在本文中結(jié)合自己在視頻推薦方面的工作經(jīng)驗(yàn),著重從工程實(shí)現(xiàn)方面,講述如何對(duì)特征進(jìn)行評(píng)估的問題。下文中,我們首先會(huì)厘清“特征評(píng)估”的概念,然后講述特征評(píng)估的標(biāo)準(zhǔn),最后是問題的反向排查

?涉及到“特征選擇”和“特征表達(dá)”的細(xì)節(jié)或背景,大家可以參閱該系列的前兩篇文章,《特征工程(上)—特征選擇》和《特征工程(中)-特征表達(dá)》。

厘清概念

? ??什么是特征評(píng)估?

特征評(píng)估從概念上很容易跟特征選擇糾纏到一起,因此非常有必要先厘清概念。在特征選擇的過程中,我們需要對(duì)特征的每個(gè)維度進(jìn)行評(píng)估,來選擇出相對(duì)更重要的特征。然后,對(duì)于選擇出的特征維度,我們會(huì)根據(jù)原始數(shù)據(jù),對(duì)特征進(jìn)行編碼,進(jìn)而得到特征。本文所說的特征評(píng)估,指的是對(duì)已經(jīng)生成的特征的整體評(píng)估,發(fā)生在特征選擇和特征編碼之后,因此不要跟特征選擇過程中的對(duì)單個(gè)特征維度相對(duì)重要性的評(píng)估弄混了。

評(píng)估標(biāo)準(zhǔn)

? ? ? ? ? ??分析前需要優(yōu)先考慮哪些特征?特征工程的最終目的是提供給模型做預(yù)測(cè),因此只要特征在模型上表現(xiàn)的好就夠了。這話一點(diǎn)兒沒錯(cuò),但倘若特征的表現(xiàn)不如人意呢?我們有沒有辦法提前發(fā)現(xiàn)問題,或者說如果最后不得不推倒重來,怎么找到改進(jìn)的方向。所以,在最終的定量分析之前,還需要從特征的覆蓋率特征維度定性分析等各個(gè)方面,對(duì)特征進(jìn)行先行評(píng)估。
  • 覆蓋率
覆蓋率指的是,能成功生成出特征的視頻和用戶,占全體視頻和用戶的比例。特征提取和生成的方法不同,其覆蓋率也自然不同。對(duì)視頻的特征生成來說,可以基于內(nèi)容,也可以基于用戶行為。這里講述并對(duì)比3種方法,分別以關(guān)鍵詞(簡(jiǎn)稱為“標(biāo)簽”)、“ALS”和“Word2vec”。

標(biāo)簽:視頻標(biāo)簽是內(nèi)容的體現(xiàn),因此是基于內(nèi)容生成特征的典型方式。有了視頻標(biāo)簽,就可以用One-hot或者TF-IDF的方式,進(jìn)行特征編碼,進(jìn)而得到特征。因此,這種方法的覆蓋率,取決于視頻標(biāo)簽的覆蓋率。

ALSALS是Alternating Least Square的首字母縮寫,是Spark mllib最早實(shí)現(xiàn)的算法之一。ALS是求解矩陣分解的一種典型方法,將用戶對(duì)視頻的評(píng)分矩陣進(jìn)行分解,分別得到用戶和視頻的特征。因此,這種方法存在冷啟動(dòng)問題,無法覆蓋到尚無用戶操作過的視頻,也無法覆蓋尚未有過操作行為的用戶。

Word2vecWord2vec是谷歌提出的詞嵌入模型,可以將一個(gè)詞嵌入到特定的特征空間之中,并維持詞與詞之間的語義關(guān)系。如果每個(gè)視頻當(dāng)成一個(gè)單詞,將每個(gè)用戶觀看過的視頻當(dāng)成一個(gè)句子,則可以用Word2vec對(duì)視頻編碼,得到視頻特征。所以,這種方法從原理上決定了,對(duì)沒有被播放過或剛上線不久未被用戶充分選擇的視頻,因?yàn)榈玫降奶卣鲿?huì)不準(zhǔn)確,都無法覆蓋。

  • 特征維度

在實(shí)際工程實(shí)現(xiàn)的時(shí)候,特征的維度是一個(gè)非常重要的考慮因素。因?yàn)?strong>特征的維度,跟特征的表達(dá)能力、適用的模型以及計(jì)算的復(fù)雜度都有關(guān)系特征維度太低,顯然特征的表達(dá)能力有限;特征維度太高,不僅會(huì)讓計(jì)算量升級(jí)(計(jì)算量跟模型復(fù)雜度有關(guān)),還容易帶來維度災(zāi)難的問題(可參看《機(jī)器學(xué)習(xí)中的維度災(zāi)難》)。因此,特征的維度要和計(jì)算框架以及數(shù)據(jù)規(guī)模相適應(yīng)。首先是特征維度要和計(jì)算框架的能力相匹配。作者曾經(jīng)基于Spark mllib來做特征工程,后來發(fā)現(xiàn)mllib有一個(gè)致命的缺陷,就是只實(shí)現(xiàn)了數(shù)據(jù)分布式,而沒有實(shí)現(xiàn)參數(shù)分布式。我們準(zhǔn)備了2億條數(shù)據(jù),3000多維的稠密特征,結(jié)果還只能抽樣使用一部分?jǐn)?shù)據(jù)來訓(xùn)練模型。后來我們改用了Spark?on Angel 的Parameter Server框架,才算解決了這個(gè)問題。(Angel Git地址:https://github.com/Angel-ML/angel/tree/master/spark-on-angel)然后,特征維度也要和數(shù)據(jù)規(guī)模相匹配。我們用另一種方案,為視頻生成了稀疏特征,加上用戶特征維度近千萬級(jí)。顯然,2億條數(shù)據(jù)和千萬級(jí)特征的情況下,用深度學(xué)習(xí)的模型,肯定會(huì)過擬合的。
  • 定性分析
對(duì)可解釋性特征,基于抽樣的定性分析非常有用。比如,使用視頻標(biāo)簽來生成特征,每個(gè)維度都可解釋。我個(gè)人非常喜歡“諾蘭”、“姜文”、“周星馳”等標(biāo)簽,不喜歡“恐怖片”的標(biāo)簽,而我的播放記錄也基本匹配了我的個(gè)人愛好,那么如果最后得到的特征在“恐怖片”這個(gè)維度比“諾蘭”這個(gè)維度的值還要高,那就不用灌入模型訓(xùn)練了,這肯定是有問題的。基于抽樣的定性分析,還可以稍微拓展到公司的同事,請(qǐng)他們幫忙驗(yàn)證各自的特征。如果有明顯的問題,我們就可以及時(shí)修正;如果已經(jīng)沒有顯著的問題,我們就可以將特征灌入模型訓(xùn)練,然后基于模型結(jié)果進(jìn)行定量分析了。
  • 定量分析
特征灌入模型,并對(duì)結(jié)果進(jìn)行定量分析,這非常接近模型評(píng)估的概念了。對(duì)于一個(gè)訓(xùn)練好的模型,重要的是評(píng)估其泛化能力。對(duì)分類問題,可以在獨(dú)立的測(cè)試集上考察準(zhǔn)確率召回率F-Score等一系列指標(biāo);對(duì)回歸問題,也有常規(guī)的MAE、RMSE等評(píng)估指標(biāo)。當(dāng)然,最終的模型評(píng)估,免不了要上線進(jìn)行A/B測(cè)試,畢竟線下和線上的環(huán)境會(huì)有差異,而且有些商業(yè)指標(biāo)可能上線之后才能統(tǒng)計(jì)。對(duì)特征的評(píng)估,跟上述對(duì)模型的評(píng)估類似,稍微不同的是,我們現(xiàn)階段評(píng)估的重心是特征。在模型評(píng)估的時(shí)候,特征已經(jīng)確定,重點(diǎn)是選模型及最優(yōu)的參數(shù);而在特征評(píng)估的階段,特征本身的好壞也需要作為一個(gè)變量,也即是說,如果這組特征在各種模型和參數(shù)之下的表現(xiàn)都不近人意,那我們就需要對(duì)問題進(jìn)行反向排查了。

問題反向排查

? ? ? ? ?特征表現(xiàn)不好,如何找出問題所在?如果特征表現(xiàn)不好,怎么樣去查找問題所在,找到改進(jìn)方向呢?我們先來分析一下,最終的定量分析指標(biāo),比如RMSE,是怎么得到。首先,需要先從數(shù)據(jù)源提取出特征。在這個(gè)過程中,數(shù)據(jù)源的質(zhì)量、特征提取的方案,都會(huì)影響到最后得到的特征。然后,我們將特征灌入模型進(jìn)行訓(xùn)練,這時(shí)模型的選型、模型的訓(xùn)練,都會(huì)影響到最終的分析指標(biāo)。所以,當(dāng)特征表現(xiàn)不夠好時(shí),我們就可以按照這個(gè)流程對(duì)問題進(jìn)行反向排查了。

1

模型的問題

首先,我們需要排除模型的問題。大家都知道,機(jī)器學(xué)習(xí)是沒有免費(fèi)午餐的,沒有任何一種模型可以在任何問題上表現(xiàn)都優(yōu)于另一種模型。所以,我們要根據(jù)特征和數(shù)據(jù)量,選擇合適的模型。舉例:FM會(huì)對(duì)一階特征進(jìn)行二階交叉,這對(duì)標(biāo)簽特征很有意義,那對(duì)Word2vec這樣的嵌入特征是否就不一定合適了呢?再比如,KNN在低維問題上表現(xiàn)非常出色,但對(duì)于高維的特征,由于維度災(zāi)難的問題,也是不適合的。如果這組特征在各種模型下的表現(xiàn)都不夠好,此時(shí)我們就需要去考慮特征本身可能的問題了。

2

特征的問題

在數(shù)據(jù)源確定的情況下,影響特征質(zhì)量的因素主要是特征選擇和特征編碼。在特征選擇方面,我們要考慮選擇出的特征是否完備,冗余度如何等。在編碼方案上,我們也要考慮現(xiàn)有的編碼方式,是否能合理地刻畫一個(gè)對(duì)象。舉例:比如,作者先前很排斥對(duì)電影標(biāo)簽用TF-IDF的方式編碼。因?yàn)橹苄邱Y比趙本山演了更多的電影,“周星馳”這個(gè)標(biāo)簽比“趙本山”IDF(逆向文本頻率)項(xiàng)的值就要低很多;但周星馳的電影風(fēng)格很凸出,而《三槍》和《一代宗師》卻并沒有因?yàn)橼w本山的參演而增加多少相似性。但后來從全局考慮,作者還是接受了TF-IDF的方案,而“周星馳”這個(gè)標(biāo)簽的重要程度只能從視頻標(biāo)簽權(quán)重的角度補(bǔ)回來了。再比如,對(duì)用戶看過的視頻,如何根據(jù)播放行為轉(zhuǎn)化為分?jǐn)?shù)?要不要考慮觀看行為的時(shí)間衰減,如何衰減?這些都會(huì)影響到最終的特征。如果特征的編碼方案經(jīng)過排查,并沒有大的問題,但特征表現(xiàn)還是不夠好,那就需要去排查數(shù)據(jù)源的問題了。。

3

數(shù)據(jù)源問題

還是以視頻推薦為背景,基于標(biāo)簽的特征構(gòu)建,依賴視頻標(biāo)簽數(shù)據(jù)和用戶行為數(shù)據(jù)。也就是說,如果標(biāo)簽不準(zhǔn),或者用戶行為里混入了臟數(shù)據(jù),特征工程的質(zhì)量是可以想見的。這個(gè)問題很難完全避免,但需要相關(guān)團(tuán)隊(duì)的大力支持。比如,視頻標(biāo)簽需要編輯團(tuán)隊(duì)辛苦的打標(biāo)簽工作;而用戶行為日志,則需要BI團(tuán)隊(duì)辛苦的ETL工作。沒有這些相關(guān)同事的工作,特征工程就是巧婦難為無米之炊了。

小結(jié)

本文在“特征選擇”和“特征表達(dá)”的基礎(chǔ)上,聊了一下特征評(píng)估的問題。至此,特征工程系列終于結(jié)束。由于作者的水平及在這方面的工作經(jīng)驗(yàn)均非常有限,個(gè)中不足還請(qǐng)大家不吝賜教。-end-相關(guān)內(nèi)容閱讀

1.特征工程(中)-特征表達(dá)

2.特征工程(上)—特征選擇

3.指數(shù)分布族

4.誤差反向傳播

5.極大似然估計(jì)、極大后驗(yàn)估計(jì)和貝葉斯估計(jì)

6.?稀疏核機(jī)(下)—稀疏性

7.?稀疏核機(jī)(中)—核方法

8.稀疏核機(jī)(上)—SVM回顧

總結(jié)

以上是生活随笔為你收集整理的word2vec模型评估_特征工程(下)—特征评估的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 丰满人妻一区二区三区免费视频棣 | 欧美日韩人妻精品一区在线 | 91成人精品| 桃谷绘里香番号 | 毛片大片 | 青娱乐av在线 | 成人免费一级片 | 国产一区二区三区播放 | 222aaa| 国产精品1区2区3区4区 | 99国产免费| 亚洲欧美第一页 | 精品人妻一区二区三区三区四区 | 深夜福利网址 | 亚洲精品乱码久久久久久久 | 大肉大捧一进一出好爽mba | 69精品无码成人久久久久久 | 99视频观看 | 91黄色片| av无毛| 久久精品一区 | 99久久99九九99九九九 | 国产精品一区二区三区四 | 国产碰碰 | 色哟哟国产 | 日本大乳奶做爰 | 男人看片网站 | 澳门黄色网 | 亚洲a√| 国产视频污在线观看 | 女儿的朋友在线播放 | 精品国产av色一区二区深夜久久 | 欧美操操| 麻豆天天躁天天揉揉av | 欧美午夜精品理论片 | 精品视频一区二区在线 | 精品无码一区二区三区的天堂 | 亚色一区| 最新国产黄色网址 | 亚洲国产色图 | 亚洲国产理论 | 一级片美女 | 韩国美女主播跳舞 | 我会温柔一点的日剧 | 日韩在线欧美在线 | 日韩精品视频在线观看免费 | 国产精品亚洲专区无码牛牛 | 婷婷五月综合缴情在线视频 | 中国字幕av | 黄色片子免费看 | 女人黄色片 | 影音先锋男人的天堂 | 国产区在线视频 | 色无极在线 | 精品视频在线一区 | 色乱码一区二区三区熟女 | 性高湖久久久久久久久免费 | 日本全黄裸体片 | 国产精品久久久久久亚洲影视 | 国产嫩草影院久久久 | 丝袜熟女一区二区三区 | 久久在线精品 | 99er视频| 美女隐私免费网站 | 精品久久人人妻人人做人人 | 蜜桃色av | 亚洲av无码一区二区二三区软件 | 花房姑娘免费观看全集 | www日本黄色 | 久久伊人亚洲 | 亚洲精品视频免费观看 | 国产人妖在线 | av小说在线 | 国产av毛片 | 三级免费| japanese中文字幕 | 一级在线看 | 亚洲精品乱码久久久久久黑人 | 午夜三级福利 | 明星毛片 | 色成人综合 | 国产成人一区二区三区小说 | 四虎啪啪| proumb性欧美在线观看 | 欧美a级免费 | 最新地址av | 欧美片17c07.com| 捆绑束缚调教 | 欧美第五页 | 三级精品在线 | 黄av资源| 免费污网站在线观看 | 日少妇视频| 男女一区二区三区 | 99久久久国产精品无码网爆 | www色亚洲 | 国产无码精品合集 | 激情五月婷婷丁香 | 日本激情视频一区二区三区 |