日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 运维知识 > windows >内容正文

windows

自然语言处理技术(NLP)在推荐系统中的应用 原2017.06.29人工智能头条 作者: 张相於,58集团算法架构师,转转搜索推荐部负责人,负责搜索、推荐以及算法相关工作。多年来主要从事推荐系统以及机

發(fā)布時間:2025/3/21 windows 49 豆豆

自然語言處理技術(shù)(NLP)在推薦系統(tǒng)中的應(yīng)用

2017.06.29人工智能頭條

作者:?張相於,58集團(tuán)算法架構(gòu)師,轉(zhuǎn)轉(zhuǎn)搜索推薦部負(fù)責(zé)人,負(fù)責(zé)搜索、推薦以及算法相關(guān)工作。多年來主要從事推薦系統(tǒng)以及機(jī)器學(xué)習(xí),也做過計(jì)算廣告、反作弊等相關(guān)工作,并熱衷于探索大數(shù)據(jù)和機(jī)器學(xué)習(xí)技術(shù)在其他領(lǐng)域的應(yīng)用實(shí)踐。?

責(zé)編:何永燦(heyc@csdn.net)?
本文為《程序員》原創(chuàng)文章,更多精彩文章請訂閱《程序員》


概述


個性化推薦是大數(shù)據(jù)時代不可或缺的技術(shù),在電商、信息分發(fā)、計(jì)算廣告、互聯(lián)網(wǎng)金融等領(lǐng)域都起著重要的作用。具體來講,個性化推薦在流量高效利用、信息高效分發(fā)、提升用戶體驗(yàn)、長尾物品挖掘等方面均起著核心作用。在推薦系統(tǒng)中經(jīng)常需要處理各種文本類數(shù)據(jù),例如商品描述、新聞資訊、用戶留言等等。具體來講,我們需要使用文本數(shù)據(jù)完成以下任務(wù):

  • 候選商品召回。候選商品召回是推薦流程的第一步,用來生成待推薦的物品集合。這部分的核心操作是根據(jù)各種不同的推薦算法來獲取到對應(yīng)的物品集合。而文本類數(shù)據(jù)就是很重要的一類召回算法,具有不依賴用戶行為、多樣性豐富等優(yōu)勢,在文本信息豐富或者用戶信息缺乏的場合中具有非常重要的作用。

  • 相關(guān)性計(jì)算。相關(guān)性計(jì)算充斥著推薦系統(tǒng)流程的各個步驟,例如召回算法中的各種文本相似度算法以及用戶畫像計(jì)算時用到的一些相關(guān)性計(jì)算等。

  • 作為特征參與模型排序(CTR/CVR)。在候選集召回之后的排序?qū)?#xff0c;文本類特征常常可以提供很多的信息,從而成為重要的排序特征。

但是相比結(jié)構(gòu)化信息(例如商品的屬性等),文本信息在具體使用時具有一些先天缺點(diǎn)。

首先,文本數(shù)據(jù)中的結(jié)構(gòu)信息量少。嚴(yán)格來說,文本數(shù)據(jù)通常是沒有什么結(jié)構(gòu)的,一般能夠有的結(jié)構(gòu)可能只是“標(biāo)題”、“正文”、“評論”這樣區(qū)分文本來源的結(jié)構(gòu),除此以外一般就沒有更多的結(jié)構(gòu)信息了。為什么我們要在意結(jié)構(gòu)信息呢?因?yàn)榻Y(jié)構(gòu)代表著信息量,無論是使用算法還是業(yè)務(wù)規(guī)則,都可以根據(jù)結(jié)構(gòu)化信息來制定推薦策略,例如“召回所有顏色為藍(lán)色的長款羽絨服”這樣一個策略里就用到了“顏色”和“款式”這兩個結(jié)構(gòu)化信息。但是如果商品的描述數(shù)據(jù)庫中沒有這樣的結(jié)構(gòu)化信息,只有一句“該羽絨服為藍(lán)色長款羽絨服”的自由文本,那么就無法利用結(jié)構(gòu)信息制定策略了。

其次,文本內(nèi)容的信息量不確定。與無結(jié)構(gòu)化相伴隨的,是文本數(shù)據(jù)在內(nèi)容的不確定性,這種不確定性體現(xiàn)在內(nèi)容和數(shù)量上,例如不同用戶對同一件二手商品的描述可能差異非常大,具體可能在用詞、描述、文本長短等方面都具有較大差異。同樣的兩個物品,在一個物品的描述中出現(xiàn)的內(nèi)容在另外一個物品中并不一定會出現(xiàn)。這種差異性的存在使得文本數(shù)據(jù)往往難以作為一種穩(wěn)定可靠的數(shù)據(jù)源來使用,尤其是在UGC化明顯的場景下更是如此。

再次,自由文本中的歧義問題較多。歧義理解是自然語言處理中的重要研究課題,同時歧義也影響著我們在推薦系統(tǒng)中對文本數(shù)據(jù)的使用。例如用戶在描述自己的二手手機(jī)時可能會寫“出售iPhone6一部,打算湊錢買iPhone7”這樣的話,這樣一句對人來說意思很明確的話,卻對機(jī)器造成了很大困擾:這個手機(jī)究竟是iPhone6還是iPhone7?在這樣的背景下如何保證推薦系統(tǒng)的準(zhǔn)確率便成為了一個挑戰(zhàn)。

但是文本數(shù)據(jù)也不是一無是處,有缺點(diǎn)的同時也具有一些結(jié)構(gòu)化數(shù)據(jù)所不具有的優(yōu)點(diǎn):

  • 數(shù)據(jù)量大。無結(jié)構(gòu)化的文本數(shù)據(jù)一般來說是非常容易獲得的,例如各種UGC渠道,以及網(wǎng)絡(luò)爬取等方法,都可穿獲得大量文本數(shù)據(jù)。

  • 多樣性豐富。無結(jié)構(gòu)化是一把雙刃劍,不好的一面已經(jīng)分析過,好的一面就是由于其開放性,導(dǎo)致具有豐富的多樣性,會包含一些結(jié)構(gòu)規(guī)定以外的數(shù)據(jù)。

  • 信息及時。在一些新名詞,新事物出現(xiàn)之后,微博、朋友圈常常是最先能夠反應(yīng)出變化的地方,而這些都是純文本的數(shù)據(jù),對這些數(shù)據(jù)的合理分析,能夠最快得到結(jié)構(gòu)化、預(yù)定義數(shù)據(jù)所無法得到的信息,這也是文本數(shù)據(jù)的優(yōu)勢。

綜上所述,文本數(shù)據(jù)是一類量大、復(fù)雜、豐富的數(shù)據(jù),對推薦系統(tǒng)起著重要的作用,本文將針對上面提到的幾個方面,對推薦系統(tǒng)中常見的文本處理方法進(jìn)行介紹。

從這里出發(fā):詞袋模型

詞袋模型(Bag of Words,簡稱BOW模型)是最簡單的文本處理方法,其核心假設(shè)非常簡單,就是認(rèn)為一篇文檔是由文檔中的詞組成的多重集合(多重集合與普通集合的不同在于考慮了集合中元素的出現(xiàn)次數(shù))構(gòu)成的。這是一種最簡單的假設(shè),沒有考慮文檔中諸如語法、詞序等其他重要因素,只考慮了詞的出現(xiàn)次數(shù)。這樣簡單的假設(shè)顯然丟掉了很多信息,但是帶來的好處是使用和計(jì)算都比較簡單,同時也具有較大的靈活性。

在推薦系統(tǒng)中,如果將一個物品看作一個詞袋,我們可以根據(jù)袋中的詞來召回相關(guān)物品,例如用戶瀏覽了一個包含“羽絨服”關(guān)鍵詞的商品,我們可以召回包含“羽絨服”的其他商品作為該次推薦的候選商品,并且可以根據(jù)這個詞在詞袋中出現(xiàn)的次數(shù)(詞頻)對召回商品進(jìn)行排序。

這種簡單的做法顯然存在著很多問題:

首先,將文本進(jìn)行分詞后得到的詞里面,并不是每個詞都可以用來做召回和排序,例如“的地得你我他”這樣的“停用詞”就該去掉,此外,一些出現(xiàn)頻率特別高或者特別低的詞也需要做特殊處理,否則會導(dǎo)致召回結(jié)果相關(guān)性低或召回結(jié)果過少等問題。

其次,使用詞頻來度量重要性也顯得合理性不足。以上面的“羽絨服”召回為例,如果在羽絨服的類別里使用“羽絨服”這個詞在商品描述中的出現(xiàn)頻率來衡量商品的相關(guān)性,會導(dǎo)致所有的羽絨服都具有類似的相關(guān)性,因?yàn)樵诿枋鲋写蠹叶紩褂妙愃茢?shù)量的該詞匯。所以我們需要一種更為科學(xué)合理的方法來度量文本之間的相關(guān)性。

除了上面的用法,我們還可以將詞袋中的每個詞作為一維特征加入到排序模型中。例如,在一個以LR為模型的CTR排序模型中,如果這一維特征的權(quán)重為w,則可解釋為“包含這個詞的樣本相比不包含這個詞的樣本在點(diǎn)擊率的log odds上要高出w”。在排序模型中使用詞特征的時候,為了增強(qiáng)特征的區(qū)分能力,我們常常會使用簡單詞袋模型的一種升級版——N-gram詞袋模型。

N-gram指的就是把N個連續(xù)的詞作為一個單位進(jìn)行處理,例如:“John likes to watch movies.Mary likes movies too.”這句話處理為簡單詞袋模型后的結(jié)果為:

["John":1, "likes":2, "to":1, "watch":1, "movies":2, "Mary":1, "too":1]

而處理為bigram(2-gram)后的結(jié)果為:

["John likes":1, "likes to":1, "to watch":1, "watch movies":1, "Mary likes":1, "likes movies":1, "movies too":1]

做這樣的處理有什么好處呢?如果將bigram作為排序模型的特征或者相似度計(jì)算的特征,最明顯的好處就是增強(qiáng)了特征的區(qū)分能力,簡單來講就是:兩個有N個bigram重合的物品,其相關(guān)性要大于有N個詞重合的物品。從根本上來講,是因?yàn)閎igram的重合幾率要低于1-gram(也就是普通詞)的重合幾率。那么是不是N-gram中的N越大就越好呢?N的增大雖然增強(qiáng)了特征的區(qū)分能力,但是同時也加大了數(shù)據(jù)的稀疏性,從極端情況來講,假設(shè)N取到100,那么幾乎不會有兩個文檔有重合的100-gram了,那這樣的特征也就失去了意義。一般在實(shí)際應(yīng)用中,bigram和trigram(3-gram)能夠在區(qū)分性和稀疏性之間取到比較好的平衡,N如果繼續(xù)增大,稀疏性會有明顯增加,但是效果卻不會有明顯提升,甚至還會有降低。

綜合來看,雖然詞袋模型存在著明顯的弊端,但是只需要對文本做簡單處理就可以使用,所以不失為一種對文本數(shù)據(jù)進(jìn)行快速處理的使用方法,并且在預(yù)處理(常用的預(yù)處理包括停用詞的去除,高頻/低頻詞的去除或降權(quán)等重要性處理方法,也可以借助外部高質(zhì)量數(shù)據(jù)對自由文本數(shù)據(jù)進(jìn)行過濾和限定,以求獲得質(zhì)量更高的原始數(shù)據(jù))充分的情況下,也常常能夠得到很好的效果。

統(tǒng)一度量衡:權(quán)重計(jì)算和向量空間模型

從上文我們看到簡單的詞袋模型在經(jīng)過適當(dāng)預(yù)處理之后,可以用來在推薦系統(tǒng)中召回候選物品。但是在計(jì)算物品和關(guān)鍵詞的相關(guān)性,以及物品之間的相關(guān)性時,僅僅使用簡單的詞頻作為排序因素顯然是不合理的。為了解決這個問題,我們可以引入表達(dá)能力更強(qiáng)的基于TF-IDF的權(quán)重計(jì)算方法。在TF-IDF方法中,一個詞t在文檔d中權(quán)重的計(jì)算方法為:

其中tft,d代表t在d中出現(xiàn)的頻次,而dft指的是包含t的文檔數(shù)目,N代表全部文檔的數(shù)目。

TF-IDF以及其各種改進(jìn)和變種(關(guān)于TF-IDF變種和改進(jìn)的詳細(xì)介紹,可參考《Introduction to Information Retrieval》的第六章。)相比簡單的TF方法,核心改進(jìn)在于對一個詞的重要性度量,例如:

  • 原始TF-IDF在TF的基礎(chǔ)上加入了對IDF的考慮,從而降低了出現(xiàn)頻率高而導(dǎo)致無區(qū)分能力的詞的重要性,典型的如停用詞。

  • 因?yàn)樵~在文檔中的重要性和出現(xiàn)次數(shù)并不是完全線性相關(guān),非線性TF縮放對TF進(jìn)行l(wèi)og縮放,從而降低出現(xiàn)頻率特別高的詞所占的權(quán)重。

  • 詞在文檔中出現(xiàn)的頻率除了和重要性相關(guān),還可能和文檔的長短相關(guān),為了消除這種差異,可以使用最大TF對所有的TF進(jìn)行歸一化。

這些方法的目的都是使對詞在文檔中重要性的度量更加合理,在此基礎(chǔ)之上,我們可以對基于詞頻的方法進(jìn)行改進(jìn),例如,可以將之前使用詞頻來對物品進(jìn)行排序的方法,改進(jìn)為根據(jù)TF-IDF得分來進(jìn)行排序。

但是除此以外,我們還需要一套統(tǒng)一的方法來度量關(guān)鍵詞和文檔,以及文檔和文檔之間的相關(guān)性,這套方法就是向量空間模型(Vector Space Model,簡稱VSM)。

VSM的核心思想是將一篇文檔表達(dá)為一個向量,向量的每一維可以代表一個詞,在此基礎(chǔ)上,可以使用向量運(yùn)算的方法對文檔間相似度進(jìn)行統(tǒng)一計(jì)算,而這其中最為核心的計(jì)算,就是向量的余弦相似度計(jì)算:

其中V(d1)和V(d2)分別為兩個文檔的向量表示。這樣一個看似簡單的計(jì)算公式其實(shí)有著非常重要的意義。首先,它給出了一種相關(guān)性計(jì)算的通用思路,那就是只要能將兩個物品用向量進(jìn)行表示,就可以使用該公式進(jìn)行相關(guān)性計(jì)算。其次,它對向量的具體表示內(nèi)容沒有任何限制——基于用戶行為的協(xié)同過濾使用的也是同樣的計(jì)算公式,而在文本相關(guān)性計(jì)算方面,我們可以使用TFIDF填充向量,同時也可以用N-gram,以及后面會介紹的文本主題的概率分布、各種詞向量等其他表示形式。只要對該公式的內(nèi)涵有了深刻理解,就可以根據(jù)需求構(gòu)造合理的向量表示。再次,該公式具有較強(qiáng)的可解釋性,它將整體的相關(guān)性拆解為多個分量的相關(guān)性的疊加,并且這個疊加方式可以通過公式進(jìn)行調(diào)節(jié),這樣一套方法很容易解釋,即使對非技術(shù)人員,也是比較容易理解的,這對于和產(chǎn)品、運(yùn)營等非技術(shù)人員解釋算法思路有很重要的意義。最后,這個公式在實(shí)際計(jì)算中可以進(jìn)行一些很高效的工程優(yōu)化,使其能夠從容應(yīng)對大數(shù)據(jù)環(huán)境下的海量數(shù)據(jù),這一點(diǎn)是其他相關(guān)性計(jì)算方法很難匹敵的。

VSM是一種“重劍無鋒,大巧不工”的方法,形態(tài)簡單而又變化多端,領(lǐng)會其精髓之后,可以發(fā)揮出極大的能量。

透過現(xiàn)象看本質(zhì):隱語義模型

前面介紹了文本數(shù)據(jù)的一些“顯式”使用方法,所謂顯式,是指我們將可讀可理解的文本本身作為了相關(guān)性計(jì)算、物品召回以及模型排序的特征。這樣做的好處是簡單直觀,能夠清晰地看到起作用的是什么,但是其弊端是無法捕捉到隱藏在文本表面之下的深層次信息。例如,“羽絨服”和“棉衣”指的是類似的東西,“羽絨服”和“棉鞋”具有很強(qiáng)的相關(guān)性,類似這樣的深層次信息,是顯式的文本處理所無法捕捉的,因此我們需要一些更復(fù)雜的方法來捕捉,而隱語義模型(Latent Semantic Analysis,簡稱LSA)便是這類方法的鼻祖之一。

隱語義模型中的“隱”指的是隱含的主題,這個模型的核心假設(shè),是認(rèn)為雖然一個文檔由很多的詞組成,但是這些詞背后的主題并不是很多。換句話說,詞不過是由背后的主題產(chǎn)生的,這背后的主題才是更為核心的信息。這種從詞下沉到主題的思路,貫穿著我們后面要介紹到的其他模型,也是各種不同文本主體模型(Topic Model)的共同中心思想,因此理解這種思路非常的重要。

在對文檔做LSA分解之前,我們需要構(gòu)造文檔和詞之間的關(guān)系,一個由5個文檔和5個詞組成的簡單例子如下:

LSA的做法是將這個原始矩陣C進(jìn)行如下形式的SVD分解:

其中U是矩陣CCT的正交特征向量矩陣,V是矩陣CTC的正交特征向量矩陣,∑k是包含前k個奇異值的對角矩陣,k是事先選定的一個降維參數(shù)。

  • 得到原始數(shù)據(jù)的一個低維表示,降低后的維度包含了更多的信息,可以認(rèn)為每個維度代表了一個主題。

  • 降維后的每個維度包含了更豐富的信息,例如可以識別近義詞和一詞多義。

  • 可以將不在訓(xùn)練文檔中的文檔d通過


    變換為新向量空間內(nèi)的一個向量(這樣的變換無法捕捉到新文檔中的信息,例如詞的共現(xiàn),以及新詞的出現(xiàn)等等,所以該模型需要定期進(jìn)行全量訓(xùn)練。),從而可以在降維后的空間里計(jì)算文檔間相似度。由于新的向量空間包含了同義詞等更深層的信息,這樣的變換會提高相似度計(jì)算的準(zhǔn)確率和召回率。

為什么LSA能具有這樣的能力?我們可以從這樣一個角度來看待:CCT中每個元素CCTi,j代表同時包含詞i和詞j的文檔數(shù)量,而CTC中每個元素CTCi,j代表文檔i和文檔j共享的詞的數(shù)量。所以這兩個矩陣中包含了不同詞的共同出現(xiàn)情況,以及文檔對詞的共享情況,通過分解這些信息得到了類似主題一樣比關(guān)鍵詞信息量更高的低維度數(shù)據(jù)。

從另外一個角度來看,LSA相當(dāng)于是對文檔進(jìn)行了一次軟聚類,降維后的每個維度可看做是一個類,而文檔在這個維度上的取值則代表了文檔對于這個聚類的歸屬程度。

LSA處理之后的數(shù)據(jù)推薦中能做什么用呢?首先,我們可以將分解后的新維度(主題維度)作為索引的單位對物品進(jìn)行索引,來替代傳統(tǒng)的以詞為單位的索引,再將用戶對物品的行為映射為對新維度的行為。這兩個數(shù)據(jù)準(zhǔn)備好之后,就可以使用新的數(shù)據(jù)維度對候選商品進(jìn)行召回,召回之后可以使用VSM進(jìn)行相似度計(jì)算,如前文所述,降維后的計(jì)算會帶來更高的準(zhǔn)確率和召回率,同時也能夠減少噪音詞的干擾,典型的,即使兩個文檔沒有任何共享的詞,它們之間仍然會存在相關(guān)性,而這正是LSA帶來的核心優(yōu)勢之一。此外,還可以將其作為排序模型的排序特征。

簡單來講,我們能在普通關(guān)鍵詞上面使用的方法,在LSA上面仍然全部可用,因?yàn)長SA的本質(zhì)就是對原始數(shù)據(jù)進(jìn)行了語義的降維,只需將其看作是信息量更豐富的關(guān)鍵詞即可。

可以看到LSA相比關(guān)鍵詞來說前進(jìn)了一大步,主要體現(xiàn)在信息量的提升,維度的降低,以及對近義詞和多義詞的理解。但是LSA同時也具有一些缺點(diǎn),例如:

  • 訓(xùn)練復(fù)雜度高。LSA的訓(xùn)練時通過SVD進(jìn)行的,而SVD本身的復(fù)雜度是很高的,在海量文檔和海量詞匯的場景下難以計(jì)算,雖然有一些優(yōu)化方法可降低計(jì)算的復(fù)雜度,但該問題仍然沒有得到根本解決。

  • 檢索(召回)復(fù)雜度高。如上文所述,使用LSA做召回需要先將文檔或者查詢關(guān)鍵詞映射到LSA的向量空間中,這顯然也是一個耗時的操作。

  • LSA中每個主題下詞的值沒有概率含義,甚至可能出現(xiàn)負(fù)值,只能反應(yīng)數(shù)值大小關(guān)系。這讓我們難以從概率角度來解釋和理解主題和詞的關(guān)系,從而限制了我們對其結(jié)果更豐富的使用。

概率的魔力:概率隱語義模型

為了進(jìn)一步發(fā)揚(yáng)隱語義模型的威力,并盡力克服LSA模型的問題,Thomas Hofmann在1999年提出了概率隱語義模型(probabilistic Latent Semantic Analysis,簡稱pLSA)。從前面LSA的介紹可以看出,雖然具體的優(yōu)化方法使用的是矩陣分解,但是從另一個角度來講,我們可以認(rèn)為分解后的U和V兩個矩陣中的向量,分別代表文檔和詞在隱語義空間中的表示,例如一個文檔的隱向量表示為(1,2,0)T, 代表其在第一維隱向量上取值為1,第二維上取值為2,第三維上取值為0。如果這些取值能夠構(gòu)成一個概率分布,那么不僅模型的結(jié)果更利于理解,同時還會帶來很多優(yōu)良的性質(zhì),這正是pLSA思想的核心:將文檔和詞的關(guān)系看作概率分布,然后試圖找出這個概率分布來,有了文檔和詞的概率分布,我們就可以得到一切我們想要得到的東西了。

在pLSA的基本假設(shè)中,文檔d和詞w的生成過程如下:

  • 以 P(d) 的概率選擇文檔d。

  • 以 P(z|d) 的概率選擇隱類z。

  • 以 P(w|z) 的概率從z生成w。

  • P(z|d)和P(w|z) 均為多項(xiàng)式分布。

將這個過程用聯(lián)合概率進(jìn)行表達(dá)得到:

圖1 pLSA的生成過程

可以看到,我們將隱變量z作為中間橋梁,將文檔和詞連接了起來,形成了一個定義良好、環(huán)環(huán)相扣的概率生成鏈條(如圖1所示)。雖然pLSA的核心是一種概率模型,但是同樣可以用類似LSI的矩陣分解形式進(jìn)行表達(dá)。為此,我們將LSI中等號右邊的三個矩陣進(jìn)行重新定義:

在這樣的定義下,原始的矩陣C仍然可以表述為C=U∑VT。這樣的對應(yīng)關(guān)系讓我們更加清晰地看到了前面提到的pLSA在概率方面的良好定義和清晰含義,同時也揭示了隱語義概率模型和矩陣分解之間的密切關(guān)系(關(guān)于概率模型和矩陣分解的密切關(guān)系可參考這篇文檔:http://www.cs.cmu.edu/~epxing/Class/10708-15/slides/LDA_SC.pdf)。在這樣的定義,隱變量z所代表的主題含義更加明顯,也就是說,我們可以明確的把一個z看作一個主題,主題里的詞和文檔中的主題都有著明確的概率含義。也正是由于這樣良好的性質(zhì),再加上優(yōu)化方法的便捷性,使得從pLSA開始,文本主題開始在各種大數(shù)據(jù)應(yīng)用中占據(jù)重要地位。

從矩陣的角度來看,LSA和pLSA看上去非常像,但是它們的內(nèi)涵卻有著本質(zhì)的不同,這其中最為重要的一點(diǎn)就是兩者的優(yōu)化目標(biāo)是完全不同的:LSA本質(zhì)上是在優(yōu)化SVD分解后的矩陣和原始矩陣之間的平方誤差,而pLSA本質(zhì)上是在優(yōu)化似然函數(shù),是一種標(biāo)準(zhǔn)的機(jī)器學(xué)習(xí)優(yōu)化套路。也正是由于這一點(diǎn)本質(zhì)的不同,導(dǎo)致了兩者在優(yōu)化結(jié)果和解釋能力方面的不同。

至此我們看到,pLSA將LSA的思想從概率分布的角度進(jìn)行了一大步擴(kuò)展,得到了一個性質(zhì)更加優(yōu)良的結(jié)果,但是pLSA仍然存在一些問題,主要包括:

  • 由于pLSA為每個文檔生成一組文檔級參數(shù),模型中參數(shù)的數(shù)量隨著與文檔數(shù)成正比,因此在文檔數(shù)較多的情況下容易過擬合。

  • pLSA將每個文檔d表示為一組主題的混合,然而具體的混合比例卻沒有對應(yīng)的生成概率模型,換句話說,對于不在訓(xùn)練集中的新文檔,pLSA無法給予一個很好的主題分布。簡言之,pLSA并非完全的生成式模型。

而LDA的出現(xiàn),就是為了解決這些問題。

概率的概率:生成式概率模型

為了解決上面提到的pLSA存在的問題,David Blei等人在2003年提出了一個新模型,名為“隱狄利克雷分配”(Latent Dirichlet Allocation,簡稱LDA),這個名字念起來頗為隱晦,而且從名字上似乎也看不出究竟是個什么模型,在這里我們試著做一種可能的解讀:

  • Latent:這個詞不用多說,是說這個模型仍然是個隱語義模型。

  • Dirichlet:這個詞是在說該模型涉及到的主要概率分布式狄利克雷分布。

  • Allocation:這個詞是在說這個模型的生成過程就是在使用狄利克雷分布不斷地分配主題和詞。

上面并非官方解釋,但希望能對理解這個模型能起到一些幫助作用。

LDA的中心思想就是在pLSA外面又包了一層先驗(yàn),使得文檔中的主題分布和主題下的詞分布都有了生成概率,從而解決了上面pLSA存在的“非生成式”的問題,順便也減少了模型中的參數(shù),從而解決了pLSA的另外一個問題。在LDA中為一篇文檔di生成詞的過程如下:

  • 從泊松分布中抽樣一個數(shù)字N作為文檔的長度(這一步并非必須,也不影響后面的過程)。

  • 從狄利克雷分布Dir(α)中抽樣一個樣本θi,代表該篇文檔下主題的分布。

  • 從狄利克雷分布Dir(β)中抽樣一組樣本Φk,代表每個主題下詞的分布。

  • 對于1到N的每個詞wn:?

    • 從多項(xiàng)式分布Multinomial(θi) 中抽樣一個主題ci,j

    • 從多項(xiàng)式分布Multinomial(Φi) 中抽樣一個詞wi,j

圖2 LDA的生成過程

忽略掉最開始選擇文檔長度的步驟,我們發(fā)現(xiàn)LDA的生成過程相比pLSA來講,在文檔到主題的分布和主題到詞的分布上面都加了一層概率,使得這兩者都加上了一層不確定性,從而能夠很自然地容納訓(xùn)練文檔中沒有出現(xiàn)過的文檔和詞,這使得LDA具有了比pLSA更好的概率性質(zhì)。

LDA的應(yīng)用

這部分我們介紹LDA在用作相似度計(jì)算和排序特征時需要注意的一些地方,然后介紹以LDA為代表的文本主題在推薦系統(tǒng)中更多不同角度的應(yīng)用。

相似度計(jì)算

上面提到LSA可以直接套用到VSM中進(jìn)行相似度計(jì)算,在LDA中也可以做類似的計(jì)算,具體方法是把文檔的主題分布值向量化然后用余弦公式進(jìn)行計(jì)算。但是把余弦相似度替換為KL divergence或Jensen–Shannon divergence效果更好,原因是LDA給出的主題分布是含義明確的概率值,用度量概率之間相似度的方法來進(jìn)行度量更為合理。

排序特征

將物品的LDA主題作為排序模型的特征是一種很自然的使用方法,但并不是所有的主題都有用。物品上的主題分布一般有兩種情況:

  • 有少數(shù)主題(三個或更少)占據(jù)了比較大的概率,剩余的主題概率加起來比較小。

  • 所有主題的概率值都差不多,都比較小。

在第一種情況下,只有前面幾個概率比較大的主題是有用的,而在第二種情況下,基本上所有的主題都沒有用。那么該如何識別這兩種情況呢?第一種方法,可以根據(jù)主題的概率值對主題做一個簡單的K-Means聚類,K選為2,如果是第一種情況,那么兩個類中的主題數(shù)量會相差較大——一個類中包含少量有用主題,另一個類包含其他無用主題;而第二種情況下主題數(shù)量則相差不大,可以用這種方法來識別主題的重要性。第二種方法,可以計(jì)算主題分布的信息熵,第一種情況對應(yīng)的信息熵會比較小,而第二種情況會比較大,選取合適的閾值也可以區(qū)分這兩種情況。

物品打標(biāo)簽&用戶打標(biāo)簽

為物品計(jì)算出其對應(yīng)的主題,以及主題下面對應(yīng)的詞分布之后,我們可以選取概率最大的幾個主題,然后從這幾個主題下選取概率最大的幾個詞,作為這個物品的標(biāo)簽。在此基礎(chǔ)上,如果用戶對該物品發(fā)生了行為,則可以將這些標(biāo)簽傳播到用戶身上。

這種方法打出的標(biāo)簽,具有非常直觀的解釋,在適當(dāng)場景下可以充當(dāng)推薦解釋的理由。例如我們在做移動端個性化推送時,可供展示文案的空間非常小,可以通過上面的方式先為物品打上標(biāo)簽,然后再根據(jù)用戶把標(biāo)簽傳播到用戶身上,在推送時將這些標(biāo)簽詞同時作為召回源和推薦理由,讓用戶明白為什么給他做出這樣的推薦。

主題&詞的重要性度量

LDA訓(xùn)練生成的主題中,雖然都有著同等的位置,但是其重要性卻是各不相同的,有的主題包含了重要的信息,有的則不然。例如,一個主題可能包含“教育、讀書、學(xué)校”等詞,和這樣主題相關(guān)的文檔,一般來說是和教育相關(guān)的主題,那么這就是一個信息量高的主題;相反,有的主題可能會包含“第一冊、第二冊、第三冊……”等詞(如果在一個圖書銷售網(wǎng)站的所有圖書上訓(xùn)練LDA,就有可能得到這樣的主題,因?yàn)橛泻芏嗵籽b圖書都包含這樣的信息),和這樣主題相關(guān)的文檔卻有可能是任何主題,這樣的主題就是信息量低的主題。

如何區(qū)分主題是否重要呢?從上面的例子中我們可以得到啟發(fā):重要的主題不會到處出現(xiàn),只會出現(xiàn)在小部分與之相關(guān)的文檔中,而不重要的主題則可能在各種文章中都出現(xiàn)。基于這樣的思想,我們可以使用信息熵的方法來衡量一個主題中的信息量。通過對LDA輸出信息做適當(dāng)?shù)淖儞Q,我們可以得到主題θi在不同文檔中的概率分布,然后我們對這個概率分布計(jì)算其信息熵,通俗來講信息熵衡量了一個概率分布中概率值分散程度,越分散熵越大,越集中熵越小。所以在我們的問題中,信息熵越小的主題,說明該主題所對應(yīng)的文檔越少,主題的重要性越高。

使用類似的方法,我們還可以計(jì)算詞的重要性,在此不再贅述。

更多應(yīng)用

除了上面提到的,LDA還有很多其他應(yīng)用,甚至在文本領(lǐng)域以外的圖像等領(lǐng)域也存在著廣泛應(yīng)用。LSA/pLSA/LDA這些主題模型的核心基礎(chǔ)是詞在文檔中的共現(xiàn),在此基礎(chǔ)上才有了各種概率分布,把握住這個核心基礎(chǔ),就可以找到文本主體模型的更多應(yīng)用。例如,協(xié)同過濾問題中,基礎(chǔ)數(shù)據(jù)也是用戶對物品的共同行為,這也構(gòu)成了文本主題模型的基礎(chǔ),因此也可以使用LDA對用戶對物品的行為進(jìn)行建模,得到用戶行為的主題,以及主題下對應(yīng)的物品,然后進(jìn)行物品/用戶的推薦。

捕捉上下文信息:神經(jīng)概率語言模型

以LDA為代表的文本主題模型通過對詞的共現(xiàn)信息的分解處理,得到了很多有用的信息,但是pLSA/LDA有一個很重要的假設(shè),那就是文檔集合中的文檔,以及一篇文檔中的詞在選定了主題分布的情況下都是相互獨(dú)立,可交換的,換句話說,模型中沒有考慮詞的順序以及詞和詞之間的關(guān)系,這種假設(shè)隱含了兩個含義:

  • 在生成詞的過程中,之前生成的詞對接下來生成的詞是沒有影響的。

  • 兩篇文檔如果包含同樣的詞,但是詞的出現(xiàn)順序不同,那么在LDA看來他們是完全相同的。

這樣的假設(shè)使得LDA會丟失一些重要的信息,而近年來得到關(guān)注越來越多的以word2vec為代表的神經(jīng)概率語言模型恰好在這方面和LDA形成了一定程度的互補(bǔ)關(guān)系,從而可以捕捉到LDA所無法捕捉到的信息。

word2vector的中心思想用一句話來講就是:A word is characterized by the company it keeps(一個詞的特征由它周圍的詞所決定)。

這是一句頗有哲理的話,很像是成語中的“物以類聚人以群分”。具體來講,詞向量模型使用“周圍的詞=>當(dāng)前詞”或“當(dāng)前詞=>周圍的詞”這樣的方式構(gòu)造訓(xùn)練樣本,然后使用神經(jīng)網(wǎng)絡(luò)來訓(xùn)練模型,訓(xùn)練完成之后,輸入詞的輸入向量表示便成為了該詞的向量表示,如圖3所示。

這樣的訓(xùn)練方式,本質(zhì)上是在說,如果兩個詞具有類似的上下文(上下文由周圍的詞組成),那么這兩個詞就會具有類似的向量表示。有了詞的向量表示之后,我們可以做很多事情,最常見的是將這一層向量表示作為更深層次模型的一個嵌入層。除了在深度學(xué)習(xí)中的使用以外,在推薦系統(tǒng)中還可以做很多其他的事情,其中之一就是做詞的聚類,以及尋找相似詞。我們知道LDA天然就可以做到詞的聚類和相似詞的計(jì)算,那么使用word2vec計(jì)算出來的結(jié)果和LDA有什么不同呢?它們之間的不同具體體現(xiàn)在兩點(diǎn):第一是聚類的粒度不同,LDA關(guān)注的主題級別的粒度,層次更高,而詞向量關(guān)注的是更低層次的語法語義級別的含義。例如“蘋果”,“小米”和“三星”這三個詞,在LDA方法中很可能會被聚類在一個主題中,但是在詞向量的角度來看,“蘋果”和“小米”可能會具有更高的相似度,就像“喬布斯”和“雷軍”在詞向量下的關(guān)系一樣,所以在詞向量中可能會有:“vector(小米)- vector(蘋果)+vector(喬布斯)= vector(雷軍)”這樣的結(jié)果。

除此以外,由于word2vec有著“根據(jù)上下文預(yù)測當(dāng)前內(nèi)容”的能力,將其做適當(dāng)修改之后,還可以用來對用戶行為喜好做出預(yù)測。首先我們將用戶的行為日志進(jìn)行收集,進(jìn)行session劃分,得到類似文本語料的訓(xùn)練數(shù)據(jù),在這個數(shù)據(jù)上訓(xùn)練word2vec模型,可以得到一個“根據(jù)上下文行為預(yù)測當(dāng)前行為”的模型。但是原始的行為數(shù)據(jù)中行為的對象常常是id級的,例如商品、視頻的id等等,如果直接放到模型中訓(xùn)練,會造成訓(xùn)練速度慢、泛化能力差等問題,因此需要對原始行為做降維,具體來說可以將行為映射到搜索詞、LDA Topic、類別等等低維度特征上,然后再進(jìn)行訓(xùn)練。例如,我們可以對用戶的搜索詞訓(xùn)練一個word2vec模型,然后就可以根據(jù)用戶的歷史搜索行為預(yù)測他的下一步搜索行為,并在此基礎(chǔ)上進(jìn)行推薦。這種方法考慮到了上下文,但是對前后關(guān)系并沒有做最恰當(dāng)?shù)奶幚?#xff0c;因?yàn)閣ord2vec的思想是“根據(jù)上下文預(yù)測當(dāng)前內(nèi)容”,但我們希望得到的模型是“根據(jù)歷史行為預(yù)測下一步行為”,這兩者之間有著微妙的差別。例如用戶的行為序列為“ABCDE”,每個字母代表對一個物品(或關(guān)鍵詞)的行為,標(biāo)準(zhǔn)的word2vec算法可能會構(gòu)造出下面這些樣本:AC→B, BD→C, CE→D… 但是我們希望的形式其實(shí)是這樣的:AB→C, BC→D,CD→E…因此,需要對word2vec生成樣本的邏輯進(jìn)行修改,使其只包含我們需要的單方向的樣本,方可在最終模型中得到我們真正期望的結(jié)果。

下面是按照該方法生成的一些預(yù)測例子:

可以看出,預(yù)測搜索詞都與歷史搜索詞有著緊密的關(guān)系,是對歷史搜索詞的延伸(例如學(xué)生書桌和烤腸機(jī)的例子)或者細(xì)化(例如小龜王和西鐵城手表的例子),具有比較好的預(yù)測屬性,是非常好的推薦策略來源。沿著這樣的思路,我們還可以對word2vec作進(jìn)一步修改,得到對時序關(guān)系更為敏感的模型,以及嘗試使用RNN、LSTM等純時序模型來得到更好的預(yù)測結(jié)果,但由于篇幅所限,在此不做展開。

文本主題模型在被提出之后,由于其良好的概率性質(zhì),以及對文本數(shù)據(jù)有意義的聚類抽象能力,在互聯(lián)網(wǎng)的各個行業(yè)中都取得了廣泛的應(yīng)用。搜索巨頭Google在其系統(tǒng)的各個方面都在廣泛使用文本主題模型,并為此開發(fā)了大規(guī)模文本主題系統(tǒng)Rephil。例如在為用戶搜索產(chǎn)生廣告的過程中,就使用了文本主題來計(jì)算網(wǎng)頁內(nèi)容和廣告之間的匹配度,是其廣告產(chǎn)品成功的重要因素之一。此外,在匹配用戶搜索詞和網(wǎng)頁間關(guān)系的時候,文本主題也可用來提高匹配召回率和準(zhǔn)確性。Yahoo!也在其搜索排序模型中大量使用了LDA主題特征,還為此開源了著名的Yahoo!LDA工具。

在國內(nèi),文本主題最著名的系統(tǒng)當(dāng)屬騰訊開發(fā)的Peacock系統(tǒng),該系統(tǒng)可以捕捉百萬級別的文本主題,在騰訊的廣告分類、網(wǎng)頁分類、精準(zhǔn)廣告定向、QQ群分類等重要業(yè)務(wù)上均起著重要的作用。該系統(tǒng)使用的HDP(Hierarchical Dirichlet Process)模型是LDA模型的一個擴(kuò)展,可智能選擇數(shù)據(jù)中主題的數(shù)量,還具有捕捉長尾主題的能力。除了騰訊以外,文本主題模型在各公司的推薦、搜索等業(yè)務(wù)中也已經(jīng)在廣泛使用,使用方法根據(jù)各自業(yè)務(wù)有所不同。

以word2vec為代表的神經(jīng)網(wǎng)絡(luò)模型近年來的使用也比較廣泛,典型的應(yīng)用如詞的聚類、近義詞的發(fā)現(xiàn)、quer y的擴(kuò)展、推薦興趣的擴(kuò)展等。Facebook開發(fā)了一種word2vec的替代方案FastText,該方案在傳統(tǒng)詞向量的基礎(chǔ)上,考慮子詞(subword)的概念,取得了比word2vec更好的效果?。

總結(jié)和展望

我們從簡單的文本關(guān)鍵詞出發(fā),沿著結(jié)構(gòu)化、降維、聚類、概率、時序的思路,結(jié)合推薦系統(tǒng)中候選集召回、相關(guān)性計(jì)算、排序模型特征等具體應(yīng)用,介紹了推薦系統(tǒng)中一些常用的自然語言處理技術(shù)和具體應(yīng)用方法。自然語言處理技術(shù)借著深度學(xué)習(xí)的東風(fēng),近年來取得了長足的進(jìn)步,而其與推薦系統(tǒng)的緊密關(guān)系,也意味著推薦系統(tǒng)在這方面仍然有著巨大的提升空間,讓我們拭目以待。


總結(jié)

以上是生活随笔為你收集整理的自然语言处理技术(NLP)在推荐系统中的应用 原2017.06.29人工智能头条 作者: 张相於,58集团算法架构师,转转搜索推荐部负责人,负责搜索、推荐以及算法相关工作。多年来主要从事推荐系统以及机的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。

婷婷五天天在线视频 | 麻豆视传媒官网免费观看 | 国产精品短视频 | 97色综合| 免费观看性生交大片3 | 国产精品美女久久久久久2018 | 成人一级在线观看 | 午夜精品一区二区三区视频免费看 | 欧美一级片在线 | 欧美精品免费在线 | 久草在线免费资源 | 国产无套视频 | 日韩精选在线 | 国产成人精品在线 | 娇妻呻吟一区二区三区 | 欧美性生活久久 | 日韩av免费一区 | 免费男女羞羞的视频网站中文字幕 | 麻豆视频在线免费看 | 欧美大片在线看免费观看 | 91自拍视频在线观看 | 欧美午夜精品久久久久 | 最近高清中文字幕 | 美国av片在线观看 | 国产精品国内免费一区二区三区 | 国产999精品久久久久久绿帽 | 黄色精品久久 | 久久99久久99免费视频 | 男女精品久久 | 国产视频在线观看一区 | 91亚洲欧美 | 91在线视频播放 | 亚洲欧美国产精品 | av不卡中文字幕 | 国产成人免费在线观看 | 久久精品视频中文字幕 | 日韩国产精品久久 | 97在线免费视频观看 | 日韩成人免费在线观看 | 国产精品视频你懂的 | 九七在线视频 | 成人资源在线观看 | 亚洲高清在线视频 | 国产第一页精品 | 不卡电影免费在线播放一区 | 99久久婷婷国产综合精品 | 国内偷拍精品视频 | 精品国产1区二区 | 日韩精品一区二区在线视频 | 97电影网站 | 97精品超碰一区二区三区 | 激情欧美一区二区三区免费看 | 激情综合一区 | 99久久夜色精品国产亚洲96 | 中文字幕国内精品 | 免费国产亚洲视频 | 国产手机在线播放 | 69夜色精品国产69乱 | 国产91在| 天天操夜夜看 | 天堂资源在线观看视频 | 成人超碰在线 | 麻豆免费在线视频 | 亚洲乱码久久久 | 日日干,天天干 | 91成人天堂久久成人 | 在线观看网站黄 | 国产美女主播精品一区二区三区 | 国产天天爽 | 久久er99热精品一区二区三区 | 韩国av在线播放 | 亚洲综合成人专区片 | 99一区二区三区 | 天天av在线播放 | 国产99在线免费 | 国产一区二区三区在线免费观看 | 欧美福利视频 | 国产精品白虎 | 97电影在线看视频 | 国产短视频在线播放 | 国产精品视频永久免费播放 | 西西444www| 日韩激情片在线观看 | 天堂在线一区二区 | 国产一区二区三区四区在线 | 日韩中文字幕免费视频 | www.狠狠操 | 激情小说网站亚洲综合网 | 欧美综合在线视频 | 日韩在线视频网 | 在线免费观看亚洲视频 | 美女网站色免费 | 美女黄色网在线播放 | 在线观看日韩免费视频 | 久久久精品影视 | av 在线观看| 六月婷色 | 天天综合狠狠精品 | 狠狠色丁香久久婷婷综合五月 | 97视频网址 | 国产区欧美| 日韩色视频在线观看 | 91香蕉视频在线 | 又黄又色又爽 | 色综合久久久久综合 | 久久视频在线看 | 日韩av片在线 | 亚洲国产日韩av | 国产精品video | 久久免费中文视频 | 国产高清不卡一区二区三区 | 天天干.com| 欧美激情视频一区二区三区免费 | 娇妻呻吟一区二区三区 | 97伊人网| 一级成人在线 | 天天色天天干天天色 | 国产精品一区二区在线免费观看 | 久久久久久久久久久久久久av | 成年人黄色免费网站 | 免费一级片观看 | 欧美久久久一区二区三区 | 免费高清在线观看电视网站 | 亚洲视频电影在线 | 亚洲综合色激情五月 | 国产又粗又长的视频 | 精品国产成人在线影院 | 亚洲精品国产精品乱码在线观看 | 国产成人一区二区精品非洲 | 在线v片| 国产偷国产偷亚洲清高 | 手机看片中文字幕 | 毛片黄色一级 | 天天干天天看 | 亚洲九九影院 | 国产成人亚洲精品自产在线 | 中文字幕在线播放一区 | 久久综合9988久久爱 | 密桃av在线 | 午夜精品福利影院 | av网站地址| 久久久久久久久久免费 | 国产无遮挡又黄又爽馒头漫画 | 在线观看亚洲免费视频 | 在线有码中文字幕 | 96精品视频| 婷香五月| 992tv人人网tv亚洲精品 | 高清在线一区 | 国产精品久久一区二区无卡 | 91高清视频免费 | 欧美少妇xx| 999视频网 | 狠狠色丁香久久综合网 | 91麻豆.com | 国产成人综合图片 | 亚洲在线视频免费 | 人人爽人人爽人人爽学生一级 | 精品国产三级 | 91看片在线免费观看 | 天天艹天天 | 日韩a级黄色片 | 成年人免费在线观看网站 | 国产精品你懂的在线观看 | 中文字幕永久免费 | 欧美性大胆 | 成人av电影在线播放 | 久青草视频| 中文字幕激情 | 摸bbb搡bbb搡bbbb| 久久蜜臀av| 国产涩涩在线观看 | 九九99 | 国产91电影在线观看 | 久久国产精品第一页 | 色婷婷视频网 | 手机在线视频福利 | 欧美一区中文字幕 | 国产免费三级在线观看 | 97超视频免费观看 | 91中文视频| 超级av在线 | 国产手机视频精品 | 欧美日韩精品在线观看视频 | 五月婷婷激情综合 | 91精品天码美女少妇 | 国产精品久久久久久久av大片 | 中文字幕欧美三区 | 欧美激情综合五月色丁香 | www·22com天天操 | 在线看黄网站 | 又紧又大又爽精品一区二区 | 精品99久久 | 国产一级高清视频 | 在线国产福利 | 国产美女久久 | 久久视频精品 | 在线视频 国产 日韩 | 99爱在线| 911免费视频| 五月婷丁香| 久草视频免费 | 欧美日韩国产精品一区二区亚洲 | 99热只有精品在线观看 | 国产在线观看91 | 在线国产专区 | 激情久久久久久久久久久久久久久久 | 国产又粗又硬又爽视频 | 免费看国产黄色 | 国产高清久久久 | 亚洲v欧美v国产v在线观看 | 日本精品视频在线播放 | 久久深夜福利免费观看 | 热久久免费视频精品 | 天天激情天天干 | 国内精品久久久久影院优 | 亚洲成人免费 | 狠狠躁夜夜a产精品视频 | 欧美a在线看| 免费精品视频在线 | 97在线精品国自产拍中文 | 久久在线视频在线 | 国产96在线观看 | 欧美 日韩 国产 成人 在线 | 五月天婷亚洲天综合网精品偷 | 国产精品2019 | 国产高清av在线播放 | 少妇精品久久久一区二区免费 | 亚洲丁香日韩 | 黄色aa久久 | 欧洲一区二区三区精品 | 日本中文在线播放 | 久久免费中文视频 | 99热在线观看免费 | 国产无吗一区二区三区在线欢 | 日韩在线 | 久久久久久蜜桃一区二区 | 国产精品久久久久一区二区三区 | 日韩久久精品一区二区 | 久久不射网站 | 一区中文字幕电影 | 97人人模人人爽人人喊网 | 91麻豆传媒 | 国产四虎在线 | 精品亚洲网 | 久久精品男人的天堂 | 超碰99在线 | 在线免费观看黄色 | 久久国产精品99久久久久久老狼 | 久久国产成人午夜av影院宅 | 欧美精品亚洲精品 | 九九九视频精品 | 亚洲美女视频在线观看 | 园产精品久久久久久久7电影 | 国产一在线精品一区在线观看 | 国产黄色片免费看 | 日韩欧美综合 | 午夜色影院 | 91看片一区二区三区 | 97久久久免费福利网址 | 久久久久久亚洲精品 | 深爱五月激情五月 | 在线观看国产成人av片 | 亚洲一区欧美激情 | 日韩成人黄色 | 91av99 | 日韩精品久久久 | 一级黄网 | 精品在线观看免费 | 欧美午夜性 | 日韩高清在线不卡 | 中文字幕在线观看免费 | 国产一及片| 午夜电影中文字幕 | 天天操天天玩 | 国产高清第一页 | 在线亚洲播放 | 精品一区在线 | 成人亚洲免费 | 伊人五月天av| 天天操天天色天天射 | 天天干天天操天天爱 | 新版资源中文在线观看 | 中文字幕在线看视频 | 日日夜夜人人精品 | 国产成人av一区二区三区在线观看 | 色噜噜日韩精品一区二区三区视频 | 51久久成人国产精品麻豆 | 亚洲天天综合网 | 久草五月 | 88av色| 午夜影视一区 | 国产伦精品一区二区三区高清 | 国产精品视频你懂的 | 国产123av | 69xx视频| 精品在线观看国产 | av成人免费在线观看 | 成人久久亚洲 | 啪啪免费视频网站 | 精品在线亚洲视频 | 欧美a性| 五月天天在线 | 5月丁香婷婷综合 | 成人国产精品电影 | 欧美日韩一区二区三区不卡 | 蜜臀av一区二区 | 免费电影一区二区三区 | 婷婷精品国产欧美精品亚洲人人爽 | 久草91视频 | 91色在线观看视频 | 国产中文自拍 | 在线看一区二区 | 久久高清视频免费 | 国产午夜精品av一区二区 | 九九综合九九 | 久久九九精品久久 | 久一网站| 欧美激情精品久久久 | 国产精品网红直播 | 超碰公开在线 | 99色免费视频 | 最近中文字幕视频完整版 | 国产电影一区二区三区四区 | 免费在线一区二区 | 国产精品久久婷婷六月丁香 | 97视频在线观看播放 | 中文字幕在线观看视频一区二区三区 | 日日夜夜91| 丁香久久 | 伊人精品在线 | 黄色网www| 亚洲 欧美 变态 国产 另类 | 天天操夜夜看 | 亚洲国产最新 | 亚洲人成免费 | 国产精品入口66mio女同 | 精品免费99久久 | 国产一区二区在线精品 | av大全在线播放 | 奇米四色影狠狠爱7777 | 黄污视频网站大全 | 黄色h在线观看 | 天天躁日日躁狠狠躁av麻豆 | 成年人黄色大片在线 | 日韩欧美电影在线 | 亚洲精品在线观看视频 | 欧美狠狠操| 国产精品久久久久久影院 | 一级片视频在线 | 日韩理论视频 | 久久超碰网 | 激情校园亚洲 | 国产精品九九九九九 | 久久激情小视频 | 亚洲一区不卡视频 | 高清av在线 | 国产亚洲激情视频在线 | 免费视频91蜜桃 | 免费美女久久99 | 最新91在线视频 | 欧美一区二区伦理片 | 国产手机精品视频 | 午夜视频在线瓜伦 | 中文字幕在线不卡国产视频 | 九九精品视频在线观看 | 久久久精品福利视频 | 国产精品久久网站 | 国产亚洲在线 | 中文字幕丝袜 | 97视频在线观看成人 | 国内精品毛片 | 久久久久久久久久久综合 | 在线免费观看黄色 | 日韩欧美在线高清 | 丁香六月五月婷婷 | 在线色亚洲 | 日韩在线激情 | 午夜电影中文字幕 | 欧美日产在线观看 | 国产在线a| 天天操夜夜操夜夜操 | 四虎影视成人永久免费观看视频 | 国产亚洲高清视频 | 久久综合狠狠综合久久综合88 | 日韩网站一区二区 | 麻豆视频在线播放 | 亚洲国产福利视频 | 久草视频免费在线播放 | 狠狠操在线 | 麻豆网站免费观看 | 在线网址你懂得 | 欧美性大战久久久久 | 精品国产乱子伦一区二区 | 国产精品欧美久久久久无广告 | 久久综合久久综合九色 | 中文字幕第一页在线视频 | 国产福利一区二区在线 | 激情丁香综合五月 | 欧美日韩国产三级 | 夜夜夜| 手机在线免费av | 99色99| 男女激情网址 | 久久深夜 | 色婷婷激情电影 | 激情综合五月 | 操久在线 | 久久99精品国产91久久来源 | 91桃色免费视频 | 国产精品成人品 | 日韩精品在线一区 | 日韩免费视频观看 | 国产精品黄网站在线观看 | 国产清纯在线 | 欧美成人h版 | 超碰免费公开 | a在线一区| 精品国产一区二区三区四区vr | 国内成人精品视频 | 男女啪啪免费网站 | 精品国产一区二区三区久久 | 国产日韩亚洲 | 久久在线免费观看视频 | 五月婷婷一区 | 精品亚洲欧美一区 | 五月婷婷在线观看 | 国产在线视频在线观看 | 欧美成人va| 又湿又紧又大又爽a视频国产 | 中文字幕色婷婷在线视频 | 天天干天天干天天操 | 成人一区影院 | 狠狠躁夜夜躁人人爽超碰91 | 亚洲精品成人在线 | 精品国内自产拍在线观看视频 | 在线播放一区二区三区 | 久久露脸国产精品 | 天天干天天草天天爽 | 日韩成人邪恶影片 | 超碰成人免费电影 | www91在线观看| 亚洲精品av中文字幕在线在线 | 天天爽夜夜爽人人爽一区二区 | 9热精品 | 999热线在线观看 | 成人在线你懂得 | 国产九九九精品视频 | 久久精品欧美一 | 日本爽妇网 | 久久精品久久精品久久39 | 亚洲男男gⅴgay双龙 | 欧美日韩中文在线观看 | 亚洲精品色视频 | 欧美日韩亚洲在线观看 | 久久久免费电影 | av在线看片| 天堂久色 | 91精品国产自产在线观看永久 | 亚洲激情 欧美激情 | 日韩免费看| 久久精品视频免费观看 | 国产精品中文字幕av | 日韩高清 一区 | 又大又硬又黄又爽视频在线观看 | 97超碰超碰 | 国产精品嫩草69影院 | 精品久久久久久久久久岛国gif | 成年人视频在线免费观看 | 久久久久女教师免费一区 | 国产黄色精品在线观看 | 91av在线免费看 | 久久综合桃花 | 高清免费在线视频 | 在线观看黄色小视频 | 国产一区久久久 | 国产又粗又猛又色 | 国产午夜三级一区二区三桃花影视 | 91av视频在线观看 | 麻豆免费在线视频 | 成人在线视频免费 | 91理论片午午伦夜理片久久 | 91看片网址 | 在线成人性视频 | 91精品久久久久久综合乱菊 | 深夜男人影院 | 亚州免费视频 | 久草精品网 | 中文字幕资源站 | 日韩有码在线播放 | 丁香花在线视频观看免费 | 夜夜天天干 | 人人草人人草 | 国产成在线观看免费视频 | 久草视频在线观 | 亚洲黄色在线观看 | 在线观看完整版免费 | 成人动漫一区二区三区 | 免费在线黄 | 婷婷六月丁香激情 | 中文字幕网址 | 在线成人免费av | 国产在线a| 一区二区三区在线电影 | 伊人久久精品久久亚洲一区 | 日本不卡视频 | 国产精品久久久久久爽爽爽 | 四虎国产精品免费 | 成人在线观看资源 | 亚洲免费公开视频 | 一区二区三区四区免费视频 | 久草视频播放 | 99热精品国产一区二区在线观看 | 亚洲精品在线一区二区 | 激情婷婷色 | h视频日本| 天天色天天干天天色 | 成人免费在线播放视频 | 欧美在线91 | 91在线蜜桃臀 | 亚洲专区中文字幕 | 伊人欧美| 免费看一及片 | 在线观看视频你懂得 | 国产欧美精品一区二区三区四区 | 日本精品视频在线观看 | av网站免费在线 | www最近高清中文国语在线观看 | 97精品一区二区三区 | 日本黄色免费在线观看 | 伊人成人激情 | 91丨九色丨蝌蚪丰满 | 国产xxxx性hd极品 | 国产a免费 | www好男人| 亚洲黄色免费电影 | 最近免费中文字幕mv在线视频3 | 国产精品久久一区二区三区, | h视频日本| 日韩电影在线视频 | 久久精品毛片基地 | 在线观看91精品国产网站 | 久久国产精品影片 | 久久高清视频免费 | 麻花豆传媒一二三产区 | 丰满少妇在线观看网站 | 国产亚洲片 | 私人av| 国产精品18久久久久久久网站 | 一区二区三区四区久久 | 91视频免费看 | 四季av综合网站 | 在线久久| www.香蕉| 国产综合在线观看视频 | 五月婷婷视频在线观看 | 在线观看黄网站 | 4438全国亚洲精品在线观看视频 | 黄色软件大全网站 | 狠狠狠的干 | 在线成人国产 | 婷婷在线网 | 婷婷综合导航 | 国产美腿白丝袜足在线av | 日韩91精品 | 亚洲六月丁香色婷婷综合久久 | 国产天天爽 | 亚洲综合五月天 | 最新动作电影 | 不卡电影免费在线播放一区 | 99久久久国产精品 | 制服丝袜天堂 | 久草在线观看资源 | 成年一级片 | 天天综合导航 | 91传媒在线播放 | 亚洲影院天堂 | 亚洲午夜精品久久久久久久久久久久 | 国产一区在线视频观看 | 日韩一区二区三区高清免费看看 | 精壮的侍卫呻吟h | 国产一级高清 | 国产精品99久久久久久有的能看 | 国产蜜臀av | 中文字幕亚洲五码 | 午夜精品剧场 | 久久视频这里只有精品 | 波多野结衣视频一区二区三区 | 久久久久综合网 | 免费av网站在线看 | 亚洲国产三级在线观看 | 久久久久亚洲精品中文字幕 | 久草网在线视频 | 激情欧美一区二区三区免费看 | 亚洲国产视频在线 | 一本一本久久a久久精品综合 | 久久久久激情电影 | 天天做天天爱天天综合网 | 精品久久一级片 | 91麻豆传媒| 99久久精| 免费观看av | 国产男女无遮挡猛进猛出在线观看 | 丁香五月网久久综合 | 综合网色 | 黄色片视频在线观看 | 日韩欧美在线视频一区二区三区 | 免费黄色网址大全 | 国产精品 999 | 国内精品视频在线 | 久久日韩精品 | 色婷婷在线视频 | 人人玩人人添人人 | 又黄又爽又无遮挡免费的网站 | 人人干在线 | 精品91 | 久久99精品久久久久久秒播蜜臀 | 欧美孕妇视频 | 国产成人免费观看久久久 | 18岁免费看片 | 日本激情视频中文字幕 | 国产无遮挡又黄又爽馒头漫画 | 天天操天天干天天操天天干 | 亚洲成人av电影在线 | 久久精品99 | 天天爱天天干天天爽 | 日韩欧美国产免费播放 | 热九九精品 | 国产九色在线播放九色 | 免费观看的黄色片 | 久久丁香| 成人动漫一区二区三区 | 成年人app网址 | 久久久久久久久艹 | 一本到在线 | 国产一区在线不卡 | 人人爽网站| 欧美在线观看视频 | 欧美国产大片 | 亚洲乱码在线 | 欧美成a人片在线观看久 | 欧美午夜剧场 | 国产高清视频免费观看 | 国产va在线| www久久| 91九色视频在线观看 | 精品久久久久久综合 | 日韩免费视频一区二区 | 久热久草 | 国产裸体bbb视频 | 久久黄色精品视频 | 国产精品成久久久久三级 | 日韩欧美国产激情在线播放 | 国模吧一区 | 久久久国产网站 | 久久婷婷国产色一区二区三区 | 九九色综合| 色婷婷电影 | 国产91av视频在线观看 | 国产日韩中文字幕在线 | 91人人澡人人爽 | 蜜桃av人人夜夜澡人人爽 | 国产 日韩 欧美 在线 | 在线观看网站av | 在线观看日本高清mv视频 | 国产精品久久久久免费 | av在线免费在线观看 | 国产999视频在线观看 | 在线观看亚洲国产 | 欧美福利视频 | 97国产在线观看 | 久久视频 | 五月综合色 | 久久久久免费精品 | 免费aa大片 | 在线观看免费国产小视频 | 在线免费观看黄色 | 国产成人福利在线 | 国产精品成久久久久三级 | 成人试看120秒| 五月激情视频 | 99久热在线精品视频观看 | 国产精品一区久久久久 | 国产精品一区二区三区在线播放 | 日韩专区视频 | 日韩在线视频不卡 | 久久免费a | 日韩一区二区在线免费观看 | 亚洲va天堂va欧美ⅴa在线 | 亚洲精品小视频在线观看 | 91中文字幕在线 | 国产精品美女久久久久久久久 | 欧美日韩99 | 久草久热 | 狠狠色狠狠色综合系列 | 日韩久久一区 | 国产123av| 成年人免费电影在线观看 | 久草在线最新免费 | 国产成人在线免费观看 | 色视频网页 | 国产夫妻性生活自拍 | 日韩91在线| 在线观看一区二区视频 | 免费在线观看av电影 | 成人免费在线观看av | av先锋中文字幕 | 黄色国产大片 | 日韩大陆欧美高清视频区 | 日本精品一区二区在线观看 | 成人av在线直播 | 超碰人在线 | 欧美激情精品 | 韩国一区二区三区在线观看 | 99国产精品久久久久久久久久 | 96久久久 | 日韩精品视频免费在线观看 | 国产视频不卡 | 精品国产电影一区 | 亚洲国产免费av | 97日日碰人人模人人澡分享吧 | 国产精品k频道 | 日本免费久久高清视频 | 欧美资源 | 久久精品毛片 | 六月婷色 | 91成年人视频 | 一区二区三区免费播放 | 久久精品a | 日韩在线观看三区 | 国产精品四虎 | 狠狠gao| 日日夜夜精品网站 | 欧美 日韩 久久 | 99欧美| www.黄色片.com| 国产精品18久久久久vr手机版特色 | 亚洲午夜电影网 | 成人a视频在线观看 | 精品欧美一区二区精品久久 | av九九| 国产日产av | 国产精品一区二区av麻豆 | 日躁夜躁狠狠躁2001 | 中文字幕视频播放 | 男女激情片在线观看 | 亚洲 欧洲 国产 日本 综合 | 久久理伦片 | 日本久久视频 | 99精品国自产在线 | 日韩精品一区二区三区电影 | 五月婷婷av在线 | 日韩在线免费高清视频 | 九九免费精品视频在线观看 | 国产成人精品一区二区三区福利 | 婷婷五天天在线视频 | 国产精品久久毛片 | 国产精品欧美在线 | 丰满少妇一级片 | 天天插天天操天天干 | 深爱开心激情 | 91在线在线观看 | 成年人国产在线观看 | 在线v片免费观看视频 | 人人舔人人舔 | av大片免费看 | 亚洲视频精品在线 | 久久精品系列 | 黄色tv视频 | 在线看片91 | 欧美日韩国产综合网 | 亚洲精品成人 | 久久开心激情 | 久久成人麻豆午夜电影 | 国产精品你懂的在线观看 | 天天做天天爱天天综合网 | 婷婷伊人五月天 | 人成免费网站 | 亚洲第一区在线观看 | 久久中文字幕导航 | 精品国偷自产在线 | 国产日韩三级 | 色综合国产 | 亚洲国产精品女人久久久 | 一级黄色片在线播放 | 色www免费视频 | 国产精品日韩在线 | 一级性视频 | 久久国产成人午夜av影院宅 | 免费看一级一片 | 亚洲精品一区二区三区在线观看 | 五月开心综合 | 夜夜骑日日 | 国产成人三级一区二区在线观看一 | 国产精品专区h在线观看 | 综合天堂av久久久久久久 | 天天av在线播放 | 91精品久| 国产免费又黄又爽 | 久久久精品网站 | 日韩精品免费一线在线观看 | 免费在线观看污网站 | 欧美激情综合网 | 天天色天天爱天天射综合 | 中文字幕一区二区三区乱码在线 | 99久久久久国产精品免费 | 天天天色 | 视频一区二区在线观看 | 日韩激情三级 | 国产精品午夜免费福利视频 | 久久免费精品国产 | 久久久免费| 国产99一区二区 | 91成人区 | 亚洲在线视频免费 | 国内精品一区二区 | 在线观看亚洲国产精品 | 色综合亚洲精品激情狠狠 | 热99在线视频 | 久久九九网站 | 国产一区二区视频在线 | 激情丁香久久 | 欧美极品裸体 | aaa日本高清在线播放免费观看 | 日韩av快播电影网 | 成人国产精品久久久久久亚洲 | 国产精品九九热 | 欧美日韩在线看 | 色资源网在线观看 | 国产主播99 | 一区二区三区观看 | 国产中文字幕精品 | 久久福利精品 | av在线免费播放 | 中文字幕在线播放一区 | 精品av在线播放 | 欧美成人久久 | 成人午夜网址 | 在线黄色免费av | 国产伦精品一区二区三区四区视频 | 丁香婷五月 | 国色天香在线观看 | 少妇bbw搡bbbb搡bbbb | 毛片无卡免费无播放器 | 狠狠色丁香久久婷婷综合_中 | 久久视频精品在线观看 | 美女又爽又黄 | 天天人人 | 国产中文字幕视频在线观看 | www久久99| 国产日韩欧美在线观看视频 | 最新影院 | 久草精品视频在线看网站免费 | 日本精品一区二区在线观看 | 久久久久久久久毛片精品 | 成片人卡1卡2卡3手机免费看 | 欧美色图东方 | 日韩精品免费一区二区在线观看 | 在线视频成人 | 日韩欧美成 | 精品免费99久久 | 在线欧美a | 国产精品高潮久久av | 婷婷伊人综合 | 超碰97免费在线 | 美女视频黄是免费的 | 久久精品女人毛片国产 | 中文字幕高清免费日韩视频在线 | 国产一级黄色免费看 | 国产成人精品一区二区三区福利 | 制服丝袜欧美 | 国产不卡在线播放 | 玖玖视频网 | www.夜夜夜 | 久亚洲 | 国产精品99久久免费黑人 | 色噜噜色噜噜 | 日韩欧美国产精品 | 精油按摩av | 激情五月婷婷激情 | 精品一区免费 | 久久国产精品视频免费看 | 国产一区二区三区免费观看视频 | 国产精品免费视频久久久 | 午夜美女福利 | 中文字幕av在线不卡 | 91丨九色丨国产丨porny精品 | 国产精品专区在线 | 欧美一区二区在线刺激视频 | 久久精品日产第一区二区三区乱码 | 亚洲婷婷综合色高清在线 | 亚洲年轻女教师毛茸茸 | 天天干 夜夜操 | 特级毛片爽www免费版 | 六月色婷| 亚洲精品国产精品国自产观看 | 日韩精品一二三 | 在线之家免费在线观看电影 | 午夜精品视频一区 | 色婷婷激婷婷情综天天 | 国产区av在线 | 808电影 | 国产成人91| 久草视频精品 | 91丨九色丨丝袜 | 成人综合婷婷国产精品久久免费 | 粉嫩高清一区二区三区 | 99精品视频在线看 | 狠狠操夜夜操 | 国内精品久久久久 | 亚洲视频999 | 日本中文字幕在线免费观看 | 国产精品人成电影在线观看 | 99c视频高清免费观看 | 亚洲视频免费 | 热re99久久精品国产66热 | 奇米网网址| 婷婷六月综合网 | 精品嫩模福利一区二区蜜臀 | 国产精品99久久久精品免费观看 | 国产在线观看黄 | 又紧又大又爽精品一区二区 | 精品黄色片 | 日日夜夜天天干 | 国产一区二区在线免费播放 | 久久精品国亚洲 | 97在线看| 亚洲精品国产综合99久久夜夜嗨 | 欧美另类亚洲 | 粉嫩aⅴ一区二区三区 | 成年人在线观看免费视频 | 日韩不卡高清视频 | 夜夜爽天天爽 | 美女天天操 | 亚洲免费观看在线视频 | 久久激情五月丁香伊人 | 操操操com | 成人午夜网址 | 麻豆视频免费在线 | 最近中文字幕国语免费av | 欧美成年黄网站色视频 | 五月婷婷在线视频 | 视频一区二区国产 | 美女视频网站久久 | 91黄色小视频 | 亚洲精品在线视频播放 | 日韩精品久久久久久 | 国产免费看| 91精品一区二区三区蜜臀 | 久草视频免费在线观看 | 97在线影视 | 黄色小说免费观看 | 日韩videos高潮hd | 狠狠色丁香婷婷综合久久片 | 国产第一页在线观看 | 99视频网站 | 日韩专区在线 | 91精品国产乱码 | 亚洲激情综合网 | 国产日韩在线一区 | 国产又粗又猛又黄 | 天天操天天摸天天爽 | 久久撸在线视频 | 国产视频导航 | 免费看黄在线网站 | 久久区二区| 天天综合婷婷 | 伊人久久精品久久亚洲一区 | 国产精品h在线观看 | 青青河边草免费 | 伊色综合久久之综合久久 | 九九热在线视频免费观看 | 丁香五月亚洲综合在线 | 亚洲午夜精品久久久 | 日韩精品免费专区 | 欧美精品在线一区二区 | 亚洲免费视频观看 | 中文字幕在线免费看 | 国产精品一区二区视频 | 日韩色在线观看 | 91久久精品一区 | 最近2019年日本中文免费字幕 | 四虎国产永久在线精品 | 99精品亚洲 | 久久大片网站 | 久久精彩 | 国产免费久久精品 | 国产在线第三页 | 极品久久久久 | 九九久久影院 | 色之综合网 | 91av大全 | 久久综合久久综合九色 | 中文字幕在线日本 | 国产精品久久久久久久久毛片 | 日韩| www.色国产| 349k.cc看片app|