日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 运维知识 > windows >内容正文

windows

推荐系统笔记:Introduction

發(fā)布時間:2025/4/5 windows 24 豆豆
生活随笔 收集整理的這篇文章主要介紹了 推荐系统笔记:Introduction 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

1? 推薦系統(tǒng)的基本模型

推薦系統(tǒng)的基本模型使用兩種數(shù)據(jù),分別是

(i)用戶-商品交互,如評級或購買行為;

(ii)關(guān)于用戶和商品的屬性信息,如文本配置文件或相關(guān)關(guān)鍵字。

使用前者的方法被稱為協(xié)同過濾(collaborative filtering)方法,而使用后者的方法被稱為基于內(nèi)容的推薦方法。

注意,基于內(nèi)容的系統(tǒng)在大多數(shù)情況下也使用交互數(shù)據(jù),盡管該模型通常關(guān)注單個用戶的評級,而不是所有用戶的評級。

在基于知識的推薦系統(tǒng)(knowledge-based)中,推薦是基于明確指定的用戶需求。不使用歷史評級或購買數(shù)據(jù),而是使用外部知識庫和約束來創(chuàng)建推薦。

一些推薦系統(tǒng)將這些不同的方面結(jié)合起來,形成混合系統(tǒng)。混合系統(tǒng)可以結(jié)合各種類型的推薦系統(tǒng)的優(yōu)勢,創(chuàng)建能夠在各種設(shè)置中更穩(wěn)健地執(zhí)行的技術(shù)。

1.1 協(xié)同過濾模型

????????協(xié)同過濾模型利用多個用戶提供的打分進行推薦。

????????設(shè)計協(xié)同過濾方法的主要挑戰(zhàn)是底層的評級矩陣是稀疏的

????????考慮一個電影應(yīng)用程序的例子,在這個應(yīng)用程序中,用戶通過打分表明他們喜歡或不喜歡特定的電影。大多數(shù)用戶只會觀看大量可用電影中的一小部分。因此,大多數(shù)評級都是缺失的。

????????協(xié)同過濾方法的基本思想是,這些缺失的打分可以補全,因為觀察到的打分通常在不同用戶和項目之間高度相關(guān)

????????例如,考慮兩個名為Alice和Bob的用戶,如果兩者都打分了的電影的評級非常相似,那么我們可以認為這兩個用戶的品味很相似。在這種情況下,如果某部電影只有一個用戶打分,那另一個用戶的預(yù)測打分很有可能也會接近這個觀測到的打分。

????????這種相似性可以用來推斷缺失的值。

????????大多數(shù)協(xié)同過濾模型關(guān)注于利用預(yù)測過程中的項間相關(guān)性(inter-item)或用戶間相關(guān)性(inter-user)。有些模型使用兩種類型的相關(guān)性。

????????此外,一些模型使用精心設(shè)計的優(yōu)化技術(shù)來創(chuàng)建訓(xùn)練模型,就像分類器從標(biāo)簽數(shù)據(jù)中創(chuàng)建訓(xùn)練模型一樣。

????????然后使用這個模型來補全輸入矩陣中缺失的值,就像分類器輸入缺失的測試標(biāo)簽一樣。

????????協(xié)同過濾中常用的方法有兩種,分別是基于記憶的方法基于模型的方法:

1.1.1? 基于記憶的方法

????????基于記憶的方法也稱為基于鄰居的協(xié)同過濾算法。這是最早的協(xié)同過濾算法之一,在這種算法中,用戶-物品組合的評級是基于他們的鄰居來預(yù)測的。

????????這些社區(qū)可以通過以下兩種方式定義:

  • 基于用戶user的協(xié)同過濾:

? ? ? ?在這種情況下,使用目標(biāo)用戶 A 的“志同道合”的用戶提供的評分來為 A 做出推薦。

???????? 因此,基本思想是確定與目標(biāo)用戶 A相似的用戶 ,并通過計算該組評分的加權(quán)平均值,為 A 未觀察到的評分推薦評分。

????????因此,如果 Alice ,Carol和 Bob 過去曾以類似的方式對電影進行評分,那么可以使用 Alice 和 Carol?在某部電影上觀察到的評分來預(yù)測 Bob 在這部電影上未觀察到的評分。、

?????????通常,可以使用與 Bob 最相似的 k 個用戶來對 Bob 進行評分預(yù)測。

???????? 在評分矩陣的行之間計算相似性函數(shù)以發(fā)現(xiàn)相似的用戶

  • 基于項目item的協(xié)同過濾:

????????為了對用戶 A 對目標(biāo)項目 B 進行評分預(yù)測,第一步是確定與目標(biāo)項目 B 最相似的項目集 S。

????????項目集 S 中的評分為 由 A 指定,用于預(yù)測用戶 A 是否會喜歡項目 B。

? ? ? ? ?比如,Bob 在 Alien 和 Predator 等類似科幻電影中的評分可以用來預(yù)測他對 Terminator 的評分。

????????在評分矩陣的列之間計算相似性函數(shù)以發(fā)現(xiàn)相似的項目。

?????????基于記憶的技術(shù)的優(yōu)勢在于它們易于實現(xiàn),并且產(chǎn)生的推薦通常易于解釋。

????????另一方面,基于內(nèi)存的算法在稀疏打分矩陣上效果不佳

????????例如,可能很難找到與給電影A評分的、和用戶 Bob 足夠相似的用戶。

???????? 在這種情況下,很難可靠地預(yù)測Bob對電影A的評分。

???????? 換句話說,這些方法可能缺乏對評級預(yù)測的全面覆蓋

????????然而,當(dāng)只需要前 k 個項目時,缺乏覆蓋通常不是問題。

1.1.2?基于模型的方法

????????在基于模型的方法中,機器學(xué)習(xí)和數(shù)據(jù)挖掘方法被使用。?

??????這種基于模型的方法的一些示例包括決策樹、基于規(guī)則的模型(rule-based)、貝葉斯方法和潛在因素模型(latent factor model)。

????????許多這些方法,例如潛在因子模型,即使對于稀疏評級矩陣也具有很高的覆蓋率。 ?

1.1.3 協(xié)同過濾 與 回歸&分類

????????協(xié)同過濾方法可以被視為分類和回歸建模的延申。

????????在分類和回歸建模問題中,因變量y可以被視為具有缺失值的屬性。其他列被視為特征/自變量。

????????協(xié)同過濾問題可以看作是這個框架的延申,因為任何列都可以有缺失值,而不是(僅)類變量。在推薦問題中,類變量和特征變量之間沒有明顯的區(qū)別,因為每個特征都扮演著因變量和自變量的雙重角色。

????????此外,協(xié)同過濾中的訓(xùn)練行和測試行沒有區(qū)別,因為任何行都可能包含缺失的條目。

????????因此,在協(xié)同過濾中談?wù)撚?xùn)練和測試條目比訓(xùn)練和測試更有意義。

????????分類/回歸建模和協(xié)同過濾之間的這種關(guān)系很重要,因為分類和回歸建模方法的許多原則可以推廣到推薦系統(tǒng)。

? ? ? ? 還有一點不同的是,在分類/回歸任務(wù)重,列代表不同的特征維度,行代表不同的數(shù)據(jù)樣本。但是在協(xié)同過濾中,對user-item矩陣/它的轉(zhuǎn)置用同樣的一種算法可能是可行的(因為可能只是從user-based 轉(zhuǎn)換成了 item-based)?

1.2 基于內(nèi)容的推薦系統(tǒng)

????????在基于內(nèi)容的推薦系統(tǒng)中,項目的描述性屬性用于進行推薦。

???????? “內(nèi)容”指的就是這些描述。 在基于內(nèi)容的方法中,用戶的評分和購買行為與項目中可用的內(nèi)容信息相結(jié)合。

????????例如,考慮這樣一種情況,Bob對電影A的評價很高,但我們無法訪問其他用戶的評價。 因此,排除了協(xié)同過濾方法。

????????但是,電影A的項目描述包含與其他科幻電影類似的類型關(guān)鍵字。 在這種情況下,這些其他科幻電影可以推薦給Bob。 ?

????????當(dāng)某一個項目沒有足夠的評分數(shù)據(jù)時,基于內(nèi)容的方法在為新項目推薦方面具有一些優(yōu)勢。 ????????這是因為其他具有相似屬性的項目可能已被活動用戶評分。

????????因此,即使沒有該項目的評分歷史,監(jiān)督模型也能夠?qū)⑦@些評分與項目屬性結(jié)合起來進行推薦。(以基于內(nèi)容的協(xié)同過濾作為對比,無論是基于用戶還是基于item,新項目都很難推薦到)

????????基于內(nèi)容的方法也有幾個缺點

???????? 1. 不具備一定外推的能力。例如,如果用戶從未使用過具有特定關(guān)鍵字集的商品,則此類商品沒有機會被推薦。這種現(xiàn)象往往會降低推薦項目的多樣性,這是不可取的。

????????2. 盡管基于內(nèi)容的方法在為新項目提供推薦方面有效,但在為新用戶提供推薦方面效果不佳。這是因為目標(biāo)用戶的訓(xùn)練模型需要使用她的評分歷史。事實上,為目標(biāo)用戶提供大量可用的評分通常很重要,以便在不過擬合的情況下進行穩(wěn)健的預(yù)測。

???????? 因此,基于內(nèi)容的方法與協(xié)同過濾系統(tǒng)有不同的權(quán)衡。 ?

?????????有時會使用更廣泛的內(nèi)容。例如,用戶可以在自己的配置文件中指定相關(guān)的關(guān)鍵字。這些配置文件可以與項目描述相匹配,以便提出建議。這種方法在推薦過程中不使用評級。

????????然而,這種方法通常被視為一類獨特的推薦系統(tǒng),稱為基于知識的系統(tǒng),因為相似度指標(biāo)通常基于領(lǐng)域知識 domain knowledge

????????基于知識的推薦系統(tǒng)通常被認為與基于內(nèi)容的推薦系統(tǒng)密切相關(guān),有時人們會懷疑這兩類方法之間是否存在明確的界限。

1.3 基于知識的推薦系統(tǒng)

????????基于知識的推薦系統(tǒng)在不經(jīng)常購買的物品的情況下特別有用。包括房地產(chǎn)、汽車、旅游請求、金融服務(wù)或昂貴的奢侈品等項目。

????????在這種情況下,推薦過程可能無法獲得足夠的評級。由于物品很少購買,并且具有不同類型的詳細選項,因此很難為手頭物品的特定實例(即選項組合)獲得足夠數(shù)量的評分。

????????此外,在處理此類物品時,消費者偏好的性質(zhì)可能會隨著時間的推移而演變。例如,汽車的模型可能會在幾年內(nèi)發(fā)生顯著變化,因此偏好可能會顯示出相應(yīng)的變化。

????????在其他情況下,可能很難用評級等歷史數(shù)據(jù)來完全捕捉用戶的興趣。特定項目可能具有與其相關(guān)聯(lián)的屬性,并且用戶可能只對特定項目的這一屬性感興趣。比如一個人可能喜歡紅顏色的車,綠顏色的帽子(大霧),那么不能可能就不能用某人對帽子顏色的打分數(shù)據(jù)來對汽車的顏色打分。

????????這種情況可以通過基于知識的推薦系統(tǒng)來解決,其中評級不用于推薦。

????????相反,推薦過程是基于客戶需求和項目描述之間的相似性

????????知識庫的使用促進了該過程,其中包含有關(guān)在檢索過程中使用的規(guī)則相似性函數(shù)的數(shù)據(jù)。知識庫對于方法的有效運行非常重要,需求的明確導(dǎo)致用戶對推薦過程的更大控制。

????????在協(xié)同過濾和基于內(nèi)容的系統(tǒng)中,推薦完全由用戶過去的動作/評分、其他人的動作/評分或兩者的組合決定。

????????基于知識的系統(tǒng)的獨特之處在于它們允許用戶明確指定他們想要什么。 ?

方法目標(biāo)輸入內(nèi)容
協(xié)同過濾根據(jù)目標(biāo)用戶/其他用戶的打分,進行推薦用戶打分
基于內(nèi)容根據(jù)過去打分和動作的內(nèi)容,進行推薦用戶打分+條目屬性
基于知識根據(jù)我對物品的顯示要求,進行推薦

用戶屬性

物品屬性

領(lǐng)域知識

1.3.1 基于約束的推薦系統(tǒng)

????????在基于約束的系統(tǒng)中,用戶通常指定項目屬性的要求或約束(例如,下限或上限)。

????????特定領(lǐng)域的規(guī)則(domain-specific rules)用于將用戶需求與項目屬性相匹配。這些規(guī)則代表系統(tǒng)使用的特定領(lǐng)域知識。此類規(guī)則可以采用對項目屬性的約束的形式(例如,“1970 年之前的汽車沒有巡航控制。”)。

????????此外,基于約束的系統(tǒng)通常會創(chuàng)建將用戶屬性與項目屬性相關(guān)聯(lián)的規(guī)則(例如,“老年投資者不投資超高風(fēng)險產(chǎn)品。”)。

????????根據(jù)返回結(jié)果的數(shù)量和類型,用戶可能有機會修改他們的原始需求。例如,當(dāng)返回的結(jié)果太少時,他們可能會放寬一些約束,或者他們可能會添加更多約束。這個搜索過程交互地重復(fù),直到用戶到達她想要的結(jié)果。

?1.3.2 基于案例的推薦系統(tǒng)

? ? ? ? 在基于案例的推薦系統(tǒng)中,特定案例由用戶指定為目標(biāo)或錨點

???????? 在項目屬性上定義相似性度量以檢索與這些案例相似的項目。相似性度量通常以特定于域的方式進行定義。 因此,相似性度量形成了在此類系統(tǒng)中使用的領(lǐng)域知識。

???????? 返回的結(jié)果通常用作新的目標(biāo)案例,并由用戶進行一些交互修改。 例如,當(dāng)用戶看到與他們想要的幾乎相似的返回結(jié)果時,他們可能會重新發(fā)出具有該目標(biāo)的查詢,根據(jù)用戶的喜好更改了一些屬性。 該交互過程用于引導(dǎo)用戶找到感興趣的項目。

1.3.3 和基于內(nèi)容的推薦系統(tǒng)的區(qū)別

????????值得注意的是,基于知識和基于內(nèi)容的系統(tǒng)都顯著依賴于項目的屬性。

????????由于使用了內(nèi)容屬性,基于知識的系統(tǒng)繼承了一些與基于內(nèi)容的系統(tǒng)相同的缺點。 例如,就像基于內(nèi)容的系統(tǒng)一樣,基于知識的系統(tǒng)中的推薦有時可能很明顯,因為沒有利用社區(qū)(即同行)評級的使用。

????????事實上,基于知識的系統(tǒng)有時被認為是基于內(nèi)容的系統(tǒng)的“表親”。 主要區(qū)別在于,基于內(nèi)容的系統(tǒng)從過去的用戶行為中學(xué)習(xí),而基于知識的推薦系統(tǒng)根據(jù)他們的需求和興趣的主動用戶規(guī)范進行推薦。 因此,在大多數(shù)推薦文獻中,基于知識的推薦被認為是與基于內(nèi)容的推薦不同的類別

1.3.4 基于效用的推薦系統(tǒng)

????????在基于效用的推薦系統(tǒng)中,效用函數(shù) utility function 定義在產(chǎn)品特征上,以計算用戶喜歡該項目的概率 。

????????基于效用的方法的核心挑戰(zhàn)是為手頭的用戶定義合適的效用函數(shù)。 值得注意的是,所有推薦方案,無論是協(xié)同過濾、基于內(nèi)容還是基于知識的方法,都根據(jù)目標(biāo)用戶的感知價值(或效用)對推薦項目進行隱式排名。

????????在基于效用的系統(tǒng)中,該效用值基于先驗已知的函數(shù)。 從這個意義上說,這些功能可以看作是一種外部知識。

????????因此,基于效用的系統(tǒng)可以被視為基于知識的推薦系統(tǒng)的一個特定案例。?

2 混合推薦系統(tǒng)

????????上述三個系統(tǒng)利用不同的輸入源,它們可能在不同的場景中運行良好。

???????? 例如,協(xié)同過濾系統(tǒng)依賴于社區(qū)評分,基于內(nèi)容的方法依賴于文本描述和目標(biāo)用戶自己的評分,而基于知識的系統(tǒng)依賴于在知識庫上下文中與用戶的交互。?

???????? 值得注意的是,這些不同的系統(tǒng)使用不同類型的輸入,并具有不同的優(yōu)勢和劣勢。 一些推薦系統(tǒng),例如基于知識的系統(tǒng),在大量數(shù)據(jù)不可用的冷啟動設(shè)置中更有效。 當(dāng)有大量數(shù)據(jù)可用時,其他推薦系統(tǒng)(例如協(xié)同過濾)會更有效。

?????????在有更多輸入可用的許多情況下,可以靈活地為同一任務(wù)使用不同類型的推薦系統(tǒng)。 在這種情況下,存在許多混合的機會,在這種情況下,來自不同類型系統(tǒng)的各個方面被結(jié)合起來以實現(xiàn)所有領(lǐng)域的最佳效果。

3?推薦系統(tǒng)中特定領(lǐng)域的挑戰(zhàn)

3.1 基于上下文的推薦系統(tǒng)

? ? ? ??基于上下文或上下文感知的推薦系統(tǒng)在提出建議時會考慮各種類型的上下文信息。 此類上下文信息可能包括時間、位置或社交數(shù)據(jù)。 例如,零售商推薦的衣服類型可能取決于季節(jié)和客戶所在的位置。 另一個例子是特定類型的節(jié)日或假期影響潛在客戶活動的情況。

????????人們普遍觀察到,使用此類上下文信息可以大大提高推薦過程的有效性。 基于上下文的推薦系統(tǒng)非常強大,因為其基本思想與各種特定于領(lǐng)域的設(shè)置相關(guān)。

3.2 時間敏感的推薦系統(tǒng)

????????在許多情況下,對項目的推薦可能會隨著時間而變化。例如,電影上映時的推薦可能與幾年后收到的推薦大不相同。在這種情況下,在推薦過程中加入時間知識是極其重要的。

????????此類推薦系統(tǒng)中的時間信息可以通過以下幾種方式反映出來:

1. 一個項目的評分可能會隨著時間的推移而變化

?2. 項目的評級可能取決于一天中的特定時間、星期幾、月份或季節(jié)例如,在夏季推薦冬季服裝或在旱季推薦雨衣就沒有什么意義。

????????第一種推薦系統(tǒng)是通過在協(xié)同過濾系統(tǒng)中將時間作為顯式參數(shù)而創(chuàng)建的。(原來可能是Alice對A的打分、Alice對B的打分這樣。現(xiàn)在是Alice在12點對A的打分、Alice在13點對A的打分、Alice在12點對B的打分、Alice在13點對B的打分這樣)

????????第二種類型可以看作是基于上下文的推薦系統(tǒng)的特例

????????時間推薦系統(tǒng)具有挑戰(zhàn)性,因為評分矩陣是稀疏的,并且特定時間上下文的使用加劇了稀疏問題。因此,大型數(shù)據(jù)集尤為重要。

3.3 基于地點的推薦系統(tǒng)

????????隨著支持 GPS 的移動電話的日益普及,消費者通常對基于位置的推薦感興趣。例如,旅行用戶可能希望基于她之前對其他餐廳的評級歷史來確定最近的餐廳。(類似于大眾點評)

??????此類系統(tǒng)共有兩種類型的空間局部性:

1. 用戶特定位置:用戶的地理位置在她的偏好中起著重要作用。例如,來自上海的用戶可能與來自北京的用戶具有不同的偏好。這種類型的位置被稱為偏好位置。

2. 特定于物品的位置:物品的地理位置(例如,餐廳)可能會影響物品的相關(guān)性,具體取決于用戶的當(dāng)前位置。用戶通常不愿意選擇離他們當(dāng)前位置很遠的地方。

????????偏好地點和旅行地點的算法完全不同。前者更接近于上下文敏感的系統(tǒng),而后者通常被設(shè)計為特別啟發(fā)式。由于移動電話和其他支持 GPS 的設(shè)備的日益普及,基于位置的推薦系統(tǒng)近年來受到越來越多的關(guān)注。

3.4 社交推薦

????????社交推薦系統(tǒng)基于網(wǎng)絡(luò)結(jié)構(gòu)、社交線索和標(biāo)簽,或這些不同網(wǎng)絡(luò)方面的組合。 一般來說,基于社交線索和標(biāo)簽的推薦系統(tǒng)與網(wǎng)絡(luò)純粹基于結(jié)構(gòu)方面的推薦系統(tǒng)略有不同。 純粹基于網(wǎng)絡(luò)結(jié)構(gòu)方面的推薦系統(tǒng)用于推薦網(wǎng)絡(luò)本身內(nèi)的節(jié)點和鏈接。 另一方面,社交推薦系統(tǒng)也可用于通過社交線索推薦各種產(chǎn)品。

4 其他內(nèi)容

4.1?推薦系統(tǒng)中的冷啟動問題

????????推薦系統(tǒng)的主要問題之一是最初可用的評分數(shù)量相對較少。 在這種情況下,應(yīng)用傳統(tǒng)的協(xié)同過濾模型變得更加困難。 雖然在這種情況下,基于內(nèi)容和基于知識的方法比協(xié)作模型更穩(wěn)健,但此類內(nèi)容或知識可能并不總是可用。 因此,已經(jīng)設(shè)計了許多特定方法來改善推薦系統(tǒng)背景下的冷啟動問題。

4.2?抗攻擊推薦系統(tǒng)

????????推薦系統(tǒng)的使用對各種產(chǎn)品和服務(wù)的銷售有重大影響。因此,產(chǎn)品和服務(wù)的賣家有很大的經(jīng)濟動機來操縱推薦系統(tǒng)的輸出。

????????這種操縱的一個例子是向推薦系統(tǒng)提交他們自己產(chǎn)品的夸大評級。惡意競爭對手可能會對競爭對手的產(chǎn)品提交有偏見的負面評論。

????????這種攻擊是非常不可取的,因為它們會降低推薦系統(tǒng)的整體有效性并降低合法用戶的體驗質(zhì)量。因此,需要在存在此類攻擊的情況下啟用可靠推薦的方法。

4.3?群組推薦系統(tǒng)

????????傳統(tǒng)推薦系統(tǒng)的一個有趣的擴展是群組推薦系統(tǒng)的概念。在這種情況下,推薦系統(tǒng)被定制為向一組用戶而不是單個用戶推薦特定活動

????????示例可能包括一群人觀看電影或電視、在健身中心選擇音樂或向一群游客推薦旅行。

????????最早的推薦系統(tǒng)聚合個人用戶偏好,以創(chuàng)建群組推薦。然而,多年來的共識已經(jīng)演變成設(shè)計推薦系統(tǒng),這比它們各部分的總和更好,并且可以在設(shè)計推薦時考慮不同用戶之間的交互

????????當(dāng)群體中包含具有不同品味的用戶時,簡單的平均策略效果不佳。這是因為用戶往往會基于社會心理學(xué)現(xiàn)象,例如情緒傳染和從眾,對彼此的品味產(chǎn)生影響。

4.4?多標(biāo)準(zhǔn)推薦系統(tǒng)

????????在多標(biāo)準(zhǔn)系統(tǒng)中,單個用戶可能基于不同的標(biāo)準(zhǔn)來指定評級。

????????例如,用戶可能會根據(jù)情節(jié)、音樂、特效等對電影進行評分。

????????此類技術(shù)通常通過將用戶對項目的效用建模為對應(yīng)于各種標(biāo)準(zhǔn)的評分向量來提供推薦。

????????在多標(biāo)準(zhǔn)推薦系統(tǒng)中,僅使用總體評分與傳統(tǒng)推薦系統(tǒng)相結(jié)合通常會獲得誤導(dǎo)性結(jié)果。例如,如果兩個用戶對一部電影的總體評分相同,但他們對情節(jié)和音樂的組成評分非常不同,那么從基于相似性的協(xié)同過濾算法的角度來看,這兩個用戶不應(yīng)該被認為是相似的。

4.5?推薦系統(tǒng)中的主動學(xué)習(xí)

????????推薦系統(tǒng)的一個主要挑戰(zhàn)是獲得足夠的評分以進行可靠的預(yù)測。

????????評分矩陣的稀疏性仍然是推薦系統(tǒng)有效運行的重大障礙。獲得足夠的評分可以減少稀疏問題。各種現(xiàn)實世界的推薦系統(tǒng)都有鼓勵用戶輸入評分以填充系統(tǒng)的機制。例如,可能會向用戶提供對某些項目進行評級的激勵。

????????一般來說,由于獲取過程的成本較高,往往很難從單個用戶那里獲得過多的評分。因此,必須明智地選擇要由特定用戶評分的項目

????????例如,如果用戶已經(jīng)對很多動作片進行了評分,那么要求用戶對另一部動作片進行評分對預(yù)測其他動作片的評分沒有多大幫助,對于預(yù)測屬于不相關(guān)類型的電影的評分幫助更小.

????????另一方面,要求用戶對打分人次較少的類型的電影進行評分將有助于預(yù)測屬于該類型的電影的評分。當(dāng)然,如果要求用戶對不相關(guān)的電影進行評分,則她沒有必要提供反饋,因為她可能根本沒有看過那部電影。因此,在推薦系統(tǒng)的主動學(xué)習(xí)問題中存在許多有趣的權(quán)衡,這些在分類等其他問題領(lǐng)域中是沒有遇到的。

參考資料

Sci-Hub | Recommender Systems | 10.1007/978-3-319-29659-3

總結(jié)

以上是生活随笔為你收集整理的推荐系统笔记:Introduction的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。