日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > windows >内容正文

windows

有福利! 好书推荐:从《实用推荐系统》学习寻找用户行为之法

發布時間:2024/7/5 windows 30 豆豆
生活随笔 收集整理的這篇文章主要介紹了 有福利! 好书推荐:从《实用推荐系统》学习寻找用户行为之法 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

大多數關于推薦系統的圖書都講述了算法及其優化方法。這些書都認為你已經有了一個大的數據集來供算法使用。數據集不會像變魔術那樣憑空出現。要想收集到正確的用戶偏好數據,就需要投入精力和進行思考。它會成就你的系統,或者搞砸你的系統。“垃圾進,垃圾出。”(Garbage in, garbage out.)這句著名的編程箴言對于推薦系統同樣適用。

? ? ? ?遺憾的是,適用于某個系統的數據可能不適用于另一個系統。出于這個原因,我們將認真討論可用的用戶行為數據,以及如何在你自己的站點中收集數據。

用戶參與度高的網站使其擁有者能夠收集到大量相關的數據,而大多數只有一次性訪客的網站則需要重點關注內容之間的關系。如果你沒有一個擁有大量用戶交互的流媒體服務來收集數據,也不要失望,很可能還有很多其他可以收集的東西。

理想情況下,推薦系統收集用戶與內容交互時的所有數據,包括測量大腦活動、接觸商品時血液中釋放的腎上腺素或用戶手上出汗的程度。我們的生活連接得越緊密,這種場景聽起來就越現實。

在電影《機器人瓦力》(WALL-E)中,人類變成一種沒有形狀的東西,一生都活在屏幕前的一把椅子上,所有跟他們有關的東西都被輸入計算機(想想看,我大部分時間都坐在屏幕前,但至少我會在屏幕之間移動)。由于大多數人除了被連接到推薦系統之外還有其他事要做,因此我們需要降低一些期望值。但是通過網絡,我們比任何實體店都更接近用戶,所以我們可以了解到更多東西。

內容與提供商的關系

分類法中有一個維度就是目的。目的很重要,因為它可能會產生用來計算推薦的特定策略,以及你想要推薦的內容。

我們拿一部電影來舉例子 :如果你在 Netflix 上看了一部糟糕的電影,它會告訴你一些關于?Netflix?上的內容質量的事情,因此你會認為?Netflix?有些方面做得不夠好。如果亞馬遜出售了一部糟糕電影的藍光光盤,你可能不會認為這是亞馬遜的錯,但是如果你在亞馬遜上找這部電影卻找不到,你就會認為這是亞馬遜的錯了。

Netflix?的目的是展示你喜歡的好電影。亞馬遜向你展示要買的東西,但你是否喜歡它們并不重要。要說亞馬遜完全不在意你是否喜歡也不公平,畢竟它在推動用戶寫評論和給內容打分上投入了大量資源,但為了舉例,我們假設它是這樣的。

一、捕獲訪客印象

為了更好地說明費者 - 商品關系生命周期中發生的事件,我將其分為以下步驟,如下圖所示。

1?消費者瀏覽網站。就像在實體店一樣,消費者會四處看看店里有什么,他們沒有明確的目標。需要注意的是消費者在哪些地方停留并表現出興趣。

2?消費者對一種或多種商品感興趣。這有可能是消費者從一開始就知道他在尋找特定的東西,也可能是偶然間產生的興趣。

3?消費者將商品添加到購物車或待購清單中。

4?消費者購買商品。

5?消費者消費商品。例如,觀看電影或閱讀書籍。如果這個商品是一次旅行,那么消費者會踏上旅程

6?消費者為商品評分。有時候消費者會返回商店 / 網站為商品評分。

7?消費者轉售或以其他方式處置商品。商品的使用壽命已經結束,它被處理、刪除或轉售 ;在這種情況下,商品可能會再次經歷相同的循環

稍后我們將探討在這些步驟中可以收集到什么。但是請注意,明確的反饋是以評分的方式在第 6 步或之后的步驟中完成的。這已經到了整個過程的后期。因此,如果人們通常談論的第一件事是商品評分,你應該在這之前準備好數據(比如默認的初始的評分)。

二、可以從瀏覽者身上學到什么

現在我們來詳細解讀上圖中第 1~3 步中發生的事情。瀏覽者也就是瀏覽內容的消費者。他們可能會隨機地瀏覽許多不同的內容,但往往會在相關或感興趣的內容上停頓。在實體商店中,瀏覽者在店中漫步,沒有表現出任何方向或目的。從某種意義上說,消費者正在為其日后的購買收集情報。

瀏覽者

瀏覽者就是一個瀏覽內容的消費者。正如我之前所說的,瀏覽者應該盡可能多地接觸不同的事物,而系統的推薦應該反映出這一點。如果你能將一個訪客界定為瀏覽者,那么你就可以利用這些信息來生成適合這種氛圍的推薦。

這里你需要收集的數據是瀏覽者在何處停留和研究商品。同樣值得跟蹤的是瀏覽者看過哪些內容而這些卻沒有引起他的興趣。但是你能確定頁面視圖(商品視圖)總是正確的嗎?

頁面視圖

電商網站中的頁面視圖(page view)可能意味著很多事情。它可以識別出訪客(或瀏覽者)對網站感興趣,也可以識別出那些人在網站中迷路或在隨意單擊。在后一種情況下,大部分的單擊不是積極的。迷路的用戶會在訪問網站時有很多次單擊行為但沒有產生任何轉化。

另一方面,一個優秀的推薦系統可以減少頁面瀏覽量。這是因為人們可以從推薦的鏈接和商品中找到他們想要的一切,而無須先到處瀏覽。

頁面持續時間

要確定瀏覽你網站的訪客對什么內容感興趣,可以測量他在內容頁面持續停留的時間。但這種方法夠直截了當嗎?如果你假設用戶沒有做任何其他事情,那么接下來他要做的就是通過當前頁面上的鏈接跳轉到一個新頁面。表 2.3 給出了一種方法,解釋了瀏覽者在頁面上所花時間的可能含義。

你可以調整頁面持續時間以適應你的業務領域,但我認為大多數人會同意上面這些解釋應該是正確的。哪些數據值得保留下來?好吧,所有都值得。停留不到 5秒表明不喜歡,5 秒到 1 分鐘可能意味著用戶“感興趣”,1~5 分鐘可能意味著用戶認為“這很棒”,5 分鐘及以上就很難說了。所有這些都取決于頁面的內容。這不是一門精確的科學。

擴展單擊

除了頁面持續時間之外,還有其他方法可以記錄用戶對內容的興趣。添加小控件交互,能幫助你確定用戶在做什么。例如,網站經常使用指向更多信息的鏈接,如圖 2.4 所示。這對用戶來說很方便,如果他們感興趣,他們可以快速瀏覽或擴展鏈接。同樣,用戶可以向下滾動查看評論或技術細節。如果用戶執行了其中的某個操作,就可以認為他對此感興趣。

社交媒體鏈接

你還可以為那些非常喜歡某件東西、希望與其他人分享的人添加社交媒體按鈕(參見下圖)。你不能控制在 Facebook、Twitter 或其他社交媒體網站上發生的事情,但是你可以收集用戶分享某件東西的事件。

保存以備后用

“保存以備后用”(Save for Later)的功能允許用戶將東西添加到列表,該功能非常強大。如果用戶發現了一些感興趣的東西,為他們提供一個功能以便其保存那些東西以備后用(如果他們不立即購買的話),是一個很好的點子。這個功能的形式可以簡單到像為頁面添加一個書簽鏈接。更進一步,可以做成愿望列表、收藏夾列表或瀏覽列表,這取決于內容的類型。其他表明用戶感興趣的跡象可能是下載宣傳冊、觀看有關特定內容的視頻,或者針對某個特定主題注冊一個消息通知。

檢索詞

訪問網站可能意味著人們要么正在瀏覽,要么正在尋找一些特別的東西。如果頁面布局良好,大多數用戶可以快速找到他們想要的內容。Netflix?表示,每次有人開始搜索,都被視為推薦系統的一次失敗,因為這意味著人們在推薦系統中找不到任何想要觀看的內容。我可以肯定地說我不認可這個觀點 :我就經常使用搜索功能,因為有人推薦了一些我平時可能不會觀看的內容。在任何情況下,檢索詞都是理解用戶所需內容的最佳方式之一。

下圖展示了一個?Netflix?搜索窗口。這個網站擁有海量的電影,所以如果你搜索“Wonder Women”(《神奇女俠》),它會顯示類似標題的影片,即使“Wonder Women”不在目錄中。

即使系統不能提供用戶所搜索的內容,記錄下該事件依然是有價值的。如果用戶正在尋找電影,你就知道他對該內容感興趣。有了這些信息,你的推薦系統可以推薦類似的內容。

將搜索到的項目與最終消費相關聯

關于檢索詞(用戶在搜索字段中輸入的內容)需要考慮的另一件事是,將搜索的內容與消費的內容聯系起來,這是一個好主意。比如說,用戶搜索 Star Wars(《星球大戰》)并觀看了 Harlock: Space Pirate(《哈洛克 :太空海盜》),而這部影片又會涉及 Babylon A. D.,于是用戶最終會看它。也許把 Babylon A. D. 放到對Star Wars 的搜索結果中是值得嘗試的。

三、購買行為

購買商品意味著消費者認為該商品有用或可愛,或者它可能可以作為禮物。很難確定某次購買商品是消費者為自己買的,并因此而將其作為理解其偏好的部分證據,或者也許它是一個禮物或諸如此類應該被忽略的東西。

弄清楚哪些購買是在買禮物而哪些不是,這是一個有趣的問題。此次購買的商品與該用戶迄今為止所消費的商品風格不同,可能表明這是該用戶偏好的一個新維度,也可能說明它是一個禮物。不管怎樣,它都應被視為數據中的離群點(outlier,異常值)。

從圖形上看,顯示為遠離主體的點,如下圖所示。因為你不能確定離群點的含義(是禮物還是新的興趣),所以最好忽略它。相反,它也可能是新趨勢的第一個指示器,那這就是一個可以探索的機會。

買東西的行為意味著該商品用一種很好的方式進行了展示,盡管它沒有說明消費者是否喜歡這個商品。至少,如果這是消費者第一次購買商品,事實就是如此。第一次購買可能并不意味著認可,但第二次購買很大可能就是認可。無論哪種方式,購買都可以被解讀為積極的信號。

四、消費商品

當有東西被購買時,商店就失去了與商品的聯系,而且如果它不是由網站提供的流式商品或服務,就無法跟蹤它的使用方式。

Endomondo

電影和音樂不是在線消費的唯一內容。Endomondo 是另一個提供在線服務的網站樣例。這個社交健身運動網通過允許用戶使用運動跟蹤器來收集關于用戶活動的統計數據。

Endomondo 會跟蹤用戶使用其功能的程度,該公司會據此推薦類似服務或了解應該在何處開發新服務。電話公司還可測量消費者如何使用他們的電話,它們可以用恐怖的方式跟蹤我們。下面將討論你可以從流式商品中學到什么。

流式商品

在流媒體服務(包括音樂、電影甚至書籍)的案例中,所有的用戶交互都可以被視為隱式評分。用戶聽了一首歌,表示他喜歡它。但是,可以對這些數據做進一步分析。下面列出了用戶與音樂或電影的互動。

1?開始播放 :用戶感興趣,這已經具有積極的意義了。

2?停止播放 :哦,等等,也許用戶由于好奇開始播放,但開始播放后覺得它很糟糕,所以停止了。在前 20 秒內停止播放一首歌(或在前 20 分鐘內停止播放一部電影)可能是一個不好的跡象。在接近結束的地方停止可以被認為是其他情況。

3?繼續播放 :好吧,忘記系統里記錄的所有負面隱式評分。停止后再恢復可以有很多種含義。如果在 5 分鐘內恢復播放,可能是某人或某事打斷了消費者,所以這種停止和恢復就無須考慮。但如果用戶停止播放并在 24 小時之后恢復播放,則說明用戶可能會喜歡這個內容。

4?快進 :如果用戶在中間跳過某些內容,這可能不是一個好兆頭—當然前提是這是他第一次觀看。比方說,如果這部電影是這個用戶第 10 次被觀看,那么跳過一個無聊的場景可能并不會使電影的整體感受變差。本書的技術審校者就談到,對于音樂,他常常快進歌曲來了解一首歌唱的是什么,或是否值得一聽。歌曲的上下文比較少,所以通過快進,你可以知道自己是否喜歡其中的內容。但這不適用于電影。

5?播放到最后 :我們有了一個勝利者!這是一個很好的信號—用戶可能不會對它評價很高,但如果他們坐在那里看完整部電影,可能意味著他們會觀看類似的電影(播放到結尾意味著一直播放到電影結束并且片尾開始滾動)。

6?重播 :重播對于電影和音樂來說可能都是積極的信號,但對于提供教育視頻的網站來說,可能表示該專題太難了。

這些步驟適用于大多數流媒體商品。如何從流式商品收集證據取決于所使用的播放器類型。

對于 Endomondo(它也是一種流媒體服務)而言,這些步驟和解釋并不真正成立。從這個意義上來說,如果你啟動 Endomondo 并表明你已經開始跑步(按“Play”按鈕),那么如果你在 10 公里后暫停這個 App,這可能與你對這個 App 的喜愛程度沒有任何關系,或許意味著你應該減肥了。

五、訪客評分

最后,我們來講每個人都掛在嘴邊的東西 :評分。Netflix?的名言是 :

The more you rate, the better your suggestions.(你評價的越多,你的建議越好。)

這可能是一個真理,但需要做稍許修正,稍后你就會看到。大多數推薦系統都使用了評分,但那些用戶評分通常會根據用戶行為進行加權。評分對這些系統來說只是第一步。你想要的是采集用戶的行為。

許多網站允許用戶查看他們瀏覽、購買或使用過的內容。這使系統能夠更好地了解用戶的喜好,以便將來更好地為用戶提供建議。你可以通過添加一定數量的星星(帽子、笑臉表情等)來確定評分,但在這些圖案背后,其實是一個代表某個等級的數字。和大多數地方一樣,亞馬遜試圖通過給出一段提示文字來幫助你了解每一顆星星的含義。下圖展示了亞馬遜圖書評論的一個例子。

在亞馬遜上,當用戶將鼠標光標移到星星上時,會顯示一條描述信息。在這種情況下,四顆星實際上意味著用戶說“我喜歡它”。除了評分之外,某些網站,例如 TripAdvisor,還鼓勵用戶撰寫評論。

可以說一個五星評分加上一篇書面評論可以算作一個五星以上的評價,因為寫評論的人會思考得更多。一顆星評分的情況也是如此。但是,如果一個人為所有的評分都給了一篇書面評論,我們可能不能認為這種情況有更多的附加值。買了東西而不打分,這能表明你喜歡它嗎?

控制感

當僅需要添加水就能做出蛋糕的蛋糕粉(參見下圖)首次上市時,遭遇了巨大的失敗。對于忙碌的消費者來說,這款商品似乎是完美的 :他們唯一要做的事情就是加水。通過對消費者的研究發現,問題不在于流程簡單,而在于流程過于簡單。烘焙蛋糕是為了創造,但是預先準備好一切使得這個過程變得太容易了,它剝奪了消費者的控制感。制造商們說,“好吧,我們也會讓他們加雞蛋。”于是,生產成本降低了,消費者感覺擁有了更多的自主權。當這種蛋糕粉再次上架,并加上添加水和雞蛋的說明后,就取得了巨大的成功。

許多網站允許用戶添加他們的偏好也是出于同樣的原因 :就是給用戶一種控制感,使他們覺得自己能控制系統,讓其知道自己的偏好是什么。Netflix?聲稱許多人表示他們喜歡紀錄片和外國電影,但實際在看美國情景喜劇。那么,Netflix?應該給出什么樣的推薦 :是那些你自己選擇的但感受很差的娛樂節目,還是你真正想要看的內容?

這就是為什么很難用帶有評分的數據集來測試推薦系統是否優秀的原因之一。數據集可以測試你的預測計算是否有效,但不能測試推薦系統是否會吸引更多用戶。

保存評分

當用戶添加評分時,它是一個事件,并且該事件應該像其他事件那樣被保存在證據中。它可能也值得被直接保存在你的內容數據庫中,這樣當你向用戶展示內容時,同時顯示該內容的平均評分。

負面用戶評分

如果你作為一個消費者想要表明不喜歡某些內容,事情就會變得有點棘手,因為要評價某樣東西你至少必須給它一顆星。一顆星都沒有意味著你根本沒有打分。如果你討厭什么東西,你就不會想給它任何星星,哪怕一顆星也不想給。從某種意義上說,不評分比“我討厭它”要好,而對于后者,你可以在亞馬遜上用一顆星來表示,如圖所示。

不喜歡某件東西可能意味著不必費心去評價它。但是如果有什么事情真的讓你很惱火,你可能會想在某個地方釋放你的懊惱,而這通常是以一個負面評論的形式出現的。

上圖中的評分不是我給的。如果你有機器學習的背景,我絕對推薦 Deep Learning(MIT Press,2016)這本書 ;否則,你最好從 Andrew Trask 的 Grokking Deep Learning(Manning,2016)開始學習。

投票

許多網站圍繞用戶對某個事物是好是壞的投票,已經成功地建立起一個社區。例如,TripAdvisor 唯一的服務就是對酒店和餐館的評分。另一個例子是 Hacker News,其中用戶負責添加內容,這些內容可以是文章和博客的鏈接,主題是“優秀黑客發現的有趣的東西”。添加內容后,你可以對其投票。內容獲得的票數越多,在頁面上的位置就越靠前(幾乎就是這么簡單,稍后你可以好好看一下算法)。使用投票的網站被稱為信譽系統(reputation system)。

▊《實用推薦系統

關于作者

Kim Falk 是一位數據科學家,他在構建數據驅動的應用程序方面有著豐富的經驗。他對推薦系統和機器學習很感興趣。他所訓練的推薦系統,為用戶推薦合適的電影,為人們推送廣告,甚至幫助律師找到判例法的內容。自2010 年以來,他一直從事大數據解決方案和機器學習方面的工作。Kim 經常參與有關推薦系統的演講和寫作。

當Kim 不工作的時候,他就是一個居家男人,是一位父親,會帶著他的德國短毛指示犬進行越野跑。

媒體評論

“這本書涵蓋了技術背景知識,并以清晰簡短的Python代碼演示了實現。”

——Andrew Collier,Exegetic公司

“你有沒有想過Amazon和Netflix是如何了解你對產品和電影的喜好,并提供相關推薦的?這本書會告訴你它們是如何做到的!”

——Amit Lamba, Tech Overture公司

“這本書講了關于推薦系統的一切,從入門到高級概念。”

——Jaromir D.B. Nemec,DBN公司

“這是一本實用的深入了解推薦系統的圖書!”

——Peter Hampton,阿爾斯特大學

關于本書

要構建一個實用的“智能”推薦系統,不僅需要有好的算法,還需要了解接收推薦的用戶。本書分為兩部分,第一部分側重于基礎架構,主要介紹推薦系統的工作原理,展示如何創建推薦系統,以及給應用程序增加推薦系統時,應該如何收集和應用數據;第二部分側重于算法,介紹推薦系統的算法,以及如何使用系統收集的數據來計算向用戶推薦什么內容。作者還講述了如何使用最流行的推薦算法,并剖析它們在Amazon 和Netflix 等網站上的實際應用。

(京東滿100減50,快快掃碼搶購吧!)


掐指一算,你就是昨天雙11忍痛付完尾款的小可愛吧! 我們來送溫暖啦! 這次我們有5本好書相送哦~ 喜歡這本書的各位小可愛可通過以下兩種方式參與: 方式一:本文『評論點贊』前3名; 方式二:『最走心評論』幸運兒2名; 注意活動截止時間為【11月14日 (周日) 16點整】哦~

總結

以上是生活随笔為你收集整理的有福利! 好书推荐:从《实用推荐系统》学习寻找用户行为之法的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。