网易云音乐:基于分布式图学习的推荐系统优化之路
在“精準推薦者得民心”的今天,推薦系統(tǒng)已成為各大互聯(lián)網公司的標配。但由于現(xiàn)實中很多數(shù)據是非歐氏空間生成的(例如,社交網絡、信息網絡等),一些復雜場景下的業(yè)務需求很難通過協(xié)同過濾等基于歷史行為挖掘用戶或產品相似性的傳統(tǒng)算法來滿足。圖神經網絡作為一種約束性較少、極其靈活的數(shù)據表征方式,在深度學習各主要領域中嶄露頭角,一系列圖學習模型涌現(xiàn)并得到越來越多的應用。
網易云音樂在推薦領域的探索
作為國民級的音樂App,網易云音樂很久之前就將定位從傳統(tǒng)的音樂工具軟件轉移到音樂內容社區(qū),致力于聯(lián)結泛音樂產品與用戶,打造最懂用戶的音樂 App。在音樂內容社區(qū)中,直播可以說是用戶參與度極高的場景了,云音樂內部投入了大量的人力物力以求將匹配度更高的主播推薦給用戶,但仍然面臨多重嚴峻的挑戰(zhàn)。
如何破解歷史行為稀少的用戶冷啟動問題
眾所周知,推薦系統(tǒng)的整體框架主要包括召回、粗排和精排3個部分。其中,最底層的召回模型具有舉足輕重的作用,而成功的召回推理需要依賴充足的歷史數(shù)據。但在云音樂的業(yè)務場景中,通過站內廣告看到直播推薦的用戶很大比例是直播功能的新用戶,即沒有產生過觀看直播行為數(shù)據的用戶。如何向這類數(shù)據稀疏的用戶推薦合適的內容成了亟待解決的難題,這類問題也通常被稱為冷啟動。
大規(guī)模圖模型如何訓練?
云音樂現(xiàn)有計算資源已全面實現(xiàn)容器化部署,對于各個業(yè)務團隊來說,計算資源都是有限的,需要以最高效合理的方式利用有限的資源。如何在有限的分布式資源調控策略下低本高效地完成大規(guī)模圖神經網絡的模型訓練,成為必須攻克的難題。
PGL圖神經網絡助力推薦場景落地
為了解決以上問題,網易云音樂的研發(fā)團隊調研了大量開源方案,最終選擇了對大規(guī)模圖訓練更加友好的百度飛槳分布式圖學習框架PGL,作為云音樂的基礎框架。
基于PGL的行為域知識遷移解決冷啟動問題
云音樂直播場景的新用戶中,有很多在音樂、歌單、Mlog 等業(yè)務中產生過較豐富的歷史行為,能否通過將這部分歷史行為知識映射到直播領域,來解決“行為”數(shù)據不足的問題呢?
帶著疑問,云音樂引入了圖模型結構,以多種不同類型的實體(如歌曲、DJ、Query、RadioID 等)為節(jié)點,通過用戶與主播、用戶與歌曲、Query與主播等歷史行為關系,構建了一張統(tǒng)一的圖關系網絡。
然后,基于飛槳圖學習框架 PGL對圖模型進行訓練。先采用 DeepWalk、Metapath2Vec、GraphSage等模型學習出足夠強大的Graph Embedding表示來建模實體ID;再通過向量召回,將用戶在歌曲、Query等處的行為遷移到主播領域,達到召回合適主播的目的。
基于PGL通用的分布式能力進行訓練?
云音樂的數(shù)據規(guī)模非常龐大,數(shù)據關系即使經過裁剪也高達億級別以上。在常用的硬件資源配備情況下,此等量級規(guī)模的數(shù)據早已成為某些開源的圖神經網絡框架的瓶頸,需要使用極其昂貴的計算資源才能解決。對于數(shù)據規(guī)模必將持續(xù)增大的云音樂來說,相較于使用什么類型的模型,能否在這種數(shù)據規(guī)模下訓練出模型才是優(yōu)先要考慮的關鍵問題,也是網易云音樂與PGL成功牽手的關鍵因素!
百度飛槳深度學習平臺PaddlePaddle 2019年開源的分布式圖學習框架PGL,原生支持圖學習中較為獨特的分布式圖存儲(Distributed Graph Storage)和分布式采樣(Distributed Sampling),可以方便地通過上層Python接口,將 圖的特征(如Side Feature等)存儲在不同的Server上,也支持通用的分布式采樣接口,將不同子圖的采樣分布式處理,并基于PaddlePaddle Fleet API來完成分布式訓練(Distributed Training),實現(xiàn)在分布式的“瘦計算節(jié)點”上加速計算。這些能力對云音樂內容社區(qū)直播推薦遇到的訓練問題來說,極具魅力!
實驗對比顯示,在主播推薦場景采用圖計算帶來有效觀看大幅提升,尤其在新用戶和新主播冷啟動上引入其它域數(shù)據后有了明顯提升。
想了解更多落地細節(jié)和實戰(zhàn)經驗?
3月16日,網易云音樂機器學習平臺與框架負責人段石石,將在飛槳B站直播間分享深度學習實戰(zhàn)進階課程《圖神經網絡在云音樂業(yè)務落地》。除了上面提到的數(shù)據稀疏性、冷啟動召回和大規(guī)模分布式訓練等業(yè)務難題的解決方案,段老師還將分享云音樂如何應對訓練數(shù)據質量、瘦計算節(jié)點等技術挑戰(zhàn)。
3月17日,百度高級研發(fā)工程師蘇煒躍將分享《飛槳分布式圖學習框架PGL及其推薦應用》,重點介紹圖學習算法的理論基礎、圖學習框架PGL的特點和優(yōu)勢;同時將通過演示經典大規(guī)模推薦場景的圖學習訓練過程,幫助大家快速學習和實現(xiàn)產業(yè)級的圖模型實踐。
掃描下方二維碼
加入技術交流群
想了解更多落地細節(jié)和實戰(zhàn)經驗,3月16、17日20:10-21:30鎖定AI快車道x網易云音樂直播課,我們不見不散!
飛槳圖學習框架PGL
PGL是業(yè)界首個提出通用消息并行傳遞機制,支持百億規(guī)模巨圖的工業(yè)級圖學習框架。PGL基于飛槳動態(tài)圖全新升級,極大提升了易用性,原生支持異構圖,覆蓋30+圖學習模型,包括圖語義理解模型ERNIESage等,歷經大量真實工業(yè)應用驗證。另外,基于飛槳深度學習框架的分布式Fleet API,建立分布式圖存儲及分布式學習算法,實現(xiàn)靈活、高效地搭建前沿的大規(guī)模圖學習算法。
更多資料請關注
PGL圖學習框架Github代碼倉庫:https://github.com/PaddlePaddle/PGL
飛槳推薦系統(tǒng):https://github.com/PaddlePaddle/paddlerec
飛槳分布式:https://github.com/PaddlePaddle/fleetx
飛槳深度學習框架Github代碼倉庫:https://github.com/PaddlePaddle/Paddle
對于想要了解圖神經網絡及其分布式應用的小伙伴,可以圍觀PGL團隊傾力開發(fā)的圖神經網絡課程,帶你七天高效入門:https://github.com/PaddlePaddle/PGL/tree/main/course
如感覺不錯,歡迎“Star”;如需交流,歡迎“Issue”,我們將及時反饋;如您有基于飛槳的產業(yè)落地案例,歡迎發(fā)送至郵件paddle-up@baidu.com。
總結
以上是生活随笔為你收集整理的网易云音乐:基于分布式图学习的推荐系统优化之路的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 笔记本 win11 64位专业版iso文
- 下一篇: java信息管理系统总结_java实现科