你真的懂用户画像吗?
在移動互聯網時代,精細化運營成為企業重要的競爭力,此時,“用戶畫像”的概念也應運而生。用戶畫像是指,在大數據時代,我們通過對海量數字信息進行清洗、聚類、分析,從而將數據抽象成標簽,利用這些標簽將用戶形象具體化,從而為用戶提供有針對性的服務。在下文中,我們將以個推用戶畫像產品為例,為你詳解“用戶畫像”的技術特點和使用價值。
個推用戶畫像產品依托個推多年積累的海量數據及強大的數據分析能力,可為APP開發者提供豐富的用戶畫像數據以及實時的場景識別能力,進而幫助客戶了解用戶信息,從而助力移動APP目標用戶精準篩選、個性化推送消息和應用更新下載等。
用戶畫像的形成需要經歷四個過程,主要包括數據收集、數據清洗、數據建模分析、數據產出。其中,數據清洗和數據建模統稱數據處理,在經過數據處理之后,個推憑借多年積累的大數據能力,以獨特的冷、熱、溫數據維度分析進行數據產出形成用戶畫像。
一、用戶畫像用了哪些技術?
在數據處理階段,個推用戶畫像產品的大數據計算架構采用了Kafka分布式發布訂閱消息系統,這一系統具有高吞吐量、高穩定性的特點。數據清洗可利用HADOOP、SPARK實現設備唯一性識別、行為數據的清洗等,從而去除冗余數據。這一過程支持交互計算和多種復雜算法,同時,它還支持數據實時/離線計算。
在數據建模的過程中,主要用了機器學習中的聚類(無監督學習)和深度學習技術,這能讓模型對用戶行為數據主動學習,進行行為判斷,由此產出用戶標簽。
之后,數據的產出會形成冷數據畫像、溫數據回溯、熱數據場景和定制化標簽四種畫像。
冷數據畫像,是指基于大數據分析出用戶的屬性,改變概率較小的數據,如用戶的年齡段、性別等。
“溫數據”則可以回溯用戶近期活躍的線上和線下場景,具有一定的時效性。
“熱數據”是指用戶當下的場景及實時的用戶特征,幫助APP運營者抓住稍縱即逝的營銷機會。
定制化標簽是將個推數據與第三方數據結合起來,共同建模得出具有價值的特征標簽??偟膩碚f,個推用戶畫像產品不僅能產出通用的標簽維度,也有定制化標簽的輸出能力。
二、如何構建用戶畫像?
“用戶畫像”的構建需要技術和業務人員的共同參與,以避免形式化的用戶畫像,具體做法可參考個推構建用戶畫像的流程:
(1)標簽體系設計。開發者需要先了解自身的數據,確定需要設計的標簽形式。
(2)基礎數據收集、多數據源數據融合。在建設用戶畫像時,個推用戶畫像產品會整合個推以及該APP自身的數據。
(3)實現用戶統一標識。多數情況下,APP的眾多用戶分布于不同的賬號體系中,個推會將其統一標識,幫助APP打通賬號,實現信息快速共享。
(4)用戶畫像特征層構建,即將每一個數據進行特征化。
(5)畫像標簽規則+算法建模,兩者缺一不可。在實際的應用中,算法難以解決的問題,利用簡單的規則也可以達到很好的效果。
(6)利用算法對所有用戶打標簽。
(7)畫像質量監控。在實際的應用中,用戶畫像會產生一定的波動,為了解決這個問題,個推建設了相應的監控系統,對畫像的質量進行監控。
總之,個推用戶畫像構建的整體流程,可以概況為三個部分:
第一,基礎數據處理?;A數據包括用戶設備信息、用戶的線上APP偏好以及線下場景數據等。
第二,畫像中間數據處理。處理結果包括線上APP偏好特征和線下場景特征等。
第三,畫像信息表。表中應有四種信息:設備基礎屬性;用戶基礎畫像,包括用戶的性別、年齡段、相關消費水平等;用戶興趣畫像,即用戶更有興趣的方向,比如用戶更偏好拼團還是海淘;用戶其它畫像等。
在個推用戶畫像構建的過程中,機器學習占據了較為重要的位置。機器學習主要應用在海量設備數據采集、數據清洗、數據存儲的過程。
三、用戶畫像能做什么?
用戶畫像常用在電商、新聞資訊等APP,幫助APP打造內容精準推薦系統,實現千人千面運營。
基于用戶特征的個性化推薦
APP的運營者通過個推用戶畫像提供的性別、年齡段、興趣愛好等標簽,分別展示不同的內容給用戶,以達到精準化運營。
基于用戶特征指導內容推薦
基于用戶特征指導內容的推薦是指找到與目標相似的用戶群,利用該用戶群的行為特征對目標用戶進行內容推薦,具體過程如下圖:
在這里,我們需要解釋一下其中所涉及到的相似性建模技術。相似性建??深惐扔诰垲惤?#xff0c;它是無監督學習中的一種,它指的是尋找數據中的特征,把具有相同特征的數據聚集在一組,賦予這些聚集在一起的數據相同的特征標簽,從而給這些具有這些特性的用戶推送相同的內容。
這種推薦方式的優點是,它的自有特征是經過APP長期積淀而來,顆粒度更細,適用性更強,對用戶的認識更全面,效果能持續提升,而且它還能針對APP所處行業與自身需求,量身定制匹配算法,讓推薦更精準。
此外,如上文所言,個推用戶畫像能夠結合第三方數據做定制化建模,通過雙方共同建模得出顯著價值和特征標簽,依據不同標簽向用戶推送不同的內容。這樣不僅能保證推送的內容更精準,覆蓋面也更廣泛,而且標簽增補的方式,也可以很大程度上提升流量價值。
四、開發者如何接入?
個推用戶畫像SDK的接入主要有兩個方式:
- SDK集成:客戶端集成個推用戶畫像SDK,進行初始化SDK后,返回給客戶一個ID即GIUID(唯一身份標識), 此ID需要由客戶端提交到客戶服務器,然后服務器通過API接口傳入GIUID進行查詢用戶畫像標簽數據。
- API接口調用:客戶將應用名稱、包名及服務端出口IP提供后,返回APP ID等相關信息??蛻舾鶕秱€推用戶畫像數據服務接口文檔》及《用戶畫像編碼表》集成測試后方可調用API接口查詢畫像信息。
具體的集成文檔參見以下鏈接:
Android:http://docs.getui.com/gexiang/start/android/
iOS:http://docs.getui.com/gexiang/start/ios/
服務端:http://docs.getui.com/gexiang/start/server/
總結
以上是生活随笔為你收集整理的你真的懂用户画像吗?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 如何在linux服务器上使用hanlp
- 下一篇: 我对RPC的理解