大数据形势下的三种数据融合方式:组合、整合和聚合
一、 跨行業數據合作背景
國務院副總理馬凱,曾經在2015貴陽國際大數據產業博覽會中提到:
融合是大數據的價值所在,應大力推動大數據與產業融合,面向工業、交通、物流、商貿、金融、電信、能源等數據量大的行業領域,開展數據開發和交易,充分挖掘大數據的商業價值,促進產業提質增效升級。
另外,《大數據時代》的作者舍恩伯格,在該書中也提到一個觀點:“大數據不是隨機樣本而是全體數據”。
無論是從國家政府部門還是領域專家都不約而同的提到數據需要融合,數據融合才有價值。
二、 為什么需要數據融合?
其中最重要原因是用戶數據的割裂性,無法全面勾勒用戶全貌。比如你的購物數據在京東天貓、通話數據在移動電信、交易數據在銀行金融、社交數據在騰訊微信、搜索數據在百度等等。
數據的割裂性導致對用戶的認識比較片面,可能做出錯誤的決策。比如:現在京東與頭條的“京條計劃”就是數據合作的一個案例,就是你在京東搜索的物品,會不定時在瀏覽今日頭條中呈現,增加購買率。這里有個缺陷是如果已經在淘寶購買的物品,但還是會出現頁面,導致用戶體驗感知下降。
數據融合的另一個價值就是新規律新價值的發現。比如以前用戶信用主要基于是否有歷史借貸違約,但很多人無借貸關系數據,如何評定。芝麻信用就創新的融合上網數據、身份特征、行為偏好、社交關系等生活屬性數據,來側面刻畫用戶的信用。這就是數據融合價值。
不同行業數據的融合,具有互補性和完整性,將有效提升數據內涵價值。
三、 數據融合的三種方式
數據融合的方式從交互程度來講,可分為數據組合、數據整合和數據聚合等三個層次,由低到高,逐步實現數據之間的深度交互。
層級一:數據組合由各方數據的簡單組合形成,能夠全貌客戶用戶特征。該數據融合產生的是物理反應,數據屬性本質沒有改變。如一份征信報告,有交易數據,有通信數據,有購物數據等,簡單的拼裝而成。如下圖:
層級二:數據整合由多方的數據共同存在才能夠實現產品價值。該數據的融合產生的是化學反應,有價值產生。如:黑名單,通過金融數據和通信行業數據共同才能判斷是否黑名單。如該用戶有異常金融行為,在加上該用戶頻繁換手機和停機次數多,基本可判斷黑名單用戶。
層級三:數據聚合(核反應)由雙方數據聚合孵化產生出新的產品,新模式。如:分期貸款。通過大數據風控能力,不僅減少審核流程,而且也能進行貸中監控和貸后管理,還能夠對失聯用戶進行定位和催收,是一攬子計劃。
四、 面臨需要解決的問題
同樣數據融合并不是一件容易的事情,需要解決數據壁壘,數據標準,數據安全等問題。其中較重要的三個問題是:
問題1:數據安全問題
如何保證數據安全,保護客戶隱私?客戶知情權。如何保障符合集團或公司規定的數據變現要求?數據不出庫。
問題2:市場定價
市場定價市場價格如何確定?基于成本OR基于需求?市場的最終定價權由誰主導?多方數據提供者,聽誰的話?
問題3:利益分配
利益分成如何界定各方數據價值和分層比例?
這些都是數據融合時遇到的實際問題,也是在數據創新時必須要解決的。
總結
以上是生活随笔為你收集整理的大数据形势下的三种数据融合方式:组合、整合和聚合的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: springboot 注解动态赋值_ja
- 下一篇: 怎么创建具有真实纹理的CG场景岩石?