日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 综合教程 >内容正文

综合教程

阿里OneData构建数据指标体系

發布時間:2023/12/19 综合教程 38 生活家
生活随笔 收集整理的這篇文章主要介紹了 阿里OneData构建数据指标体系 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

數據指標來輔助業務決策

GMV、日活用戶、月活用戶、PV、UV、頁面停留時長

OneData指標規范

以維度建模作為理論基礎,構建總線矩陣,定義業務域、數據域、業務過程、度量/原子指標、維度、維度屬性、修飾詞、修飾類型、時間周期、派生指標等。

業務域:比數據域更高維度的業務劃分方法,適用于特別龐大的業務系統,且業務板塊之間的指標或業務重疊性較小。例如用車業務板塊包含乘客端、司機端,電商業務板塊包含商城、返利模塊。

業務過程:業務過程可以概括為一個個不可拆分的行為事件,如下單、支付、評價等業務過程/事件。這里的事件跟埋點的事件類似,詳情可查看

業務域倒還能理解,簡單來說就是對不同業務的分類;業務過程也容易理解,相當于畫業務流程圖

數據域:是聯系較為緊密的數據主題的集合,是對業務對象高度概括的概念層歸類,目的是便于數據管理與應用。簡而言之,數據域就類似于我們電腦桌面要建立不同的文件夾來存儲數據,這些個文件夾名就是數據域。

維度:是度量的環境,用來反映業務的一類屬性,這類屬性的集合構成一個維度,可以從who-where-when-what層面來看。

維度屬性:維度屬性隸屬于維度,相當于維度的具體說明,如用戶維度中性別為男、女。

修飾詞:指除了統計維度以外指標的業務場景。

修飾類型:對修飾詞的抽象劃分。

簡而言之,維度和修飾都可以理解為原子指標的一些限定條件,懂sql的會更好理解一些,一般是寫sql時,放在where語句后邊的。

度量/原子指標:原子指標和度量含義相同,某一業務行為事件下的度量,是業務定義中不可拆分的指標,如注冊數。

時間周期:用來明確數據統計的時間范圍或是時間點,如最近30天、自然周、截至當日等。

指標類型:包含原子指標、派生指標。原子指標 = 行為事件+度量派生指標 = 一個原子指標+多個修飾詞+時間周期

例如:原子指標=完單量,派生指標=近一周iOS乘客完單量,包含時間周期=近一周,修飾詞=iOS,維度=乘客,原子指標=完單量。

---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

模型設計

此時主導的是我們的模型設計工程師,按照阿里的OneData建模理論的指導,模型設計工程師會采用三層建模的方式把數據更加科學的組織存儲。分為 ODS(操作數據層),DWD(明細數據層)、DWS(匯總數據層)、ADS (應用數據層),這是業務對數據分層常用的模型。

阿里的一套針對指標的規范定義,讓大家在一個標準下看數據消除歧義(指標拆分體系)

數據域:面向業務的大模塊,不會經常變。比如我們公司有環貿快版打版服務、億訂電商業務、供應鏈業務等等大的業務模塊類似產品線。

業務過程:如電商業務中的下單、支付、退款等都屬于業務過程。

時間周期:就是統計范圍,如近30天、自然周、截止到當天等。

修飾類型:比較好理解的如電商中支付方式,終端類型等。

修飾詞:除了維度意外的限定詞,如電商支付中的微信支付、支付寶支付、網銀支付等。終端類型為安卓、IOS等

原子指標:不可再拆分的指標如支付金額、支付件數等指標

維度:常見的維度有地理維度(國家、地區等)、時間維度(年、月、周、日等)

維度屬性:如地理維度中的國家名稱、ID、省份名稱等。

派生指標:原子指標+修飾詞+時間周期就組成了一個派生指標。

關于數據指標還有two more thing要談:

1. 怎么分出指標的重要性。績效考核指標,部門負責人關注的指標

2. 關于虛榮指標。

PV、UV、月活、總用戶數、總商品數

主路徑的專戶率,訪問-商品列表、商品列表-商品詳情、商品詳情-加購、加購-下單轉化率:降低流失就能提高交易額的。

用戶的次日留存、7日留存率(新用戶7日后是否再次訪問)、30日留存率:等能直接反應用戶的質量和運營做的好壞。

商品的動銷率(銷售款數/上架款數):能直接反映這批商品的好壞。

基于阿里OneData的模型設計體系

首先你要知道這些概念。什么是數據倉庫、數據倉庫和數據庫的區別、數據倉庫的分層、數據模型的定義。

數據倉庫與數據庫的區別

阿里的數據分層分為:ODS、DWD、DWS、ADS。

ODS(操作數據層):是數據倉庫第一層數據,直接從原始數據過來的,經過簡單地處理,爆款率涉及到的表結構比如訂單表、專場表、商品表、用戶表等。

DW*(匯總數據層):這個是數據倉庫的第二層數據,DWD和DWS很多情況下是并列存在的,這一層儲存經過處理后的標準數據。增加了維度形成了統計寬表,比如專場的爆款商品有哪些。

ADS(應用數據層):這個是數據倉庫的最后一層數據,為應用層數據,直接可以給業務人員使用。比如某日某個專場爆款率是多少、總的爆款率是什么。

數據模型有很多,如:范式模型、維度模型、Data Vault

星型模型的基本概念

星型模型中有兩個重要的概念:事實表和維度表。

總結

以上是生活随笔為你收集整理的阿里OneData构建数据指标体系的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。