日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

聊聊我们在业务链路升级中做的数据洞察

發布時間:2024/8/23 编程问答 35 豆豆
生活随笔 收集整理的這篇文章主要介紹了 聊聊我们在业务链路升级中做的数据洞察 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

簡介:關于數據相關的詞條很多,雖然有不同的定義,但是本質上是相輔相成,通常結合使用才能拿到結果。類比詞條諸如 數據分析,數據挖掘, 數據洞察。本文將聊聊我們在業務鏈路升級中做的數據洞察。

作者 | 金鐸
來源 | 阿里技術公眾號

一 概述

關于數據相關的詞條很多,雖然有不同的定義,但是本質上是相輔相成,通常結合使用才能拿到結果。

類比詞條諸如 數據分析,數據挖掘, 數據洞察。

以下為wiki上的定義

  • 數據分析:是一種統計學常用方法,其主要特點是多維性和描述性。有些幾何方法有助于揭示不同的數據之間存在的關系,并繪制出統計信息圖,以更簡潔的解釋這些數據中包含的主要信息;
  • 數據挖掘:是一個跨學科的計算機科學分支。它是用人工智能、機器學習、統計學和數據庫的交叉方法在相對較大型的數據集中發現模式的計算過程;
  • 數據洞察:這一項目前沒有wiki詞條,基于普遍認知,是基于數據分析和數據挖掘,結合業務場景后,圍繞業務鏈路定義統一口徑,進而更好的分析問題,并且能夠進一步做策略改進。

三者分析手段本質上都是對數據進行加工獲取信息,但是目標不盡相同,以下是我個人的理解。

  • 數據分析更側重,基于人的理解動線,結合人對業務和數據的理解,產出分析結果。這里更加強調人的分析;
  • 數據挖掘同理數據分析,只不過角色從人變為了機器;
  • 數據洞察是在數據分析和挖掘的基礎上,引入了業務場景的概念,梳理出圍繞業務場景結果的影響因素和鏈路,目標是對抽象問題進行歸因、拆分以及更好更快的形成改進方向。這個也是我們業務開發同學最有優勢的地方。

二 核心要素

我們發現,數據洞察的理解,實際上是可以分為幾個核心要素。

這里我們逐一來簡要說明。

1 數據

干凈有效的數據才是我們要的數據,否則會誤導后續的結論。e.g. 登錄鏈路因為是業務安全水位保證的第一環節,經常有來刷的流量,如何避免因為灰黑產的流量,影響后續的判斷,這個也是重中之重;

2 業務場景

業務場景是區分數據洞察和其他數據分析方式的核心區別,也可能是業務同學區分bi分析的最大的價值點。任何分析策略都脫離不開對業務場景的理解,而不是單純的理解數據。

定義“一次完整業務鏈路行為”是核心,圍繞著一次行為鏈路,才能就鏈路分析有用的策略。

3 口徑

口徑是什么?我理解口徑是在合理的數據維度和好的目標的基礎上對業務場景的理解,口徑上也會結合對業務場景的理解和對業務目標的理解。數據維度可能是多種多種的。

還是以登錄舉例,正常的理解,一個用戶在一個設備上登錄是正常情況,但是手淘會出現多賬號登錄同設備,這個也是常態數據特征,那究竟在定義登錄成功率的時候,是使用設備維度(認為同一個設備只要有一個用戶登錄成功即算設備成功)還是使用用戶維度(只看用戶維度數據,不結合設備定義指標),也是需要考量的。

三 數據建設

1 數據的清洗是保證數據有效的手段

我們獲得的各種打點框架和不同的數據源,可能維度和信息量都是不統一的,比如有的數據源有設備信息但是沒有用戶信息,有的數據源有用戶信息,但是設備信息不完整;甚至同一個時間字段,格式也是不統一的。

這個時候就需要先對數據進行加工了,剔除臟數據,補充遺漏點位,加工出干凈的單維度信息,并且保證各數據源數據加工出的數據維度和格式統一,比如標準的設備id或者用戶id及時間等。

2 數據建設是補充也是演進

數據質量問題,不止要從數據的清晰看,也數據產生的點來看。如果數據有缺失或者不統一,數據清洗又搞不定,就需要進行開發了,比如數據庫增加字段,打點框架增加打點邏輯。

數據建設是一個長期的過程,不止是為了補充現在要分析的內容,也是要形成一套標準的交付產物。更進一步,日常做需求和項目的時候,打點數據質量也是要考慮的,畢竟做需求上線不是結果,拿到業務目標才是結果。

四 業務場景

1 業務場景的定義

業務場景是在整個業務洞察中最特殊的一個環節。這個環節定義的好壞,直接影響了問題拆分結果的有效性。

不同的業務場景具備各自的特殊性,需要結合業務特性來分析。

按照目前我的經驗來看,業務場景的定義也是有一些核心方法的。

  • 業務場景中,最終產物是誰?

還是以登錄舉例,登錄的最終目標肯定是為了下發登錄態,否則也沒有人回來“玩一玩”登錄,那圍繞下發登錄態的鏈路,就是我們想要的業務鏈路;

其他的業務也同理,比如訂單的話,是圍繞庫存來跑;

  • 業務場景中,你需要分析的維度是多深;

這個也比較好理解,以上訴例子繼續說,要看登錄的業務鏈路的話,需要拆分多種登錄方式不同的鏈路來看?還是說看一個總的登錄鏈路就夠了。

這個維度就只能看分析問題的層次了,一般在洞察初期,當然是維度越細越好,但是越分析往后,維度會逐漸上升,因為隨著對業務的洞察,會發現有些維度雖然深了更完整,但是是分析不出問題的,也就是“過度分析”了。

  • 業務場景中,你要定義“一次完整業務行為”。

數據洞察區分于其他分析方式,最大的優勢是在于結合了業務來分析業務本身,那直擊業務結果的,一定是完整的業務鏈路。

這個點不舉例不太好說明,舉個例子,登錄過程。

大家有想過打點會是什么樣么,和一次完整業務行為會有啥差異么。

正常打點是下面這種樣子的。

表1

這兩條離散的打點就是一次完整登錄行為,但是是基于rpc請求維度的表達。

2 結合業務場景定義的數據結構演進

打點數據描述了一個階段性的結果。上面例子描述的,就是用戶在2021-12-1 11:20:54發起了一次賬密登錄請求,但是因為環境不安全,安全挑戰要求核實身份(比如發短信核實),用戶操作了核身操作,在2021-12-1 11:21:20發起了免登,下發了登錄態。

這個就是一次登錄行為。業務洞察的核心也是圍繞這個點進行。

假如我們的分析維度,是總的登錄維度或者分登錄方式的登錄維度分析,這個兩條數據的打點其實就不適合我們,我們僅需要登錄方式,最終結果,時間以及設備id就夠了。

表2

或核身沒有通過

表3

但是我們也會發現,這個數據描述的行為并不完整,比如表2并不能描述登錄過程經過了核身這個特性。

這個時候,我們就需要數據結構進行下一個階段的演進。

我們引入了statustag來描述路徑。

statustag格式:0^0^12|0^1^abcde.

前后經過|分割為兩種格式,第一個格式為bitmap,表示0版本;第二個格式為字符串,表示1版本格式,字符串為經過的未加到bitmap的節點(埋點畢竟不是強要求,總有需求上線后,沒有加bitmap)。

這個tag描述經過的路徑為,經過bx1100結果,經過了一版本的4和8的節點,和二版本的abcde節點。

有了這個tag,就可以描述更多的信息。

3 業務場景數據的可視化表達

單純的數據并不容易洞察,也不是長期運營治理的合理方式。這個時候我們就需要可視化來搞事情。

可視化的內容包含我們想要表達的內容,比如漏斗,比如曲線。

目前可視化表達常見的是漏斗和報表。

  • 漏斗舉例

圖1

做漏斗很麻煩,需要一個點一個點手動定義。但是漏斗對初期理解鏈路,分析問題益處非常大。

這個時候我們需要的,是可以通過結構化的數據源,來快速生成可視化漏斗。

我們可以通過生成數據的時候就指定約定來快速生成結構化數據。

  • 基于狀態機+約定打點
  • 引入狀態機變化記錄打點日志;
  • 結合結構化的畫圖能力,定向輸出約定日志,動態畫圖
    • 狀態機的核心要素

    1.statusTag記錄路徑信息;
    2.status和old_status記錄節點上下游信息;
    3.depth記錄節點深度;

    最終產出的一次登錄行為登錄數據”->"最終可以產出如下的一次登錄行為樣例數據(數據非真實用戶數據)

    五 口徑

    口徑是基于數據和業務場景的產出結果。口徑也是最重要的點,口徑代表了我們基于數據和業務場景對業務結果的理解,比如登錄的口徑,在財年初定義,登錄成功率從9x%提升到9y%,這個提升空間,也是根據數據來計算的。

    1 口徑不要經常變動

    口徑一旦定義下來,就不要經常變動。因為一般定義口徑是最難也是最耗時的,定義口徑的時候,一般我們已經完成了對目標的拆解,機會的洞察和最終的測算。

    2 口徑并不一定是單一口徑

    除了上訴特性外,口徑也會有單口徑和多口徑,一般都會同時存在,比如登錄過程,在一個總的口徑基礎上,哪怕是一次登錄行為,我們也會拆分多個業務階段。

    還是以登錄舉例,我們把用戶從進入頁面開始,到發起登錄行為,定義為意愿口徑,從登錄行為開始到登錄結果,定義為成功率口徑。這兩塊要解決的問題是不同的,揉到一起,會導致問題變得復雜,不利于分析。

    多口徑也有一個好處,我們可以做階段性的工作,在不同的階段,處理多口徑中其中一部分的鏈路升級。

    3 口徑維度定義

    口徑維度定義需要結合場和業務的特性,哪怕是同一個業務鏈路,可能在不同場中,不同人群定義,也是不同的。

    這塊不好說明,舉個例子。

    我們C端口徑定義上,是設備維度,因為C端用戶,天然存在薅羊毛行為,我們會認為一個設備的登錄成功,對于C端就是有益處的。

    但是同樣是登錄鏈路,B端定義上,就是用戶維度的,因為B端商家的個體價值都很大,而且不太存在類似C端薅羊毛的行為,用戶維度能讓我們更好的看到用戶行為,以便做體驗上的優化。

    六 小結

    在數據洞察方面,我們也還在學習和實踐的路上,并在這條路上已經取到了一定的結果,但是未來空間還是很大。這條路對于業務開發是一個有優勢的路,而且業務平臺作為業務場景的豐富度上,也是獨具優勢,我們可以在數據洞察做的事情上,更加自由。歡迎大家來一起討論,也歡迎大家來一起探索。

    數據洞察是業務中臺賦能業務的有力工具,對業務產出數據洞察能力,也是我們一個非常大的命題。

    原文鏈接
    本文為阿里云原創內容,未經允許不得轉載。?

    總結

    以上是生活随笔為你收集整理的聊聊我们在业务链路升级中做的数据洞察的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: 精品久久一区 | 国产成人亚洲精品无码h在线 | 三级理伦| 丝袜人妖| 麻豆三级 | 成人美女毛片 | 丝袜天堂 | 精国产品一区二区三区a片 国产精品第一 | 伊人伊人伊人伊人 | 99re视频在线 | 自拍偷拍综合 | 可以免费观看av的网站 | 91网站在线看 | 黄色三级在线观看 | 九九热视频精品在线观看 | 日韩一区二区毛片 | 欧美性第一页 | 涩涩涩在线视频 | 91中文字日产乱幕4区 | 交视频在线播放 | 亚洲国产色图 | 香蕉伊思人视频 | 亚洲专区一| 在线观看涩涩 | 少妇高潮露脸国语对白 | 日韩永久 | 久久久久久久久久国产精品 | 久久精品一二 | 天天av天天| 17c精品麻豆一区二区免费 | 亚洲欧美在线免费 | 国产98色在线 | 日韩 | 丰满少妇被猛烈进入无码 | 国产午夜精品一区二区三区四区 | 亚洲女人网 | 在线黄色av网站 | 欧美在线一区二区三区四区 | 亚洲香蕉在线视频 | 美日韩一区二区 | 国产女主播自拍 | 中文字幕av无码一区二区三区 | 在线观看国产精品一区 | 葵司av电影 | 日本a视频在线观看 | 精品无码人妻一区二区三 | 欧美大片免费观看网址 | 日本老小玩hd老少配 | 国产丝袜视频在线 | 手机看片日韩欧美 | 丝袜av在线播放 | 96久久久 | 草草影院ccyycom | 亚洲国产成人av | 女女h百合无遮涩涩漫画软件 | 国产中文字幕亚洲 | 成年人网站免费看 | 亚洲乱码精品久久久久.. | 亚州一级 | 日本在线资源 | 麻豆网站在线观看 | 欧美a在线播放 | 69国产在线 | 高潮网址| 国久久久 | 看av在线| 国产成人亚洲综合a∨婷婷 台湾a级片 | 一级 黄 色 片69| 日韩看片| 亚洲中文一区二区三区 | 韩国明星乱淫(高h)小说 | 日韩亚洲天堂 | 国产黄色片在线免费观看 | 亚洲成a人v欧美综合天堂麻豆 | 日本成人在线不卡 | 亚洲三级大片 | 小罗莉极品一线天在线 | 日韩毛片在线 | 婷婷色网站| 婷婷丁香社区 | 日韩精品电影一区二区 | 亚洲精品国产精品乱码不卡 | 美梦视频大全在线观看高清 | 一区二区三区播放 | 麻豆成人在线观看 | 麻豆影片| 欧美69视频 | 午夜之声l性8电台lx8电台 | 日韩精品伦理 | 级毛片 | www.youjizz.com国产 | 免费看美女被靠到爽的视频 | 亚洲精品中文字幕乱码三区 | 四虎成人免费视频 | 成年人午夜网站 | 中国女人一级片 | 中文字幕va| 国产卡一卡二卡三无线乱码新区 | 少妇一级淫片免费看 | 日韩少妇毛片 |