埋点技术:“呵呵,你在网上的一举一动,都在我眼皮子底下”
🍅 作者主頁:不吃西紅柿?
🍅 簡介:CSDN博客專家 & 總榜前十🏆、HDZ核心組成員。歡迎點贊、收藏、評論
🍅 粉絲專屬福利:知識體系、面試題庫、技術(shù)互助、簡歷模板。文末公眾號領(lǐng)取
1、什么是埋點
埋點又稱為事件追蹤(Event Tracking),指的是針對特定用戶行為或流程事件進行捕獲,處理和發(fā)送的相關(guān)技術(shù)及其實施過程。
埋點為優(yōu)化產(chǎn)品和運營決策提供數(shù)據(jù)支撐,幾乎每個企業(yè)、每個app都需要用到埋點技術(shù)。
-
功能方面:埋點是用來收集用戶行為數(shù)據(jù)。比如想要了解一個用戶在APP里面點擊了哪些按鈕,看了哪些頁面,做了哪些事情等,就可以通過埋點來實現(xiàn)。
-
實現(xiàn)方面:埋點就是通過植入一段代碼到某個頁面或某個按鈕,從而監(jiān)聽用戶行為并進行收集上報。
2、埋點基本流程
一般來說,需要這樣的流程:
運營人員提出埋點和指標(biāo)需求
埋點研發(fā)進行埋點,收集和存儲數(shù)據(jù)
數(shù)據(jù)倉庫人員進行數(shù)據(jù)清洗、提供數(shù)據(jù)指標(biāo)
運營根據(jù)數(shù)據(jù)指標(biāo),調(diào)整業(yè)務(wù)流程和運營策略
【埋點采集】通過部署埋點,收集數(shù)據(jù)
【數(shù)據(jù)傳輸】將埋點收集到的數(shù)據(jù),進行傳輸
-
實時傳輸:flume > kafka > db
-
離線批量傳輸:jdbc > db
【數(shù)據(jù)存儲】定義數(shù)據(jù)存儲的庫
-
數(shù)據(jù)量較小建議采用mysql,oracle等關(guān)系型數(shù)據(jù)庫;
-
數(shù)據(jù)量較大,建議采用hive,hbase等分布式數(shù)據(jù)庫。定義好數(shù)據(jù)存儲的表結(jié)構(gòu),屬性盡可能采集全面。
【數(shù)據(jù)清洗】一般為數(shù)據(jù)倉庫開發(fā)人員進行數(shù)據(jù)ELT
【數(shù)據(jù)應(yīng)用】業(yè)務(wù)運營人員驗證和使用數(shù)據(jù)
3、埋點采集
3.1 埋點范圍
根據(jù)業(yè)務(wù)人員的需求,選取可以衡量需求效果的數(shù)據(jù)指標(biāo),比如頁面瀏覽量,頁面轉(zhuǎn)化率,訪問人數(shù),訪問頻次分布等等。明確需要收集哪些維度的數(shù)據(jù),按需選擇性埋點。
3.2 埋點事件
我們可以對一條業(yè)務(wù)流程中涉及到的各種操作進行事件埋點,用于了解該業(yè)務(wù)各操作流程的用戶流失率,轉(zhuǎn)化率等情況。通常包括但不限于以下事件:
-
頁面事件:用戶訪問頁面的信息,比如可以通過頁面埋點統(tǒng)計頁面瀏覽量(PV),或收集該頁面上的接口;
-
點擊事件:用戶在頁面的點擊行為,比如想要收集用戶點擊搜索按鈕時,填入了哪些關(guān)鍵字,就可以在搜索按鈕上埋一個點擊事件,通過字段keywords上報的值實現(xiàn)分析關(guān)鍵字的目的;
3.3 采集內(nèi)容
埋點時需要盡可能全面的采集數(shù)據(jù),主要包括以下信息:
-
用戶基本信息:描述用戶的基本屬性信息,包括用戶ID,性別,運營商,設(shè)備類型等
-
時間信息:事件發(fā)生的時間
-
行為信息:用戶做了哪些行為,比如點擊行為,瀏覽行為等
-
行為對象信息:用戶的行為作用在哪些對象上,比如點擊按鈕A,瀏覽頁面B,那么A,B就是用戶行為作用對象
另外,也可以從4w1h(who,when,where,what,how)五個維度來劃分埋點屬性
3.4 選擇埋點方式
選擇后端埋點還是前端埋點
比如像點擊、瀏覽、曝光這些行為便可以用前端埋點,主要是發(fā)生在用戶與界面的交互;如果是電商中要統(tǒng)計下單成功這個事件,客戶端是沒有辦法知道訂單是否成功的。
如果統(tǒng)計的事件里有需要用到后端的數(shù)據(jù),也是要進行后端埋點的。
3.5 埋點事件的格式
一般一條埋點數(shù)據(jù)需要記錄:事件ID、事件名(英文名、中文解釋)、事件屬性(屬性英文名、中文解釋、屬性類型)、埋點形式(前端/后端)、事件觸發(fā)時機(什么時候投遞這個事件)
3.6 埋點報文
報文(message)是網(wǎng)絡(luò)中交換與傳輸?shù)臄?shù)據(jù)單元,即站點一次性要發(fā)送的數(shù)據(jù)塊。
報文包含了將要發(fā)送的完整的數(shù)據(jù)信息,其長短很不一致,長度不限且可變。簡單來說就是用戶在App內(nèi)有一個操作行為,就會上報一組帶有數(shù)據(jù)的字段。這些字段組成一個報文。
4、數(shù)據(jù)存儲
4.1 存儲方式
根據(jù)埋點數(shù)據(jù)量和現(xiàn)有平臺選擇一種最合適的存儲方式。
-
Mysql: 使用于數(shù)據(jù)量較小,優(yōu)點讀寫方便
-
ES:現(xiàn)有埋點方案中,阿里日志系統(tǒng),通過ES查詢埋點結(jié)果
-
Hbase:適合數(shù)據(jù)量較大,可考慮使用現(xiàn)有hbase集群。
4.2 存儲頻率
采用【定時】+【定量】的方式,保證數(shù)據(jù)時效性和數(shù)據(jù)平滑處理。
-
定時:周期觸發(fā),進行存儲。避免當(dāng)數(shù)據(jù)量較小時很長一段時間不存儲。
-
定量:設(shè)置閾值,當(dāng)數(shù)據(jù)量達到一定量(1k)即進行存儲
-
程序退出:某用戶退出登錄時,需立馬進行存儲
5、埋點數(shù)據(jù)清洗
1、將埋點數(shù)據(jù)接入到數(shù)據(jù)倉庫(離線或者實時);
2、數(shù)據(jù)建模進行數(shù)據(jù)建模和數(shù)據(jù)清洗,過濾掉臟數(shù)據(jù),最終產(chǎn)出數(shù)據(jù)指標(biāo);
3、數(shù)據(jù)指標(biāo)通過數(shù)據(jù)報表、郵件、api等方式對外輸出。
6、埋點數(shù)據(jù)應(yīng)用
常見埋點分析指標(biāo):訪問數(shù)、訪客數(shù)、停留時長、頁面瀏覽數(shù)、跳出率、轉(zhuǎn)化率。
這些數(shù)據(jù)指標(biāo)為運營人員提供了決策依據(jù),幫助其不斷調(diào)整優(yōu)化運營政策、業(yè)務(wù)流程,從而達到最佳效果。
?
添加公眾號「信息技術(shù)智庫」:
🍅 硬核資料:20G,8大類資料,關(guān)注即可領(lǐng)取(PPT模板、簡歷模板、技術(shù)資料)
🍅 技術(shù)互助:技術(shù)群大佬指點迷津,你的問題可能不是問題,求資源在群里喊一聲。
🍅 面試題庫:由各個技術(shù)群小伙伴們共同投稿,熱乎的大廠面試真題,持續(xù)更新中。
🍅 知識體系:含編程語言、算法、大數(shù)據(jù)生態(tài)圈組件(Mysql、Hive、Spark、Flink)、數(shù)據(jù)倉庫、前端等。
👇👇送書抽獎丨技術(shù)互助丨粉絲福利👇👇
總結(jié)
以上是生活随笔為你收集整理的埋点技术:“呵呵,你在网上的一举一动,都在我眼皮子底下”的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 数据倾斜?几招把你安排的板板正正的!
- 下一篇: 瓦片地图与geoserver发布