大数据驱动业务决策,CDN实时日志重磅上线
背景
CDN是非常重要的互聯網基礎設施,用戶可以通過CDN,快速的訪問網絡中各種圖片,視頻等資源。在訪問過程中,CDN會產生大量的日志數據,而隨著如今越來越復雜的網絡環境變化,和業務的迅速增長,日志數據變得更大量、更多維度。這些數據通常都與用戶的下一步業務決策息息相關。
在與CDN用戶的溝通中,我們發現通常用戶會面臨以下困境:
??用戶無數據 :?CDN的訪問日志,由各大CDN產商上產生,用戶不可直接獲取。現階段,絕大部分的CDN產商都只提供離線日志下載,日志數據從產生,到用戶可下載,需要幾十分鐘到數個小時不等。這樣大的數據產生延時,大大削減了實時流處理、報警等高實時性要求場景的分析價值。
??多種分析需求:為了解決各類定制化的分析需求,通常的做法是搭建和運維開源系統,如用于做數據通道的kafka、流式分析的storm或flink、做數據分析的spark、hadoop等。
??可視化需求:對于最終的分析結果的展示,依賴數據庫(結果集小)、HBase(結果集大)存儲結果,再通過對接各可視化工具來完成。
綜上所述,更實時地、詳細地關注和分析日志的需求逐漸顯露,但是普通用戶對CDN日志進行實時、離線分析又并不容易,需要付出搭建、運維和管理成本,為了完成需求,有時還需要編寫不少代碼,但最終并不一定能得到很好的效果。整個CDN實時日志涉及的環節多,對服務質量也有嚴苛的要求,技術挑戰比較大。那有沒有更好的解決辦法么?
CDN實時日志一站式解決方案上線
近期,阿里云CDN上線了實時日志功能,打通日志服務(SLS)的能力,將CDN采集的實時日志,在小于60秒的時間內投遞至日志服務,進行實時、交互式分析和報表呈現。通過CDN日志的實時分析,可以快速的發現和定位問題,進而對日志數據的挖掘,提高數據的決策能力,將業務推向一個新的高度。點擊跳轉CDN實時日志專題頁,了解功能詳情。
CDN實時日志服務與日志下載的區別
CDN實時日志為實時采集的日志數據,日志數據延遲平均不超過30秒。同時,CDN打通了日志服務分析的能力,為客戶定制4張分析報表,可快速對日志進行分析,發現問題,及時決策。而CDN提供的離線日志下載,只能下載4小時前的每小時日志數據。
CDN實時日志系統中簡化的數據流向如下圖構成:
??數據實時采集 :?在直播推流、播放期間,都會產生大量日志,需要在秒級延時內,實時采集這些日志到日志中心。
??數據清洗:日志采集后,對數據進行清洗,以滿足不同場景的處理需求(如,對不同域名日志的定制化分析)。
??數據處理和存儲 :?對于不同的應用場景,數據的處理和存儲方式也不盡相同 。
CDN實時日志的價值
1. 實時
傳統的日志分析模式,需要您將日志下載后,重新上傳至數據倉庫,在數據倉庫進行一系列的清洗和數據模型定義后,再進數據分析,這個過程需要維護的人力較多,時間較長。
CDN實時日志可以從全球多個區域、數萬節點實時采集日志,通常延時不超過60秒,否則日志的實時價值大打折扣。同時,在開通服務后,CDN將日志數據自動投遞到日志服務(SLS),免去繁瑣的傳統日志分析的流程,實時查看日志分析結果。
2. 無需寫代碼,無需運維
前面也提到,想要自行搭建日志系統,解決業務定制化的需求,開發、運維、管理的成本是比較高的,接入CDN實時日志系統,可以讓開發者回歸業務的創新和性能本身,減少不必要的投入。
3. 多維度SQL分析,秒級10億+規模
CDN實時日志系統支持每天千億、萬億的日志7*24小時不間斷采集,并實時對海量日志進行多維度分析,流計算系統在毫秒級。讓用戶遠離日志分析中的各類繁雜“瑣事”,更加專注于和業務更緊密、更有價值的數據“分析”上。
同時,實時日志可以輕松應對數據處理組合維度大、計算復雜度大、各類流量高峰沖擊等業務場景。保存日志供用戶下載的對象存儲系統(Oss)可提供數據高吞吐下載能力,復雜的分析場景,可由數倉系統來支持。
4. 數據可視化及大數據挖掘
最終分析結果的展示也非常關鍵,CDN實時日志可以為用戶提供基于業務的可視化報表服務,用戶可輕松地掌控業務健康度、緩存命中率、平均下載速度、流量情況、網速、運營商、延時分布等數據。
5.日志、監控、告警聯動的一站式解決方案
在CDN場景下,對服務的可用性、性能要求苛刻,需要對于各類異常進行實時、準確的報警,這就需要依賴可靠的監控報警系統。CDN日志系統未來將和監控、告警、處理機制聯動,自動化的解決常規問題,縮短業務故障的時間,避免用戶損失。
五、典型應用場景
1. 直播推流
在直播場景下,CDN日志實時投遞至日志服務之后,可以做幾個典型的實時分析。
直播推流數據非常重要,當有了直播推流的日志之后,可掌控推流端各種實時狀態:
??推流概覽 :?實時知道當前的推流數量、各個推流的流量和速度、從各省、運營商維度統計
??推流質量:多維度的推流質量統計、重點推流的實時質量監控
??錯誤根源追蹤:快速定位錯誤產生的源頭(直播源、服務端、客戶端、運營商)
下圖是直播推流的各項監控統計,從整體的推流質量上來看,99%以上的推流都是正常的,說明推流的質量非常好。
下表統計了各類錯誤的產生原因,可以看到最大的錯誤來源是客戶端主動斷開。
2.CDN下行
播放端(CDN下行)是用戶直接接觸,其質量直接決定用戶觀看體驗,在下行日志中,我也可以從多個維度進行分析:
??整體質量:
健康度 : 在所有的訪問中,有多少請求是成功的
Cache命中率 : 命中率越高,用戶訪問延時越低,體驗越好
下載速度 : 這也是關系到播放質量的重要因素
??多維度分析:
top域名訪問次數、流量 : 重點域名的訪問質量
地域、運營商統計:各個鏈路的質量
下載量、速度、延時:多項關鍵指標
??錯誤診斷:
實時錯誤QPS、比例 : 整體錯誤情況
錯誤Top 域名、URI : 錯誤是否和自身相關
錯誤Top 地域、運營商 : 錯誤是否和外部因素相關
錯誤客戶端分別 : 是否是新發布版本引入的問題
在下圖中,可以看到,絕大部分錯誤,都是發生在這個客戶端版本,就需要懷疑是不是新的版本發布帶來的呢?
3.用戶行為分析
用戶的訪問行為,最終可體現在日志上,通過日志的分析,了解到用戶是如何進行訪問的,哪些資源是熱門資源,通過用戶的來源,更清楚了解用戶來源,以后的運營推廣也可以更具有針對性,除此之外,對異常IP進行監控,可更早發現異常,如高頻訪問的IP,是否存在爬取數據的嫌疑。
Demo演示:
當系統出現報警或有用戶投訴的情況下,通用的處理流程往往是相似的:
- 整體概述:整體訪問是否正常?
- 縮小范圍:是局部錯誤么,是哪個域名,或是哪個區域,再或者只是某個用戶?
- 精準定位:縮小調查范圍后,可對局部數據進行同比、環比的對比;觀察更詳細的日志;多個維度進行Adhoc的query分析。
在這個過程中可以發現,整個分析流程,是從上到下、從面到點、交互式的分析,涉及到Drill Down/Roll Up等多方面。因此,靈活和方便是系統必備的兩項。在以下的視頻中,展示如何在日志服務中,對CDN日志進行交互式的分析。
另外,我們也提供了一個Demo,可以實際體驗一下Mock的CDN日志分析:Demo連接
六、接入流程
目前實時日志功能已經在CDN控制臺上線,用戶可以通過簡單操作,快速的、無障礙的使用CDN實時日志的能力。主要步驟如下:
七、計費方式與活動
通常,實時日志按照推送成功條數,每萬條0.06元進行付費,該費用已經包含日志服務分析的費用。因此,在一定使用邊界內,您無需支付任何的日志服務費用。
但是在以下情況下,您還需要支付日志服務的費用:
1.日志存儲超過7天的存儲部分,由日志服務單獨收費。
2.日志服務的外網讀寫費用。
?
原文鏈接
本文為云棲社區原創內容,未經允許不得轉載。
總結
以上是生活随笔為你收集整理的大数据驱动业务决策,CDN实时日志重磅上线的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 对话阿里云Alex Chen:下一代存储
- 下一篇: 双11奇迹背后的大数据平台,不喧哗,自有