BI+AI 有没有前途?
文章來源:數據工匠俱樂部
0
從一個曲線圖說起
數據可視化只是數據分析中的一步,不是所有。今天,我們從一個數據可視化中典型的指標曲線開始說起。
(圖-1:某連鎖超市每個月利潤率的指標曲線)
如上圖,某個業務指標的趨勢很容易通過可視化展示出來,但缺憾在于,單純的可視化不能告訴用戶,某個節點指標大幅波動(上漲或下跌)背后的原因是什么。又是什么關鍵因素引起了這個波動?如果排除一個或多個關鍵因素后,可能會帶來什么變化?
然而這些問題,圖-1這樣簡單的可視化圖表無法直接給予用戶答案,通常要有資深業務經驗的分析師通過大量的分析操作,才能進一步解答。圖中數據指的是連鎖超市在一段時間內的利潤率變化,那么2015年1月利潤率的驟降是什么原因引起的?銷售時間/周期、地區/門店、品類、送貨方式,還是數據集中其他維度?分析師需要對每個維度做分析找原因,倘若品類維度是主要因素,那如何在成百上千個SKU里找到關鍵影響因子?可能需要分析師逐個排除尋找。
在數據分析技術飛速發展的今天,是否有方式,來加速、簡化整個分析過程?或者有沒有一種方式可以降低準入門檻,在資深分析師人才短缺的情況下,讓更多數據分析師,通過工具能力具備相關技能,加速實現業務目標?
近年來,一個逐漸被大家熟悉的產品能力 —— 自動數據洞察,恰好可以回答上述問題。
1
增強分析與數據洞察
1.1 什么是增強分析 Augmented Analytics
談自動數據洞察,自然繞不開“AI+BI”以及“增強分析”。AI+BI ?是商業智能的發展趨勢,但這個趨勢并不是全新的概念,已經被提出幾年了。但行業一直有一個疑問,AI + BI 在實際業務中是否可行?該如何與業務結合?是否適應中國市場需要?
面對質疑,答案是近年來 BI 領域關鍵能力“增強分析”的出現和強勢發展。
增強分析,指使用低代碼的 AI 或 ML 工具,通過自動化方式來協助數據準備、數據分析、分析結果洞察和解釋、分享等過程。增強分析可以幫助各類用戶發現現有數據中可能被忽視的洞察,并探索新數據,從而增強各類用戶在 BI 平臺中探索和分析數據能力的方式。
事實上,增強分析并不是指某一種特定的功能,而是讓AI能力與BI結合,讓更多用戶、尤其是業務人員把數據分析用起來。當前行業已認可的增強分析相關產品能力,主要有數據目錄、數據故事、自動數據洞察、NLG & NLQ 等等。這其中,自動數據洞察則是目前業務中需求最明確的。
增強分析在中國市場的發展情況如何?據 2022 Gartner 最新的 Hype Cycle 技術曲線,增強分析整體正處于"幻滅的低谷",但接近于“slope of enlightenment”,很快會迎來曙光,是未來2-5年內重點關注的趨勢。
的確,在中國市場 BI 領域在一定程度上仍落后于國際廠商(例如數據目錄、數據故事等增強分析能力),但部分能力的發展已經在追趕中,并在逐漸縮小差距。例如,中國主流 BI 廠商基本具備了自動數據洞察的產品能力,不過能否將產品能力轉化為業務價值,大部分廠商仍在探索之中。
1.2 什么是自動數據洞察 Automated Insight
自動數據洞察能力指的是通過自動執行數據的相關性、聚類、預測、歸因等分析,并提供可解釋的結果,從而讓業務用戶無需具備AI知識和構建能力,即可洞察數據,并敘述發現。
絕大部分業務用戶不是統計學大師,更不是算法專家。自動數據洞察基于 AI 能力,利用經過訓練的模型,來對數據進行自動分析,讓用戶無需具備專業知識也能獲得分析結果,并排除了不同用戶對數據不同理解的干擾。基于自動數據洞察,結合文本解釋,提供統一見解。
以本文開篇圖-1為例,基于自動數據洞察,可以為用戶解讀異常點(即利潤率在某月大幅下降)背后的關鍵因素。
基于自動數據洞察能力的分析和解讀,可以看到利潤率下降的關鍵因素是與商品品類相關(如[Segment]、[Cateogry]、[SubCategory] ,其中 [Furniture] 是利潤率變化的主要因子,排除其影響后,總體利潤率變化從下降 30.97% 變為下降 22.07%。這就是數據洞察的作用,可自動提供可解釋的結果,即便用戶并不是“數據分析專家”。
(圖-2:對圖-1中異常點的自動數據洞察)
拋開自動數據洞察的優勢,其本身也存在一定局限性:雖然為用戶直接提供了結果,但無法要求用戶理解業務結果。用戶可能會產生片面的解讀,導致只知其一不知其二。?
因此,自動數據洞察和業務場景的結合、用戶了解自動洞察生成的方式非常重要。可惜的是當前市場上大多廠商及其產品不能開放配置來讓用戶理解或定制結果的生成方式。
(圖-3:PowerBI - Insights)
2
自動數據洞察介紹
前文介紹了 BI 行業發展趨勢中的增強分析,以及增強分析當下最可能對業務產生價值的功能“自動數據洞察”。下面將介紹自動數據洞察的技術實現。
2.1 自動數據洞察的執行過程
一個完整的自動數據洞察鏈路,通常包括以下主要環節:
找異常:對數值波動的識別,即找到可視化結果中的異常。一般涉及對波動的拆分和對異常點的動態識別,如在預測值上剔除正常波動取異常點;
做分析:對波動數值做歸因分析,找出引起異常的關鍵因素。如對多維度的關鍵因子分析,對特定維度或組合維度進一步挖掘分析等;
說人話:分析結果的解釋和展示,包括結論、指標變化的解讀、關鍵因子的排名及解釋等。
2.2 自動數據洞察的技術實現
下表羅列了自動數據洞察常用的技術。大部分 BI 廠商一般會基于其中的一個或若干個技術能力,來提供自動數據洞察產品能力。
關鍵因子分析 | 自動識別數據集中的關鍵驅動因素(也稱為最重要的屬性) 關鍵因子分析的常用做法: 統計方法,如利用z-score等統計信息,來判斷因子本身的信息量大小。 模型方法,通過機器學習模型對數據進行擬合,找出重要度高的因子。 |
異常探測 | 動態監控業務變化,基于用戶角色或業務流程對用戶自動預警異常值, 而不是單純基于閾值的預警。 統計方法,如grubbs test, esd等統計方法來判斷是否為異常。 模型方法,使用isolation forest等模型方法來進行異常判斷。 |
聚類分析 | 對數據集做自動聚類分析。K-means等聚類算法。 |
預測分析 | 基于數據集中的連續變量做自動預測,能夠解釋后臺方法,并顯示預測誤差。 數據解釋中不太需要做未來預測。 |
影響度分析 | 對解釋目標進行線性模型擬合,獲取各因子的權重值。 |
Data Limits | 分析師配置參與模型計算的變量及其邊界的能力。 |
可解釋的AI? | 自動數據洞察的結果,平臺能夠自動生成并呈現可被業務用戶理解的解讀報告。? |
2.3 自動數據洞察的業務場景
自動數據洞察,能幫助用戶更好的洞察數據,可以發現數據相關性,可以解釋波動背后的關鍵因素等等。但無論什么樣的產品能力,都需要結合可落地的業務,并產出實際業務價值。自動數據洞察也一樣,它在 BI 中不是一個孤立的能力,需要結合 BI 平臺整體產品,最終為用戶的業務場景服務。
要實現自動數據洞察在業務層面的分析,離不開業務專家的輸入,最終結果的解讀和決策,也離不開業務專家的參與,畢竟業務專家才是最了解業務和實際場景的人 (用戶才是業務專家)。
舉例一個最常見的,也最簡單的業務場景:對于 BI 分析結果中的異常值,進行自動數據洞察,并根據分析結果進行決策,采取行動。
(圖-4 業務場景示例)
從這樣一個簡單的業務場景,來看 BI 整體產品和自動數據洞察,需要具備什么樣的能力:
結合 BI 平臺的各項功能。自動數據洞察作為 BI 整體產品的一部分,它的使用與落地,一定要與 BI 分析銜接起來。數據洞察本身是對數據分析結果的進一步深入計算和分析,但不僅是分析本身,重點在于能否與 BI 平臺整體能力,如分享、預警、推送等功能結合起來,形成完整的業務解決方案。
貼合業務的可配置能力。業務場景千千萬,沒有一個固定的分析套路可以滿足所有的業務場景需求。不同行業、不同維度的分析框架在不同場景下可能完全不適用。那么能讓業務用戶根據自身場景,對分析策略進行 0 代碼配置的能力,成為了自動數據洞察能否取得業務成功的關鍵要素。
支撐復雜場景的分析深度與靈活度。在一些典型的業務場景中,如經營分析、渠道分析、流量分析等,依靠固定的看板,或者分析師思路,洞察數據相當困難:分析的維度復雜,幾十個甚至幾百個維度;維度的取值較多,上百甚至上千個SKU;KPI難以直觀分析,可視化取值變化最大的不一定是貢獻最大的因素;需多個維度的交叉分析,例如同時綜合渠道和品類分析;既要成分分析,也要對比分析,例如觀察當月的波動情況時,還要和同比環比進行比較分析。
易于理解的解釋報告。自動數據洞察生成的分析結果對于業務用戶,通常難以理解或解讀,那自然也不能直接用于決策。此時則需要分析師或者業務專家的解讀,以助力決策者理解分析結果并進行決策。如下圖:自動數據洞察給出了影響貢獻排名的幾個關鍵維度分析,如“華北”對大盤的貢獻度在“地區”維度中排列第一。但著背后最關鍵的因素是什么,有什么全局的結論,還是不能直接得出,仍需進一步通過分析和解讀才能得出結論。因此解釋報告是否易于理解,關系到業務分析師以及決策者能否輕松洞察業務結論。
(圖-5:火山引擎智能歸因的分析結果)
決策或行動的閉環能力。有了易于解讀的分析結論,下一步就是基于分析結果做決策。是否能形成決策閉環,是自動數據洞察能否產生持續業務價值的決定性因素。雖說目前市場上大部分相關產品還不完全具備該項能力,但在整體產品技術發展趨勢下,也正在逐步完善中。
持續反饋、優化迭代能力。自動數據洞察本身基于 AI 算法能力,因此也沒有一勞永逸的算法實現,都需要持續的優化迭代。通過用戶對洞察結果輸入的持續反饋,AI 算法基于用戶反饋自動調優,逐步迭代出更加適合企業特定業務的數據洞察。
3
廠商案例
Tableau - Explain Data
海外廠商 Tableau 自動數據洞察功能叫做“數據解釋 / Explain Data”。分析師在編輯視圖時運行“數據解釋”功能時,Tableau會生成統計模型和可解釋的建議。Tableau“數據解釋”依托于 Tableau的愛因斯坦服務,背靠強大 AI 能力,應該會有不錯的分析效果。但依托愛因斯坦服務的背面是“數據解釋”不支持私有化部署,這對國內企業客戶并不是很友好。此外,Tableau的“數據解釋”目前不支持多維度分析,對復雜的業務場景支持尚有不足。
(圖-6:Tableau - Explain Data)
QuickBI -波動原因分析
國內主流云廠商阿里云 BI 產品 QuickBI 的對應功能名為“波動原因分析”。通過機器智能算法自動拆解分析核心指標波動的原因,并拆解維度或度量。QuickBI 的波動原型分析支持業務配置,界面簡單,同時支持見解報告生成。不過其分析模型要求維度中必須有“日期類型”字段,也不支持成分分析,因此分析復雜度和靈活度還有增強空間。
(圖-7:QuickBI -波動原因分析)
觀遠數據 - 數據解釋
國內創新 BI 廠商觀遠數據同樣提供深層數據洞察功能,在觀遠數據一站式智能分析平臺 Galaxy 中,數據洞察能力被命名為 “數據解釋”。該數據解釋,可基于業務配置,對數據做成分分析和對比分析,通過找出關鍵因子、對關鍵因子做假設分析、對關鍵因子做二次挖掘等分析,提供深入數據見解,其解釋報告的內容可讀性也較高。觀遠數據是一家很早就堅持 AI + BI,并在 AI 能力上已有較深沉淀的公司,至于其數據解釋產品功能的效果,讓我們拭目以待。有興趣更多了解觀遠數據,可以點擊文末閱讀原文體驗DEMO。
(圖-8:觀遠數據 - 數據解釋)
4
業務目標才是自動數據洞察最終目的
自動數據洞察最終的目的,不是把數據分析的結果羅列出來,而是通過降低技術門檻、提升分析效率、簡化路徑等方式,為企業提供能夠解決業務問題的洞察見解,并與企業決策鏈路連接起來。??
在中國市場,數據洞察在業務的落地,仍然在摸索階段。只有功能,沒有場景和方案,在國內是落不了地的。如何讓業務用起來,可以參照前文的基礎場景。構建 BI 整體能力,與業務肩并肩緊密合作,將是未來突破的方向。?
●整理了4000字的數據可視化指南! ●SQL優化的魅力總結
以上是生活随笔為你收集整理的BI+AI 有没有前途?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Python 微博奔驰事件爬虫
- 下一篇: 2021年7月4日