當前位置:
首頁 >
[转]数据仓库,OLAP与数据挖掘之间的关系
發(fā)布時間:2025/3/20
39
豆豆
生活随笔
收集整理的這篇文章主要介紹了
[转]数据仓库,OLAP与数据挖掘之间的关系
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
要說明他們的關(guān)系,不得不說說商務(wù)智能。從技術(shù)角度看,商務(wù)智能的過程是企業(yè)的決策人員以企業(yè)中的數(shù)據(jù)倉庫為基礎(chǔ),經(jīng)由聯(lián)機分析處理工具、數(shù)據(jù)挖掘工具加上決策規(guī)劃人員的專業(yè)知識,從數(shù)據(jù)中獲得有用的信息和知識,幫助企業(yè)獲取利潤。
數(shù)據(jù)倉庫是一個用以更好地支持企業(yè)或組織的決策分析處理的的數(shù)據(jù)集合,它有面向主題、集成、相對穩(wěn)定、隨時間不斷變化四個特性,將數(shù)據(jù)倉庫與傳統(tǒng)的面向事務(wù)處理的數(shù)據(jù)庫區(qū)分開來。數(shù)據(jù)倉庫的關(guān)鍵技術(shù)包括數(shù)據(jù)的抽取、清洗、轉(zhuǎn)換、加載和維護技術(shù)。
聯(lián)機分析處理(OLAP)是以海量數(shù)據(jù)為基礎(chǔ)的復(fù)雜分析技術(shù)。它支持各級管理決策人員從不同的角度、快速靈活地對數(shù)據(jù)倉庫中的數(shù)據(jù)進行復(fù)雜查詢和多維分析處理,并且能以直觀易懂的形式將查詢和分析結(jié)果展現(xiàn)給決策人員。
OLAP使用的邏輯數(shù)據(jù)模型為多維數(shù)據(jù)模型。
常用的OLAP多維分析操作有上卷、下鉆、切片、切塊、旋轉(zhuǎn)等。多維數(shù)據(jù)模型在物理實現(xiàn)時,主要有三種方式:ROLAP結(jié)構(gòu)、MOLAP結(jié)構(gòu)和HOLAP結(jié)構(gòu)。其中ROLAP是基于關(guān)系數(shù)據(jù)庫的OLAP實現(xiàn), MOLAP是基于多維數(shù)據(jù)組織的OLAP實現(xiàn),HOLAP是基于混合數(shù)據(jù)組織的OLAP實現(xiàn)。
數(shù)據(jù)挖掘(Data Mining)是從海量數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的但又可能有用的信息和知識的過程。數(shù)據(jù)挖掘的數(shù)據(jù)有多種來源,包括數(shù)據(jù)倉庫、數(shù)據(jù)庫或其他數(shù)據(jù)源。所有的數(shù)據(jù)都需要再次進行選擇,具體的選擇方式與任務(wù)相關(guān)。挖掘的結(jié)果需要進行評價才能最終成為有用的信息,按照評價結(jié)果的不同,數(shù)據(jù)可能需要反饋到不同的階段,重新進行分析計算。數(shù)據(jù)挖掘的常用方法包括關(guān)聯(lián)分析、分類和預(yù)測、聚類、檢測離群點、趨勢和演變分析等。
可以說:聯(lián)機分析處理和數(shù)據(jù)挖掘是數(shù)據(jù)倉庫之上的增值技術(shù)。
在理論研究上,OLAP技術(shù)的研究人員主要來自數(shù)據(jù)庫界,重點研究CUBE壓縮與計算、實體化視圖的選擇與維護、多維數(shù)據(jù)的索引和多維查詢處理等技術(shù),以便能夠在海量數(shù)據(jù)上提供秒級的分析請求響應(yīng)時間。數(shù)據(jù)挖掘技術(shù)的研究人員來自人工智能、統(tǒng)計、數(shù)據(jù)庫界,其研究主要集中在各種挖掘算法和評價方法上,研究可伸縮的數(shù)據(jù)挖掘方法、基于約束的挖掘方法、復(fù)雜數(shù)據(jù)類型的挖掘等。
數(shù)據(jù)倉庫,OLAP與數(shù)據(jù)挖掘之間的關(guān)系 聯(lián)機分析處理和數(shù)據(jù)挖掘雖然是數(shù)據(jù)倉庫上獲取兩種不同目標的數(shù)據(jù)增值技術(shù),但這兩類技術(shù)如果能夠在一定程度上融合,會使分析操作智能化,使挖掘操作目標化,從而全面提升商務(wù)智能技術(shù)的實用價值。即:一方面,聯(lián)機分析技術(shù)可以為數(shù)據(jù)挖掘提供預(yù)期的挖掘?qū)ο蠛湍繕?#xff0c;避免挖掘的盲目性。另一方面,數(shù)據(jù)挖掘技術(shù)可以使聯(lián)機分析處理智能化,減少分析人員手工操作的繁雜性,減輕分析人員的負擔。例如,當分析人員在手工分析操作中發(fā)現(xiàn)離群點數(shù)據(jù),可以有針對性地直接對此數(shù)據(jù)利用數(shù)據(jù)挖掘技術(shù)尋找原因,從中找出惡意違規(guī)或發(fā)現(xiàn)新的需求點。又如,在數(shù)據(jù)分析過程中,通過跟蹤分析人員的操作過程,利用數(shù)據(jù)挖掘技術(shù)預(yù)測他可能感興趣的操作和數(shù)據(jù),提前預(yù)計算或預(yù)取數(shù)據(jù),從而提高分析操作的響應(yīng)時間。 因此可以說,基于數(shù)據(jù)倉庫的聯(lián)機分析處理技術(shù)與數(shù)據(jù)挖掘技術(shù)的融合和互補,將是商務(wù)智能技術(shù)發(fā)展的未來走向。
數(shù)據(jù)倉庫是一個用以更好地支持企業(yè)或組織的決策分析處理的的數(shù)據(jù)集合,它有面向主題、集成、相對穩(wěn)定、隨時間不斷變化四個特性,將數(shù)據(jù)倉庫與傳統(tǒng)的面向事務(wù)處理的數(shù)據(jù)庫區(qū)分開來。數(shù)據(jù)倉庫的關(guān)鍵技術(shù)包括數(shù)據(jù)的抽取、清洗、轉(zhuǎn)換、加載和維護技術(shù)。
聯(lián)機分析處理(OLAP)是以海量數(shù)據(jù)為基礎(chǔ)的復(fù)雜分析技術(shù)。它支持各級管理決策人員從不同的角度、快速靈活地對數(shù)據(jù)倉庫中的數(shù)據(jù)進行復(fù)雜查詢和多維分析處理,并且能以直觀易懂的形式將查詢和分析結(jié)果展現(xiàn)給決策人員。
OLAP使用的邏輯數(shù)據(jù)模型為多維數(shù)據(jù)模型。
常用的OLAP多維分析操作有上卷、下鉆、切片、切塊、旋轉(zhuǎn)等。多維數(shù)據(jù)模型在物理實現(xiàn)時,主要有三種方式:ROLAP結(jié)構(gòu)、MOLAP結(jié)構(gòu)和HOLAP結(jié)構(gòu)。其中ROLAP是基于關(guān)系數(shù)據(jù)庫的OLAP實現(xiàn), MOLAP是基于多維數(shù)據(jù)組織的OLAP實現(xiàn),HOLAP是基于混合數(shù)據(jù)組織的OLAP實現(xiàn)。
數(shù)據(jù)挖掘(Data Mining)是從海量數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的但又可能有用的信息和知識的過程。數(shù)據(jù)挖掘的數(shù)據(jù)有多種來源,包括數(shù)據(jù)倉庫、數(shù)據(jù)庫或其他數(shù)據(jù)源。所有的數(shù)據(jù)都需要再次進行選擇,具體的選擇方式與任務(wù)相關(guān)。挖掘的結(jié)果需要進行評價才能最終成為有用的信息,按照評價結(jié)果的不同,數(shù)據(jù)可能需要反饋到不同的階段,重新進行分析計算。數(shù)據(jù)挖掘的常用方法包括關(guān)聯(lián)分析、分類和預(yù)測、聚類、檢測離群點、趨勢和演變分析等。
可以說:聯(lián)機分析處理和數(shù)據(jù)挖掘是數(shù)據(jù)倉庫之上的增值技術(shù)。
在理論研究上,OLAP技術(shù)的研究人員主要來自數(shù)據(jù)庫界,重點研究CUBE壓縮與計算、實體化視圖的選擇與維護、多維數(shù)據(jù)的索引和多維查詢處理等技術(shù),以便能夠在海量數(shù)據(jù)上提供秒級的分析請求響應(yīng)時間。數(shù)據(jù)挖掘技術(shù)的研究人員來自人工智能、統(tǒng)計、數(shù)據(jù)庫界,其研究主要集中在各種挖掘算法和評價方法上,研究可伸縮的數(shù)據(jù)挖掘方法、基于約束的挖掘方法、復(fù)雜數(shù)據(jù)類型的挖掘等。
數(shù)據(jù)倉庫,OLAP與數(shù)據(jù)挖掘之間的關(guān)系 聯(lián)機分析處理和數(shù)據(jù)挖掘雖然是數(shù)據(jù)倉庫上獲取兩種不同目標的數(shù)據(jù)增值技術(shù),但這兩類技術(shù)如果能夠在一定程度上融合,會使分析操作智能化,使挖掘操作目標化,從而全面提升商務(wù)智能技術(shù)的實用價值。即:一方面,聯(lián)機分析技術(shù)可以為數(shù)據(jù)挖掘提供預(yù)期的挖掘?qū)ο蠛湍繕?#xff0c;避免挖掘的盲目性。另一方面,數(shù)據(jù)挖掘技術(shù)可以使聯(lián)機分析處理智能化,減少分析人員手工操作的繁雜性,減輕分析人員的負擔。例如,當分析人員在手工分析操作中發(fā)現(xiàn)離群點數(shù)據(jù),可以有針對性地直接對此數(shù)據(jù)利用數(shù)據(jù)挖掘技術(shù)尋找原因,從中找出惡意違規(guī)或發(fā)現(xiàn)新的需求點。又如,在數(shù)據(jù)分析過程中,通過跟蹤分析人員的操作過程,利用數(shù)據(jù)挖掘技術(shù)預(yù)測他可能感興趣的操作和數(shù)據(jù),提前預(yù)計算或預(yù)取數(shù)據(jù),從而提高分析操作的響應(yīng)時間。 因此可以說,基于數(shù)據(jù)倉庫的聯(lián)機分析處理技術(shù)與數(shù)據(jù)挖掘技術(shù)的融合和互補,將是商務(wù)智能技術(shù)發(fā)展的未來走向。
轉(zhuǎn)載于:https://www.cnblogs.com/csuwhl/archive/2007/05/19/752774.html
總結(jié)
以上是生活随笔為你收集整理的[转]数据仓库,OLAP与数据挖掘之间的关系的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 在ASP.NET中上传图片并生成缩略图
- 下一篇: 阳光遗忘的角落