数据仓库与数据挖掘相关基础概念
摘錄及整理自互聯(lián)網(wǎng):
名詞:
?BI(Business Intelligence):商業(yè)智能,
?
?DW(Data Warehouse):數(shù)據(jù)倉庫,詳見正文Q1部分。
?
?OLTP(On-Line Transaction Processing):聯(lián)機事務(wù)處理
也稱為面向交易的處理系統(tǒng),其基本特征是顧客的原始數(shù)據(jù)可以立即傳送到計算中心進行處理,并在很短的時間內(nèi)給出處理結(jié)果。這樣做的最大優(yōu)點是可以即時地處理輸入的數(shù)據(jù),及時地回答。也稱為實時系統(tǒng)(Real time System)。衡量聯(lián)機事務(wù)處理系統(tǒng)的一個重要性能指標(biāo)是系統(tǒng)性能,具體體現(xiàn)為實時響應(yīng)時間(Response Time),即用戶在終端上送入數(shù)據(jù)之后,到計算機對這個請求給出答復(fù)所需要的時間。
OLTP 數(shù)據(jù)庫旨在使事務(wù)應(yīng)用程序僅寫入所需的數(shù)據(jù),以便盡快處理單個事務(wù)。
?
?OLAP(On-Line Analytical Processing):聯(lián)機分析處理
????? OLAP是E.F.Codd于1993年提出的。?
OLAP理事會的定義:OLAP是一種軟件技術(shù),他使分析人員能夠迅速、一致、交互地從各個方面觀察信息,以達到深入理解數(shù)據(jù)的目的,這些信息是從原始數(shù)據(jù)直接轉(zhuǎn)換過來的,他們以用戶容易理解的方式反映企業(yè)的真實情況。?
OLAP大部分策略都是將關(guān)系型的或普通的數(shù)據(jù)進行多維數(shù)據(jù)存貯,以便于進行分析,從而達到聯(lián)機分析處理的目的。這種多維DB也被看作一個超立方體,沿著各個維方向存貯數(shù)據(jù),它允許用戶沿事物的軸線方便地分析數(shù)據(jù),與主流業(yè)務(wù)型用戶相關(guān)的分析形式一般有切片和切塊以及下鉆、挖掘等操作。
?
?DataMart:數(shù)據(jù)集市,為了特定的應(yīng)用目的或應(yīng)用范圍,而從數(shù)據(jù)倉庫中獨立出來的一部分?jǐn)?shù)據(jù),也可稱為部門數(shù)據(jù)或主題數(shù)據(jù)(subjectarea)。在數(shù)據(jù)倉庫的實施過程中往往可以從一個部門的數(shù)據(jù)集市著手,以后再用幾個數(shù)據(jù)集市組成一個完整的數(shù)據(jù)倉庫。需要注意的就是再實施不同的數(shù)據(jù)集市時,同一含義的字段定義一定要相容,這樣再以后實施數(shù)據(jù)倉庫時才不會造成大麻煩。
?
?Data Mining:數(shù)據(jù)挖掘,詳見正文Q5部分
?
?ETL:ETL分別是“Extract”、“ Transform” 、“Load”三個單詞的首字母縮寫也就是“抽取”、“轉(zhuǎn)換”、“裝載”,但我們?nèi)粘M喎Q其為數(shù)據(jù)抽取。ETL是BI/DW(商務(wù)智能/數(shù)據(jù)倉庫)的核心和靈魂,按照統(tǒng)一的規(guī)則集成并提高數(shù)據(jù)的價值,是負(fù)責(zé)完成數(shù)據(jù)從數(shù)據(jù)源向目標(biāo)數(shù)據(jù)倉庫轉(zhuǎn)化的過程,是實施數(shù)據(jù)倉庫的重要步驟。
?
?MetaData:元數(shù)據(jù),元數(shù)據(jù)是描述數(shù)據(jù)倉庫內(nèi)數(shù)據(jù)的結(jié)構(gòu)和建立方法的數(shù)據(jù)。可將其按用途的不同分為兩類,技術(shù)元數(shù)據(jù)和商業(yè)元數(shù)據(jù)。技術(shù)元數(shù)據(jù)是數(shù)據(jù)倉庫的設(shè)計和管理人員用于開發(fā)和日常管理數(shù)據(jù)倉庫是用的數(shù)據(jù)。包括:數(shù)據(jù)源信息;數(shù)據(jù)轉(zhuǎn)換的描述;數(shù)據(jù)倉庫內(nèi)對象和數(shù)據(jù)結(jié)構(gòu)的定義;數(shù)據(jù)清理和數(shù)據(jù)更新時用的規(guī)則;源數(shù)據(jù)到目的數(shù)據(jù)的映射;用戶訪問權(quán)限,數(shù)據(jù)備份歷史記錄,數(shù)據(jù)導(dǎo)入歷史記錄,信息發(fā)布?xì)v史記錄等。
?????? 商業(yè)元數(shù)據(jù)從商業(yè)業(yè)務(wù)的角度描述了數(shù)據(jù)倉庫中的數(shù)據(jù)。包括:業(yè)務(wù)主題的描述,包含的數(shù)據(jù)、查詢、報表;
?????? 元數(shù)據(jù)為訪問數(shù)據(jù)倉庫提供了一個信息目錄(informationdirectory),這個目錄全面描述了數(shù)據(jù)倉庫中都有什么數(shù)據(jù)、這些數(shù)據(jù)怎么得到的、和怎么訪問這些數(shù)據(jù)。是數(shù)據(jù)倉庫運行和維護的中心,數(shù)據(jù)倉庫服務(wù)器利用他來存貯和更新數(shù)據(jù),用戶通過他來了解和訪問數(shù)據(jù)。
?
?
?Q1:什么是數(shù)據(jù)倉庫?
數(shù)據(jù)倉庫是一個面向主題的( Subject Oriented) 、集成的( Integrate) 、相對穩(wěn)定的(NonVolatile) 、反映歷史變化( Time Variant)的數(shù)據(jù)集合,用于支持管理決策。對于數(shù)據(jù)倉庫的概念我們可以從兩個層次予以理:①數(shù)據(jù)倉庫用于支持決策,面向分析型數(shù)據(jù)處理,它不同于企業(yè)現(xiàn)有的操作型數(shù)據(jù)庫;②數(shù)據(jù)倉庫是對多個異構(gòu)數(shù)據(jù)源的有效集成,集成后按照主
題進行了重組,并包含歷史數(shù)據(jù),而且存放在數(shù)據(jù)倉庫中的數(shù)據(jù)一般不再修改。企業(yè)數(shù)據(jù)倉庫的建設(shè)是以現(xiàn)有企業(yè)業(yè)務(wù)系統(tǒng)和大量業(yè)務(wù)數(shù)據(jù)的積累為基礎(chǔ)。數(shù)據(jù)倉庫不是靜態(tài)的概念,只有把信息及時交給需要這些信息的使用者,供他們作出改善其業(yè)務(wù)經(jīng)營的決策,信息才能發(fā)揮作用,信息才有意義。而把信息加以整理、歸納和重組,并及時提供給相應(yīng)的管理決策人員是數(shù)據(jù)倉庫的根本任務(wù)。
?
?Q2:為什么要建立數(shù)據(jù)倉庫?
?????? 企業(yè)建立數(shù)據(jù)倉庫是為了填補現(xiàn)有數(shù)據(jù)存儲形式已經(jīng)不能滿足信息分析的需要。數(shù)據(jù)倉庫理論中的一個核心理念就是:事務(wù)型數(shù)據(jù)和決策支持型數(shù)據(jù)的處理性能不同。
?????? 企業(yè)在它們的事務(wù)操作收集數(shù)據(jù)。在企業(yè)運作過程中:隨著定貨、銷售記錄的進行,這些事務(wù)型數(shù)據(jù)也連續(xù)的產(chǎn)生。為了引入數(shù)據(jù),我們必須優(yōu)化事務(wù)型數(shù)據(jù)庫。
?????? 處理決策支持型數(shù)據(jù)時,一些問題經(jīng)常會被提出:哪類客戶會購買哪類產(chǎn)品?促銷后銷售額會變化多少?價格變化后或者商店地址變化后銷售額又會變化多少呢?在某一段時間內(nèi),相對其他產(chǎn)品來說哪類產(chǎn)品特別容易賣呢?哪些客戶增加了他們的購買額?哪些客戶又削減了他們的購買額呢?
?????? 事務(wù)型數(shù)據(jù)庫可以為這些問題作出解答,但是它所給出的答案往往并不能讓人十分滿意。在運用有限的計算機資源時常常存在著競爭。在增加新信息的時候我們需要事務(wù)型數(shù)據(jù)庫是空閑的。而在解答一系列具體的有關(guān)信息分析的問題的時候,系統(tǒng)處理新數(shù)據(jù)的有效性又會被大大降低。另一個問題就在于事務(wù)型數(shù)據(jù)總是在動態(tài)的變化之中的。決策支持型處理需要相對穩(wěn)定的數(shù)據(jù),從而問題都能得到一致連續(xù)的解答。
?????? 數(shù)據(jù)倉庫的解決方法包括:將決策支持型數(shù)據(jù)處理從事務(wù)型數(shù)據(jù)處理中分離出來。數(shù)據(jù)按照一定的周期(通常在每晚或者每周末),從事務(wù)型數(shù)據(jù)庫中導(dǎo)入決策支持型數(shù)據(jù)庫——既“數(shù)據(jù)倉庫”。數(shù)據(jù)倉庫是按回答企業(yè)某方面的問題來分“主題”組織數(shù)據(jù)的,這是最有效的數(shù)據(jù)組織方式。
?????? 另外,企業(yè)日常運作的信息系統(tǒng)一般是由多個傳統(tǒng)系統(tǒng)、不兼容數(shù)據(jù)源、數(shù)據(jù)庫與應(yīng)用所共同構(gòu)成的復(fù)雜數(shù)據(jù)集合,各個部分之間不能彼此交流。從這個層面看:目前運行的應(yīng)用系統(tǒng)是用戶花費了很大精力和財力構(gòu)建的、不可替代的系統(tǒng),特別是系統(tǒng)的數(shù)據(jù)。而建立數(shù)據(jù)倉庫的目的就是要把這些不同來源的數(shù)據(jù)整合組織起來統(tǒng)一管理,從而做到數(shù)據(jù)的一致性與集成化,提供一個全面的,單一入口的解決方案。這個讓我聯(lián)想到SOA的理念,不過前者是數(shù)據(jù)層面的整合優(yōu)化,后者是應(yīng)用服務(wù)層面的整合優(yōu)化。
?
?Q3:數(shù)據(jù)倉庫的一般結(jié)構(gòu)是怎樣的?
? 1.體系結(jié)構(gòu):
(1)數(shù)據(jù)源是數(shù)據(jù)倉庫系統(tǒng)的基礎(chǔ),是整個系統(tǒng)的數(shù)據(jù)源泉,通常包括企業(yè)內(nèi)部信息和外部信息。
(2)數(shù)據(jù)的存儲與管理是整個數(shù)據(jù)倉庫系統(tǒng)的核心。數(shù)據(jù)倉庫按照數(shù)據(jù)的覆蓋范圍可以分為企業(yè)級數(shù)據(jù)倉庫和部門級數(shù)據(jù)倉庫(通常稱為數(shù)據(jù)集市) 。
(3)OLAP (On Line Analytical Processing)服務(wù)器對分析需要的數(shù)據(jù)進行有效集成,按多維模型予以組織,以便進行多角度、多層次的分析,并發(fā)現(xiàn)趨勢。
(4)前端工具主要包括各種報表工具、查詢工具、數(shù)據(jù)分析工具、數(shù)據(jù)挖掘工具以及各種基于數(shù)據(jù)倉庫或數(shù)據(jù)集市的應(yīng)用開發(fā)工具。
?
?2.事實表和維表
事實表和維表是多維模型中的兩個基本概念。
事實表是數(shù)據(jù)分析所對應(yīng)的主要數(shù)據(jù)項,一般是企業(yè)內(nèi)的某項業(yè)務(wù)或某個事件。事實表中的事實一般具有數(shù)據(jù)特性和可加性,事實表中可以存儲不同粒度的數(shù)據(jù),同一主題中不同粒度的數(shù)據(jù)一般存儲在不同的事實表中。
維表中包含的一般是描述性的文本信息,這些文本信息將成為事實表的檢索條件。維表中的維屬性應(yīng)該具體明確,體現(xiàn)出維層次的劃分,能夠成為分析型查詢的約束條件,這是數(shù)據(jù)倉庫與操作型應(yīng)用在數(shù)據(jù)模型設(shè)計上的一個不同點。維表層次的級別數(shù)量取決于查詢 的粒度。在實際業(yè)務(wù)環(huán)境中,多維數(shù)據(jù)模型一般含有4~15維,更多的維數(shù)或更少的維數(shù)一般都很少見。在具體工作中,設(shè)計人員一定要根據(jù)企業(yè)的實際情況確定相應(yīng)的維。
在多維模型中,事實表的主碼是組合碼,維表的主碼是簡單碼,事實表中與維表主碼相對應(yīng)的各個組成部分是外碼。事實表通過與各維相對應(yīng)的外碼值同維表聯(lián)系在一起。查詢時通過事實表和維表之間的這種對應(yīng)關(guān)系。
?
? 3.數(shù)據(jù)組織結(jié)構(gòu):
????? 星型模型?????
多維數(shù)據(jù)建模以直觀的方式組織數(shù)據(jù),并支持高性能的數(shù)據(jù)訪問。每一個多維數(shù)據(jù)模型由多個多維數(shù)據(jù)模式表示,每一個多維數(shù)據(jù)模式都是由一個事實表和一組維表組成的。多維模型最常見的是星形模式。在星形模式中,事實表居中,多個維表呈輻射狀分布于其四周,并與事實表連接。
位于星形中心的實體是指標(biāo)實體,是用戶最關(guān)心的基本實體和查詢活動的中心,為數(shù)據(jù)倉庫的查詢活動提供定量數(shù)據(jù)。每個指標(biāo)實體代表一系列相關(guān)事實,完成一項指定的功能。位于星形圖星角上的實體是維度實體,其作用是限制用戶的查詢結(jié)果,將數(shù)據(jù)過濾使得 從指標(biāo)實體查詢返回較少的行,從而縮小訪問范圍。每個維表有自己的屬性,維表和事實表通過關(guān)鍵字相關(guān)聯(lián)。
?
????? 雪花模型
? 雪花模型是對星型模型的擴展,每個維度都可向外連接到多個詳細(xì)類別表。在這種
模式中。維度表除了具有星型模型中的維度表功能外,還連接上對事實表
進行詳細(xì)描述的洋細(xì)類別表。詳細(xì)類別表通過對事實表在有關(guān)維上的詳細(xì)描述,達到了
縮小事實表、提高查詢效率的目的。
?
?Q4:如何設(shè)計并建立數(shù)據(jù)倉庫?
設(shè)計數(shù)據(jù)倉庫的九個步驟
1)選擇合適的主題(所要解決問題的領(lǐng)域)
2)明確定義fact表
3)確定和確認(rèn)維
4)choosing the facts
5)計算并存儲fact表中的衍生數(shù)據(jù)段
6)rounding out the dimension tables
7)choosing the duration of the database
8)the need to track slowly changing dimensions
9)確定查詢優(yōu)先級和查詢模式。
技術(shù)上
硬件平臺:數(shù)據(jù)倉庫的硬盤容量通常要是操作數(shù)據(jù)庫硬盤容量的2-3倍。通常大型機具有更可靠的性能和和穩(wěn)定性,也容易與歷史遺留的系統(tǒng)結(jié)合在一起;而PC服務(wù)器或UNIX服務(wù)器更加靈活,容易操作和提供動態(tài)生成查詢請求進行查詢的能力。選擇硬件平臺時要考慮的問題:是否提供并行的I/O吞吐?對多CPU的支持能力如何?
數(shù)據(jù)倉庫DBMS:他的存儲大數(shù)據(jù)量的能力、查詢的性能、和對并行處理的支持如何。
網(wǎng)絡(luò)結(jié)構(gòu):數(shù)據(jù)倉庫的實施在那部分網(wǎng)絡(luò)段上會產(chǎn)生大量的數(shù)據(jù)通信,需不需要對網(wǎng)絡(luò)結(jié)構(gòu)進行改進。
實現(xiàn)上
建立數(shù)據(jù)倉庫的步驟
1)收集和分析業(yè)務(wù)需求
2)建立數(shù)據(jù)模型和數(shù)據(jù)倉庫的物理設(shè)計
3)定義數(shù)據(jù)源
4)選擇數(shù)據(jù)倉庫技術(shù)和平臺
5)從操作型數(shù)據(jù)庫中抽取、轉(zhuǎn)化、和裝載數(shù)據(jù)到數(shù)據(jù)倉庫
6)選擇訪問和報表工具
7)選擇數(shù)據(jù)庫連接軟件
8)選擇數(shù)據(jù)分析和數(shù)據(jù)展示軟件
9)更新數(shù)據(jù)倉庫
數(shù)據(jù)抽取、清理、轉(zhuǎn)換、和移植
1)數(shù)據(jù)轉(zhuǎn)換工具要能從各種不同的數(shù)據(jù)源中讀取數(shù)據(jù)。
2)支持平面文件、索引文件、和legacyDBMS。
3)能以不同類型數(shù)據(jù)源為輸入整合數(shù)據(jù)。
4)具有規(guī)范的數(shù)據(jù)訪問接口
5)最好具有從數(shù)據(jù)字典中讀取數(shù)據(jù)的能力
6)工具生成的代碼必須是在開發(fā)環(huán)境中可維護的
7)能只抽取滿足指定條件的數(shù)據(jù),和源數(shù)據(jù)的指定部分
8)能在抽取中進行數(shù)據(jù)類型轉(zhuǎn)換和字符集轉(zhuǎn)換
9)能在抽取的過程中計算生成衍生字段
10)能讓數(shù)據(jù)倉庫管理系統(tǒng)自動調(diào)用以定期進行數(shù)據(jù)抽取工作,或能將結(jié)果生成平面文件
11)必須對軟件供應(yīng)商的生命力和產(chǎn)品支持能力進行仔細(xì)評估
?
?Q5:什么是數(shù)據(jù)挖掘??
數(shù)據(jù)挖掘(Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。
? 數(shù)據(jù)挖掘是一門交叉學(xué)科,它把人們對數(shù)據(jù)的應(yīng)用從低層次的簡單查詢,提升到從數(shù)據(jù)中挖掘知識,提供決策支持。在這種需求牽引下,匯聚了不同領(lǐng)域的研究者,尤其是數(shù)據(jù)庫技術(shù)、人工智能技術(shù)、數(shù)理統(tǒng)計、可視化技術(shù)、并行計算等方面的學(xué)者和工程技術(shù)人員,投身到數(shù)據(jù)挖掘這一新興的研究領(lǐng)域,形成新的技術(shù)熱點。
?
?Q6:如何進行數(shù)據(jù)挖掘?
1.?? 確定業(yè)務(wù)對象
清晰地定義出業(yè)務(wù)問題,認(rèn)清數(shù)據(jù)挖掘的目的是數(shù)據(jù)挖掘的重要一步。挖掘的最后結(jié)構(gòu)是不可預(yù)測的,但要探索的問題應(yīng)是有預(yù)見的,為了數(shù)據(jù)挖掘而數(shù)據(jù)挖掘則帶有盲目性,是不會成功的。
2.?? 數(shù)據(jù)準(zhǔn)備
1) 數(shù)據(jù)的選擇
搜索所有與業(yè)務(wù)對象有關(guān)的內(nèi)部和外部數(shù)據(jù)信息,并從中選擇出適用于數(shù)據(jù)挖掘應(yīng)用的數(shù)據(jù)。
2) 數(shù)據(jù)的預(yù)處理
研究數(shù)據(jù)的質(zhì)量,為進一步的分析作準(zhǔn)備。并確定將要進行的挖掘操作的類型。
3) 數(shù)據(jù)的轉(zhuǎn)換
將數(shù)據(jù)轉(zhuǎn)換成一個分析模型。這個分析模型是針對挖掘算法建立的。建立一個真正適合挖掘算法的分析模型是數(shù)據(jù)挖掘成功的關(guān)鍵.
3.?? 數(shù)據(jù)挖掘
對所得到的經(jīng)過轉(zhuǎn)換的數(shù)據(jù)進行挖掘。除了完善從選擇合適的挖掘算法外,其余一切工作都能自動地完成。
4.?? 結(jié)果分析
解釋并評估結(jié)果.其使用的分析方法一般應(yīng)作數(shù)據(jù)挖掘操作而定,通常會用到可視化技術(shù)。
5.?? 知識的同化
將分析所得到的知識集成到業(yè)務(wù)信息系統(tǒng)的組織結(jié)構(gòu)中去。
?
?Q7:數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的關(guān)系是怎樣的?
?數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的關(guān)系數(shù)據(jù)倉庫和數(shù)據(jù)挖掘都是數(shù)據(jù)倉庫系統(tǒng)的重要組成部分, 它們既有聯(lián)系, 又有區(qū)別。
聯(lián)系是:
(1) 數(shù)據(jù)倉庫為數(shù)據(jù)挖掘提供了更好的、更廣泛的數(shù)據(jù)源。
(2) 數(shù)據(jù)倉庫為數(shù)據(jù)挖掘提供了新的支持平臺。
(3) 數(shù)據(jù)倉庫為更好地使用數(shù)據(jù)挖掘這個工具提供了方便。
(4) 數(shù)據(jù)挖掘為數(shù)據(jù)倉庫提供了更好的決策支持。
(5) 數(shù)據(jù)挖掘?qū)?shù)據(jù)倉庫的數(shù)據(jù)組織提出了更高的要求。
(6) 數(shù)據(jù)挖掘還為數(shù)據(jù)倉庫提供了廣泛的技術(shù)支持。
區(qū)別是:
(1) 數(shù)據(jù)倉庫是一種數(shù)據(jù)存儲和數(shù)據(jù)組織技術(shù), 提供數(shù)據(jù)源。
(2) 數(shù)據(jù)挖掘是一種數(shù)據(jù)分析技術(shù), 可針對數(shù)據(jù)倉庫中的數(shù)據(jù)進行分析。
???
?Q8:數(shù)據(jù)倉庫與數(shù)據(jù)挖掘在一些商業(yè)領(lǐng)域中的應(yīng)用及現(xiàn)實意義
1)商品銷售。商業(yè)部門把數(shù)據(jù)視作一種競爭性的財富可能比任何其他部門顯得更為重要,為此需要把大型市場營銷數(shù)據(jù)庫演變成一個數(shù)據(jù)挖掘系統(tǒng)。科拉福特(Kraft)食品公司(KGF)是應(yīng)用市場營銷數(shù)據(jù)庫的公司之一,該公司搜集了購買它商品的3000萬個用戶的名單,這是(KGF)通過各種促銷手段得到的。KGF定期向這些用戶發(fā)送名牌產(chǎn)品的優(yōu)惠券,介紹新產(chǎn)品的性能和使用情況。該公司體會到了解自己商品的用戶越多,則購買和使用這些商品的機會也就越多,公司的營業(yè)狀況也就越好。
2)制造。許多公司不僅決策支持系統(tǒng)用于支持市場營銷活動,而且,由于市場競爭越演越烈,這些公司已使用決策支持系統(tǒng)來監(jiān)視制造過程,有制造商聲稱已經(jīng)指示它的各個辦事機構(gòu),在三年內(nèi)把制造成本每年降低25%。不言而喻,該制造商經(jīng)常收集各部件供應(yīng)商的情況。因為,它們也必須遵循該制造商降低成本的戰(zhàn)略。為了對付來自各方的挑戰(zhàn),該制造商已擁有一套“成本”決策支持系統(tǒng),可以監(jiān)視各供應(yīng)商提供的零部件成本,以實現(xiàn)所制定的價格目標(biāo),這種應(yīng)用需要收集有關(guān)各廠商連續(xù)一年來的產(chǎn)品成本信息,以便確定這種組織方式能否滿足原先制定的有關(guān)降價的戰(zhàn)略目標(biāo)。
3)金融服務(wù)/信用卡。通用汽車公司(General?Motors)已經(jīng)采用信用卡——GM卡,在該公司的數(shù)據(jù)庫中已擁有1200萬個持有信用卡的客戶。公司通過觀察,可以了解他們正在駕駛什么樣的汽車,下一步計劃購買什么樣的汽車及他們喜歡哪一類車輛。譬如說,一個持有信用卡的客戶表示對一種載貨卡車感興趣,公司就可以向卡車部門發(fā)出一個電子郵件,并把該客戶的信息告訴有關(guān)部門。
4)遠(yuǎn)程通訊。許多遠(yuǎn)程通訊的大公司近來突然發(fā)現(xiàn)它們面臨極大的競爭壓力,這在幾年前是不存在的。在過去,業(yè)務(wù)上并不需要他們密切注視市場動向,因為顧客的挑選余地有限,但是這種情況近來發(fā)生很大變化。各公司當(dāng)前都在積極收集大量的顧客信息,向他們現(xiàn)有的客戶提供新的服務(wù),開拓新的業(yè)務(wù)項目,以擴大他們的市場規(guī)模。從這些新的服務(wù)中,公司在短期內(nèi)就可以取得更大的效益。
?
總結(jié)
以上是生活随笔為你收集整理的数据仓库与数据挖掘相关基础概念的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 数据仓库与数据挖掘 阶段考试复习题
- 下一篇: 大话数据结构 前言