数据仓库与数据挖掘 阶段考试复习题
文章目錄
- 第一章 數據倉庫與數據挖掘概述
- 第二章 數據倉庫概述
- 第三章 聯機分析處理(OLAP)
- 第四章 數據挖掘的基本概念
- 第五章 數據預處理
- 第六章 概念描述:特征化和比較
- 習題答案
第一章 數據倉庫與數據挖掘概述
無習題
第二章 數據倉庫概述
一. 判斷題
二.單選題
在以下人員中,被譽為“數據倉庫之父”的是:( ) (知識點:數據倉庫的基本概念; 易)
A. H.Inmon B. E.F.Codd C. Simon D. Pawlak
以下關于數據倉庫的說法正確的是:( ) (知識點:數據倉庫的基本概念; 難)
A. 數據倉庫中的數據只能來源于組織內部的操作型數據庫
B. 數據倉庫是為應對事務型數據處理的需要而產生的
C. 數據倉庫是面向主題的,這是其區別于操作型數據庫的關鍵特征
D. 數據倉庫必須是面向企業全局的,不能以部門為單位建立數據倉庫
以下哪項不是“信息包圖”中的元素? ( ) (知識點:數據倉庫的三級模型; 難)
A. 維度 B. 維的概念層次及相應層次上的數量
C. 度量 D. 方體的格
以下哪項不屬于數據倉庫的邏輯模型? ( ) (知識點:數據倉庫的三級模型; 中)
A. 星型模型 B. 雪花模型
C. 度量模型 D. 事實星座模型
在數據倉庫的設計過程中,下列描述正確的是( ) (知識點:數據倉庫的設計; 難)
A. 數據倉庫是“數據驅動+需求驅動”雙驅動,但必須以需求驅動為中心
B. 數據倉庫主要面向分析型處理環境,在設計時很難完全明確用戶的需求
C. 數據倉庫與數據庫一樣,其數據主要來自于企業的業務流程
D. 數據倉庫的設計目標是要提高事務處理的性能
下面哪項關于星型模型的說法是不正確的:( ) (知識點:數據倉庫的三級模型; 難)
A. 有一個事實表,且事實表中的屬性由指向各個維表的外鍵和一些相應的度量數據組成
B. 有一組小的附屬表,稱為維表,且每維一個維表
C. 事實表的每個字段都是事實度量字段
D. 由于每維只能建立一個維表,使得維表中有些信息會產生冗余
在數據倉庫的概念模型中,通過( )來實現數據從客觀世界到主觀認識的映射。 (知識點:數據倉庫的三級模型; 易)
A. E-R模型 B. 信息包圖
C. 星型模型 D. 雪花模型
四.填空題
第三章 聯機分析處理(OLAP)
一.判斷題
二.單選題
OLAP技術的核心是:( ) (知識點:OLAP的基本概念;中)
A. 在線性 B對用戶的快速響應
C. 互操作性 D. 多維分析
關于OLAP和OLTP的區別描述,不正確的是:( ) (知識點:OLAP的基本概念;難)
A. OLAP主要面向企業的高層管理人員,用以輔助決策;而OLTP主要面向企業的基層管理人員,用以輔助日常業務
B. 與OLAP技術不同,OLTP需要處理大量相對簡單的任務
C. OLAP的特點在于一次性處理的事務量大,但事務內容比較簡單且重復率高 D. OLAP是以數據倉庫為基礎的,但其最終數據來源與OLTP一樣,大都來自底層的數據庫系統
三、填空題
四、多選題
A. 切片 B 切塊 C 鉆取 D 旋轉
第四章 數據挖掘的基本概念
一. 單選題
A. 關聯規則發現 B. 聚類
C. 分類 D. 孤立點檢測
A. 關聯規則發現 B. 聚類
C. 分類 D. 孤立點檢測
A. 關聯分析 B. 分類預測
C. 概念描述 D. 聚類分析
二. 判斷題
第五章 數據預處理
一. 單選題
對于區間 [240,460],按照自然劃分的3-4-5規則,可以劃分為: ( ) (知識點:數據預處理; 中)
A. [200,300), [300,400), [400,500]
B. [300,350), [350,400), [400,450), [450,500]
C. [200,250), [250,300), [300,350), [350,400]
D. [200,300), [300,400]
已知一組價格數據:15,21,24,21,25,4,8,34,28,按照等寬(寬度為10)分箱方法對其進行平滑,可以劃分為幾個箱子? ( ) (知識點:數據預處理; 易)
A. 3 B. 4 C. 5 D. 6
假定屬性income的平均值與標準差分別為$54000和$16000,使用z-score規范化,則屬性值$73600將變換為:( ) (知識點:數據預處理; 中)
A. 0.736 B. 0.716 C. 1.225 D. 1
在數據歸約的如下描述中,錯誤的是:( ) (知識點:數據預處理; 難)
A. 數據歸約技術可以用來得到數據集的歸約表示,它小得多,但仍接近保持原數據的完整性
B. 對歸約后的數據集進行挖掘可提高挖掘的效率,并產生相同(或幾乎相同)的結果
C. 用于數據歸約的時間可以超過或“抵消”在歸約后的數據集上挖掘節省的時間
D. 維歸約可以檢測并刪除不相關、弱相關或冗余的屬性維。
將原始數據進行集成、變換、維度歸約、數值歸約是在以下哪個步驟進行的?( ) (知識點:數據預處理; 中)
A. 頻繁模式挖掘 B. 分類和預測
C. 數據預處理 D. 數據流挖掘
二. 多選題
A. 忽略元組 B. 使用一個全局變量填充空缺值
C. 使用屬性的平均值填充空缺值 D. 使用最可能的值進行填充
E.使用與給定元組屬同一類的所有樣本的平均值
A. 最大最小規范化 B. 小數定標規范化
C. 3-4-5規則 D. Z-score規范化
A. 逐步向前選擇 B. 逐步向后刪除
C. 向前選擇和向后刪除相結合 D. 判定樹歸納
三. 填空題
第六章 概念描述:特征化和比較
一. 單選題
以下操作中不屬于數據概化操作是:( ) (知識點:概念描述;中)
A. 將n維數據立方體聚集為n-1維數據立方體
B. 利用OLAP進行數據的上卷操作
C. 考察任務相關數據中每個屬性的不同取值的個數,對數據進行概化操作
D. 利用最大最小規范化方法,將數據按比例縮放到一個小的特定區間
什么是AOI:( ) (知識點:概念描述;易)
A. 面向屬性歸納 B. 屬性相關分析
C. 數據庫中的知識發現 D. 屬性子集選擇
以下關于面向屬性歸納的描述中,正確的是:( ) (知識點:概念描述;難)
A. 屬性概化閾值是用來控制數據集中屬性個數的參數
B. 在面向屬性歸納過程中,絕對不能生成相同的行
C. 概化關系閾值是用來控制廣義元組個數的參數
D. 面向屬性歸納是根據屬性與決策任務間的相關性來選擇屬性的方法
什么是DW:( ) (知識點:數據倉庫的基本概念;易)
A. 領域知識發現 B. 機器學習
C.數據挖掘 D. 數據倉庫
對某商場2016年的銷售數據執行面向屬性歸納操作后,得到如下數據表。設目標集合為“電冰箱”,則在數據表基礎上可得到如下定量描述規則:
?X,item(X)= “電冰箱” ?\Rightarrow?(location(X)=“東北”)[t1:( )]∨(location(X)=“華北”)[t2:( )]
其中,t1和t2分別為定量描述規則的t權,則, t1、 t2的值為:( )。 (知識點:概念描述;難)
A. 0.43 0.57; B. 0.5 0.5;
C. 0.33 0.67; D. 0.4 0.6;
二. 多選題
A. 均值 B. 中位數
C. 眾數 D. 四分位數
E. 方差
三. 填空題
設目標集合為“電視”,則在數據表基礎上可得到如下定量描述規則:
?X,item(X)= “TV” ?\Rightarrow?(location(X)=“Asia”)[t1:( )]∨(location(X)=“Europe”)[t2:( )]
其中,t1和t2分別為定量描述規則的t權,則:t1=( ), t2=( )。
(知識點:概念描述;中)
習題答案
【第二章】
1.(對; 知識點:數據倉庫的基本概念; 易)
2.(對; 知識點:數據倉庫的基本概念;易)
3.(對; 知識點:數據倉庫的基本概念;易)
4.(錯; 知識點:數據倉庫的基本概念; 中)
5.(對; 知識點:數據倉庫的基本概念; 中)
6.(對; 知識點:數據倉庫的基本概念; 難)
7.(錯; 知識點:數據立方體; 易)
8.(對; 知識點:數據立方體;中)
9.(錯; 知識點:數據立方體; 難)
10.(對; 知識點:數據倉庫的三級模型; 中)
11.(錯; 知識點:數據倉庫的三級模型; 難)
12.(錯; 知識點:數據倉庫的基本概念; 中)
A C D C B C B
1.主題、集成的、反映歷史變化(知識點:數據倉庫的基本概念; 易)
2.邏輯模型(知識點:數據倉庫的三級模型; 易)
3.星型、事實星座、事實星座(知識點:數據倉庫的三級模型; 中)
4.分析型數據處理、分析型數據處理(知識點:數據倉庫的基本概念; 中)
5. CLDS(知識點:數據倉庫的設計; 中)
【第三章】
1.(錯;知識點:OLAP的基本概念;易)
2.(對;知識點:OLAP的基本概念;易)
3.(對;知識點:OLAP的基本概念;難)
4.(錯;知識點:OLAP的基本概念;中)
D C
1.常見的OLAP的分析方法包括:( 切片)、切塊、鉆取和( 旋轉 )。(知識點:OLAP的基本概念;中)
2.OLAP的數據組織方式有如下幾種:ROLAP、 ( MOLAP )和 ( HOLAP )。 (知識點:OLAP的基本概念;中)
ABCD
【第四章】
A B B
1.(對; 知識點:數據挖掘的基本概念; 中)
2.(錯; 知識點:數據挖掘的基本概念; 易)
【第五章】
A A C C C
ABCDE ABD ABCD
1.商務智能的三大支撐技術有:( 數據倉庫 )、( OLAP)和 數據挖掘。 (知識點:商務智能的基本概念;易)
2.常見的數據規范化的方法有:( 最小最大規范化 )、零均值規范化,和( 小數定標規范化 )。 (知識點:數據預處理;中)
【第六章】
D A C D C ABC
0.4 0.6
總結
以上是生活随笔為你收集整理的数据仓库与数据挖掘 阶段考试复习题的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 数据仓库与数据挖掘归纳汇总
- 下一篇: 数据仓库与数据挖掘相关基础概念