日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

数据仓库与数据挖掘 阶段考试复习题

發布時間:2024/8/1 编程问答 38 豆豆
生活随笔 收集整理的這篇文章主要介紹了 数据仓库与数据挖掘 阶段考试复习题 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

文章目錄

    • 第一章 數據倉庫與數據挖掘概述
    • 第二章 數據倉庫概述
    • 第三章 聯機分析處理(OLAP)
    • 第四章 數據挖掘的基本概念
    • 第五章 數據預處理
    • 第六章 概念描述:特征化和比較
    • 習題答案

第一章 數據倉庫與數據挖掘概述

無習題

第二章 數據倉庫概述

一. 判斷題

  • 在分析型處理產生后,數據處理的環境由原來的以單一數據庫為中心的數據環境發展為以數據倉庫為基礎的體系化環境。
  • 在事務型(操作型)數據處理下,數據處理的環境主要是以單一數據庫為中心的數據環境。
  • 數據倉庫是為構建分析型數據處理環境而出現的一種數據存儲和組織技術.
  • 面向應用,是數據倉庫區別于傳統的操作型數據庫的關鍵特征。
  • 一個數據倉庫是通過集成多個異種數據源來構造的。
  • 由于在數據倉庫中只進行數據的初始裝載和查詢操作,所以,數據一旦進入數據倉庫,就是穩定的,基本上不會被更新。
  • 數據立方體必須是3維的。
  • 在數據倉庫中,概念分層定義了一個映射序列,可以將低層概念映射到更一般的高層概念。
  • 方體的格,是在單個維上定義的映射序列,可以將低層概念映射到更一般的高層概念。
  • 雪花模型通過在每個維表基礎上,增加附加維表的方式來降低星型模型中可能會存在的冗余現象。
  • 在事實星座模型中,有且僅能有一個事實表。
  • 在數據倉庫的設計過程中,要堅持“數據驅動和需求驅動雙驅動,且以需求驅動為中心”的原則。
  • 二.單選題

  • 在以下人員中,被譽為“數據倉庫之父”的是:( ) (知識點:數據倉庫的基本概念; 易)
    A. H.Inmon B. E.F.Codd C. Simon D. Pawlak

  • 以下關于數據倉庫的說法正確的是:( ) (知識點:數據倉庫的基本概念; 難)
    A. 數據倉庫中的數據只能來源于組織內部的操作型數據庫
    B. 數據倉庫是為應對事務型數據處理的需要而產生的
    C. 數據倉庫是面向主題的,這是其區別于操作型數據庫的關鍵特征
    D. 數據倉庫必須是面向企業全局的,不能以部門為單位建立數據倉庫

  • 以下哪項不是“信息包圖”中的元素? ( ) (知識點:數據倉庫的三級模型; 難)
    A. 維度 B. 維的概念層次及相應層次上的數量
    C. 度量 D. 方體的格

  • 以下哪項不屬于數據倉庫的邏輯模型? ( ) (知識點:數據倉庫的三級模型; 中)
    A. 星型模型 B. 雪花模型
    C. 度量模型 D. 事實星座模型

  • 在數據倉庫的設計過程中,下列描述正確的是( ) (知識點:數據倉庫的設計; 難)
    A. 數據倉庫是“數據驅動+需求驅動”雙驅動,但必須以需求驅動為中心
    B. 數據倉庫主要面向分析型處理環境,在設計時很難完全明確用戶的需求
    C. 數據倉庫與數據庫一樣,其數據主要來自于企業的業務流程
    D. 數據倉庫的設計目標是要提高事務處理的性能

  • 下面哪項關于星型模型的說法是不正確的:( ) (知識點:數據倉庫的三級模型; 難)
    A. 有一個事實表,且事實表中的屬性由指向各個維表的外鍵和一些相應的度量數據組成
    B. 有一組小的附屬表,稱為維表,且每維一個維表
    C. 事實表的每個字段都是事實度量字段
    D. 由于每維只能建立一個維表,使得維表中有些信息會產生冗余

  • 在數據倉庫的概念模型中,通過( )來實現數據從客觀世界到主觀認識的映射。 (知識點:數據倉庫的三級模型; 易)
    A. E-R模型 B. 信息包圖
    C. 星型模型 D. 雪花模型

  • 四.填空題

  • 數據倉庫的關鍵特征有:面向( )、( )、穩定的和( )的。 (知識點:數據倉庫的基本概念; 易)
  • 數據倉庫的三級模型包括:概念模型、( )模型和物理模型。 (知識點:數據倉庫的三級模型; 易)
  • 設計數據倉庫時,常見的邏輯模型包括:( )模型、雪花模型和( )模型;其中,針對多個數據倉庫應用的是( )模型。 (知識點:數據倉庫的三級模型; 中)
  • 隨著計算機應用的深入,其所執行的數據處理類型也相應的分成:事務型數據處理和 ( )。其中,數據倉庫是為迎合( )的需要而產生的一種新的數據存儲機制。 (知識點:數據倉庫的基本概念; 中)
  • 數據倉庫與數據庫的設計方法不同,數據庫的設計遵循SDLC方法,而數據倉庫的設計遵循 ( )方法。 (知識點:數據倉庫的設計; 中)
  • 第三章 聯機分析處理(OLAP)

    一.判斷題

  • OLTP是一種多維數據分析技術。
  • OLTP是關系型數據庫的主要應用。
  • 相對于OLAP技術的驗證性分析過程,數據挖掘技術表現出更高的自動學習能力。
  • OLAP的上鉆操作是在某一維上從匯總數據深入到細節數據進行觀察。
  • 二.單選題

  • OLAP技術的核心是:( ) (知識點:OLAP的基本概念;中)
    A. 在線性 B對用戶的快速響應
    C. 互操作性 D. 多維分析

  • 關于OLAP和OLTP的區別描述,不正確的是:( ) (知識點:OLAP的基本概念;難)
    A. OLAP主要面向企業的高層管理人員,用以輔助決策;而OLTP主要面向企業的基層管理人員,用以輔助日常業務
    B. 與OLAP技術不同,OLTP需要處理大量相對簡單的任務
    C. OLAP的特點在于一次性處理的事務量大,但事務內容比較簡單且重復率高 D. OLAP是以數據倉庫為基礎的,但其最終數據來源與OLTP一樣,大都來自底層的數據庫系統

  • 三、填空題

  • 常見的OLAP的分析方法包括:( )、切塊、鉆取和( )。(知識點:OLAP的基本概念;中)
  • OLAP的數據組織方式有如下幾種:ROLAP、( )和 ( )。(知識點:OLAP的基本概念;中)
  • 四、多選題

  • 以下哪些屬于OLAP的常見操作?( ) (知識點:OLAP的基本概念;易)
    A. 切片 B 切塊 C 鉆取 D 旋轉
  • 第四章 數據挖掘的基本概念

    一. 單選題

  • 某超市研究銷售記錄數據后發現,買面包的人很大概率也會購買牛奶,這種屬于數據挖掘的哪類問題?(  ) (知識點:數據挖掘的基本概念; 中)
    A. 關聯規則發現 B. 聚類
    C. 分類 D. 孤立點檢測
  • 對沒有類標簽屬性的數據集,使用哪種技術可以使得同類數據與其他類數據相分離:( ) (知識點:數據挖掘的基本概念; 難)
    A. 關聯規則發現 B. 聚類
    C. 分類 D. 孤立點檢測
  • 假設現在的數據挖掘任務是識別垃圾郵件的典型特征,通常所使用的數據挖掘功能是: ( ) (知識點:數據挖掘的基本概念; 中)
    A. 關聯分析 B. 分類預測
    C. 概念描述 D. 聚類分析
    二. 判斷題
  • 在聚類分析中,類(簇)內的相似性越大,類(簇)間的差別越大,聚類的效果就越好。
  • “啤酒與尿布”的案例是聚類分析的典型案例。
  • 第五章 數據預處理

    一. 單選題

  • 對于區間 [240,460],按照自然劃分的3-4-5規則,可以劃分為: ( ) (知識點:數據預處理; 中)
    A. [200,300), [300,400), [400,500]
    B. [300,350), [350,400), [400,450), [450,500]
    C. [200,250), [250,300), [300,350), [350,400]
    D. [200,300), [300,400]

  • 已知一組價格數據:15,21,24,21,25,4,8,34,28,按照等寬(寬度為10)分箱方法對其進行平滑,可以劃分為幾個箱子? ( ) (知識點:數據預處理; 易)
    A. 3 B. 4 C. 5 D. 6

  • 假定屬性income的平均值與標準差分別為$54000和$16000,使用z-score規范化,則屬性值$73600將變換為:( ) (知識點:數據預處理; 中)
    A. 0.736 B. 0.716 C. 1.225 D. 1

  • 在數據歸約的如下描述中,錯誤的是:( ) (知識點:數據預處理; 難)
    A. 數據歸約技術可以用來得到數據集的歸約表示,它小得多,但仍接近保持原數據的完整性
    B. 對歸約后的數據集進行挖掘可提高挖掘的效率,并產生相同(或幾乎相同)的結果
    C. 用于數據歸約的時間可以超過或“抵消”在歸約后的數據集上挖掘節省的時間
    D. 維歸約可以檢測并刪除不相關、弱相關或冗余的屬性維。

  • 將原始數據進行集成、變換、維度歸約、數值歸約是在以下哪個步驟進行的?( ) (知識點:數據預處理; 中)
    A. 頻繁模式挖掘 B. 分類和預測
    C. 數據預處理 D. 數據流挖掘

  • 二. 多選題

  • 在現實世界的數據中,元組在某些屬性上缺少值是常有的,處理該問題的常用方法包括: ( ) (知識點:數據預處理; 中)
    A. 忽略元組 B. 使用一個全局變量填充空缺值
    C. 使用屬性的平均值填充空缺值 D. 使用最可能的值進行填充
    E.使用與給定元組屬同一類的所有樣本的平均值
  • 以下方法中,哪些屬于數據規范化的方法?( ) (知識點:數據預處理; 難)
    A. 最大最小規范化 B. 小數定標規范化
    C. 3-4-5規則 D. Z-score規范化
  • 在維歸約方法中,常見的用于屬性子集選擇的啟發式方法有:( ) (知識點:數據預處理; 難)
    A. 逐步向前選擇 B. 逐步向后刪除
    C. 向前選擇和向后刪除相結合 D. 判定樹歸納
  • 三. 填空題

  • 商務智能的三大支撐技術有:( )、( )和 數據挖掘。 (知識點:商務智能的基本概念;易)
  • 常見的數據規范化的方法有:( )、零均值規范化,和( )。 (知識點:數據預處理;中)
  • 第六章 概念描述:特征化和比較

    一. 單選題

  • 以下操作中不屬于數據概化操作是:( ) (知識點:概念描述;中)
    A. 將n維數據立方體聚集為n-1維數據立方體
    B. 利用OLAP進行數據的上卷操作
    C. 考察任務相關數據中每個屬性的不同取值的個數,對數據進行概化操作
    D. 利用最大最小規范化方法,將數據按比例縮放到一個小的特定區間

  • 什么是AOI:( ) (知識點:概念描述;易)
    A. 面向屬性歸納 B. 屬性相關分析
    C. 數據庫中的知識發現 D. 屬性子集選擇

  • 以下關于面向屬性歸納的描述中,正確的是:( ) (知識點:概念描述;難)
    A. 屬性概化閾值是用來控制數據集中屬性個數的參數
    B. 在面向屬性歸納過程中,絕對不能生成相同的行
    C. 概化關系閾值是用來控制廣義元組個數的參數
    D. 面向屬性歸納是根據屬性與決策任務間的相關性來選擇屬性的方法

  • 什么是DW:( ) (知識點:數據倉庫的基本概念;易)
    A. 領域知識發現 B. 機器學習
    C.數據挖掘 D. 數據倉庫

  • 對某商場2016年的銷售數據執行面向屬性歸納操作后,得到如下數據表。設目標集合為“電冰箱”,則在數據表基礎上可得到如下定量描述規則:
    ?X,item(X)= “電冰箱” ?\Rightarrow?(location(X)=“東北”)[t1:( )]∨(location(X)=“華北”)[t2:( )]
    其中,t1和t2分別為定量描述規則的t權,則, t1、 t2的值為:( )。 (知識點:概念描述;難)

    A. 0.43 0.57; B. 0.5 0.5;
    C. 0.33 0.67; D. 0.4 0.6;

  • 二. 多選題

  • 常見的度量數據集中趨勢的指標有:( ) (知識點:概念描述;中)
    A. 均值 B. 中位數
    C. 眾數 D. 四分位數
    E. 方差
  • 三. 填空題

  • 對某商場2002年的銷售數據執行面向屬性歸納操作后,得到如下數據表。

    設目標集合為“電視”,則在數據表基礎上可得到如下定量描述規則:
    ?X,item(X)= “TV” ?\Rightarrow?(location(X)=“Asia”)[t1:( )]∨(location(X)=“Europe”)[t2:( )]
    其中,t1和t2分別為定量描述規則的t權,則:t1=( ), t2=( )。
    (知識點:概念描述;中)
  • 習題答案

    【第二章】
    1.(對; 知識點:數據倉庫的基本概念; 易)
    2.(對; 知識點:數據倉庫的基本概念;易)
    3.(對; 知識點:數據倉庫的基本概念;易)
    4.(錯; 知識點:數據倉庫的基本概念; 中)
    5.(對; 知識點:數據倉庫的基本概念; 中)
    6.(對; 知識點:數據倉庫的基本概念; 難)
    7.(錯; 知識點:數據立方體; 易)
    8.(對; 知識點:數據立方體;中)
    9.(錯; 知識點:數據立方體; 難)
    10.(對; 知識點:數據倉庫的三級模型; 中)
    11.(錯; 知識點:數據倉庫的三級模型; 難)
    12.(錯; 知識點:數據倉庫的基本概念; 中)
    A C D C B C B
    1.主題、集成的、反映歷史變化(知識點:數據倉庫的基本概念; 易)
    2.邏輯模型(知識點:數據倉庫的三級模型; 易)
    3.星型、事實星座、事實星座(知識點:數據倉庫的三級模型; 中)
    4.分析型數據處理、分析型數據處理(知識點:數據倉庫的基本概念; 中)
    5. CLDS(知識點:數據倉庫的設計; 中)

    【第三章】
    1.(錯;知識點:OLAP的基本概念;易)
    2.(對;知識點:OLAP的基本概念;易)
    3.(對;知識點:OLAP的基本概念;難)
    4.(錯;知識點:OLAP的基本概念;中)
    D C
    1.常見的OLAP的分析方法包括:( 切片)、切塊、鉆取和( 旋轉 )。(知識點:OLAP的基本概念;中)
    2.OLAP的數據組織方式有如下幾種:ROLAP、 ( MOLAP )和 ( HOLAP )。 (知識點:OLAP的基本概念;中)
    ABCD

    【第四章】
    A B B
    1.(對; 知識點:數據挖掘的基本概念; 中)
    2.(錯; 知識點:數據挖掘的基本概念; 易)

    【第五章】
    A A C C C
    ABCDE ABD ABCD
    1.商務智能的三大支撐技術有:( 數據倉庫 )、( OLAP)和 數據挖掘。 (知識點:商務智能的基本概念;易)
    2.常見的數據規范化的方法有:( 最小最大規范化 )、零均值規范化,和( 小數定標規范化 )。 (知識點:數據預處理;中)

    【第六章】
    D A C D C ABC
    0.4 0.6

    總結

    以上是生活随笔為你收集整理的数据仓库与数据挖掘 阶段考试复习题的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。