當前位置：首頁 >

一、全国计算机三级数据库考试——理论知识总结（选择题）

發布時間：2023/12/9 50 豆豆

生活随笔收集整理的這篇文章主要介紹了一、全国计算机三级数据库考试——理论知识总结（选择题）小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

上一篇博客：https://blog.csdn.net/weixin_44940488/article/details/119349219

說明：

一、數據庫分析與設計

在數據庫應用系統分析與設計中，數據庫應用系統的數據處理需求可以表示為事務規范。事務規范包括了事務名稱、事務描述、事務所訪問的數據項、事務用戶。

數據庫應用系統規劃與分析階段的內容包括：

任務陳述（可行性分析：技術、經濟、操作、開發方案的選擇）；
確定任務目標；
確定系統范圍和邊界；
確定用戶視圖。

數據庫應用系統（DBAS）的實施階段主要包括以下工作：

創建數據庫；
裝載數據；
編寫與調試應用程序；
數據庫試運行。

數據庫應用系統實現與部署工作包括???????：

建立數據庫結構；
數據加載；
事務和應用程序的編碼及測試；
系統集成、測試及運行；
系統部署。

數據庫物理設計內容包括：

數據庫邏輯模式描述；
文件組織與存取設計；
數據分布設計：數據分布設計的任務是按照實際情況：將各種數據合理安排在不同存儲介質中；將各種數據通過水平劃分或垂直劃分，分布存儲在各局部數據庫中，以提高數據訪問效率和數據可靠性；合理調整關系模式的規范化程度。注意，"合理調整"規范化。
確定系統配置；
物理模式評估。

數據安全設計主要有五個方面：

安全性保護（防止非法用戶對數據庫非法的使用，其中一種主要方式即是用戶權限設計）；
完整性保護；
并發控制；
數據庫的備份與恢復；
數據加密傳輸。

數據庫應用系統優化內容：創建新的索引、模式調整。

數據庫應用系統日常維護內容：備份與恢復、完整性維護、安全性維護、存儲空間管理和并發控制。

數據庫應用系統升級工作內容：改變數據庫應用系統體系結構、升級DBMS版本、修改程序以適應新需求。

需求分析建模方法： UML、 DFD、 IDEFO。

DFD方法由四種基本元素組成：數據流、處理、數據存儲和外部項。

IDEFO需求建模方法，描述功能活動示意圖中矩形框代表功能動，寫在矩形框內的動詞短語描述功能活動的名稱，活動的編號按照要求寫在矩形框右下角指定的位置。左邊的輸入箭頭表示完成活動需要的數據；矩形框上方的控制箭頭描述了影響這個活動執行的事件或約束條件；右邊的輸出箭頭說明由活動產生的結果及信息，下方進入的機制箭頭表示實施該活動的物理手段或完成活動需要的資源（計算機系統、人或組織）。

IDEFIX側重分析、抽象和概括應用領域中的數據需求，被稱為數據建模方法。在IDEFIX中一個非確定聯系又稱為多對多關系或m：n聯系。

在IDEFIX建模方法中，兩個實體集之間的多對多聯系可以通過引入第三個實體集轉化為兩個一對多聯系，則這兩個一對多聯系屬于標定型聯系。

如果子女實體集中的每一個實例都能被唯一地確認而無須了解與之相聯系的雙親實體集的實例，該聯系就被稱為"非標定型聯系”，使用一條虛線進行連接，用實心圓點表示聯系的基數是n（一對多）。

在IDEF1X建模方法中，不會產生從屬實體集的是非標定型聯系。

數據庫物理設計階段，將根據數據庫中存儲的數據量、用戶對數據庫的使用要求和使用方式，選擇數據存儲方案（如對表進行分區或者拆分/合并表）以加快數據檢索速度（如建立索引）。減少了操作，檢索速度相應的就會提高。

關系模式的設計、規范化處理屬于數據庫邏輯結構設計的內容。

對關系模式進行去規范化處理屬于數據庫物理結構設計的內容。

為減少表連接操作而將兩個表合并為一個表，這屬于數據庫的物理結構設計（調整）。

設置事務執行時的隔離性級別，該任務屬于數據庫應用系統設計步驟中的物理設計。

從功能角度數據庫應用系統可以劃分為四個層次來實現：

表示層：負責用戶交互，用于顯示數據和接收用戶輸入的數據。（一般為Windows應用程序或Web應用程序）。
業務邏輯層：梳理DBAS各項業務活動，將其表示為各種系統構件。核心業務邏輯在本層實現。是表示層和數據訪問層之間的橋梁，主要負責數據的傳遞和處理。
數據訪問層：使用事件進行信息交換，負責與DBMS系統進行交互，提取或存入應用系統所需的數據。數據庫應用系統的數據訪問層的主要任務是進行事務設計。事務概要設計內容包括：事務名稱、事務所訪問的關系表及關系屬性、事務處理邏輯、事務用戶（指使用、啟動、調用該事務的軟件模塊或系統）。
數據持久層：負責保存和管理應用系統數據，而數據的完整性維護屬于數據持久層功能中的數據管理的內容。根據事務-基本表交叉引用矩陣來調整數據文件組織結構，這一任務涉及數據持久層。

事務中為了降低死鎖的發生，通常考慮以下法則：

按同一順序訪問資源；避免事務中的用戶交互；
采用小事務模式，盡量縮短事務的長度，
減少占有鎖的時間；
盡量使用記錄級別的鎖（行鎖），少使用表級別的鎖；
使用綁定連接，使同一應用程序所打開的兩個或多個連接可以相互合作。

多個小事務合并成大事務，會增加占有鎖的時間，可能會造成大量阻塞事務，甚至會產生死鎖。

事務的隔離性是指多個并發事務同時訪問一個數據庫時，一個事物不應被另一個事物所干擾，即保證并發讀取數據的正確性，降低發生數據不一致的可能性。

降低事務隔離級別可以提高事務的吞吐量，提高活鎖的可能性，降低發生死鎖、發生阻塞的可能性。

關鍵字unique表示唯一索引，clustered表示聚集索引，所以idx1既是唯一索引，也是聚集索引。

在數據流圖中，一個處理至少有一個輸入流和一個輸出流。

關系模式計算：關系模式個數 = 實體集數+多對多關系數。

考慮到表中數據規模有可能很大，決定將表改為分區表，這一調整操作涉及到數據庫的物理結構。

完整性約束條件的作用對象分為列、元組和關系三種級別，其中對列的約束主要指對其值類型、范圍、精度、排序等的約束條件。對元組的約束主要指對記錄中各個屬性之間的聯系的約束條件。對關系的約束是指對若干紀錄間、關系集合上以及關系之間聯系的約束條件。

在數據文件的非主屬性上建立的索引稱為輔索引。

論證是否具備數據庫應用系統開發所需的人力資源，這屬于數據庫應用系統的操作可行性分析。

在數據庫應用系統生命周期中，成本估算屬于可行性分析中的經濟可行性，是項目規劃中的一個環節。

在數據庫應用系統生命周期中，根據軟件開發模型，分解和定義項目所包括的任務和活動，屬于項目規劃。

需求分析具體包括數據需求分析、功能需求分析、性能需求分析、其他需求分析（數據存儲需求分析、安全性需求分析、備份和恢復需求分析）。

允許并發訪問的最大用戶數，是指在保證單個用戶查詢相應時間的前提下，系統最多允許多少用戶同時訪問數據庫。系統性能越強，允許的用戶數量就越多，這屬于性能需求分析。

業務邏輯層概要設計：

一個構件或模塊只負責完成一項任務，也就是單一責任原則。
各個構件均應具有獨立的功能，并最大限度地減少與其他構件功能重疊。
構件之間的接口應盡量簡單明確。
如果兩個構件間的關系比較復雜，應考慮進一步進行模塊劃分。
如果構件過于復雜，可以考慮將其細分。

性能需求分析——DBAS的性能指標主要包括：數據操作響應時間、系統吞吐量、允許并發訪問的最大用戶數、每TPS代價值。

二、UML與數據庫應用系統

UML用例模型由用例圖組成，用例圖由系統、角色、用例三種模型元素及其之間的關系組成。橢圓表示用例，位于系統邊界內部。

通信圖和順序圖都是交互圖，從不同的側面描述系統的動態結構。順序圖強調的是時間，通信圖強調的是空間。

在UML中，用類圖來描述系統的靜態結構，而用順序圖和通信圖來表示系統的動態結構。

狀態圖中只能有一個起始狀態，可以有多個結束狀態。

包圖可以表達系統中不同的元素彼此間的關系。

對象圖、狀態機圖、時間圖均是微觀設計的表達方法，包圖用于宏觀設計。

元元模型層組成了UML的最基本的元素"事物"，代表要定義的所有事物。

用例用于描述從系統用戶的角度來觀察，系統應該具有哪些功能，幫助分析人員理解系統的行為。用例是需求搜索及整理的工具，主要應用在項目開發的需求分析階段。用例之間包括擴展、使用、組合三種關系。

角色是與系統進行交互的外部實體，可以是系統用戶也可以是其他系統或者硬件設備。

系統是在邊界線以內的區域（即用例的活動區域）抽象地表示能夠實現的所有基本功能。

一個角色可以執行多個用例，反過來，一個用例也可以被多個角色使用。

根據事務-基本表交叉引用矩陣可以確定哪些事務對哪些表列執行了何種操作，基于該矩陣可以幫助數據庫設計人員建立合適的索引。

數據庫安全性保護的主要保護方式有用戶身份鑒別、權限控制、視圖機制。

三、高級查詢

?四、數據庫后臺編程技術

每當對游標執行一次FETCH語句，系統都會自動對@@FETCH-STATUS賦一次值。

FETCH NEXT表示先將游標當前行指針移動到下一行，并提取所指向的行數據。

存儲過程，實際上是存儲在數據庫中供所有用戶程序調用的子程序。

存儲過程是存儲在數據庫服務器端的可以被調用執行的代碼。

存儲過程可以接受多個輸入參數，也可以接受多個輸出參數，參數類型隨意。存儲過程的返回結果可以是一個集合。

在調用存儲過程時，只需要聲明參數的類型，不能指明參數為輸出參數。只有再執行時才能指明參數為輸出參數。

存儲過程的好處是允許模塊化程序設計、改善性能、減少網絡流量、增強應用程序的安全性。

觸發器通常用于保證業務規則和數據完整性。

在一個表上針對同一個數據操作只能定義一個前觸發器。

for或after指的是后觸發器，instead of是前觸發器。insert指的是引發觸發器執行的操作是插入操作。

觸發器是在對表中數據進行UPDATE、INSERT、DELETE操作時自動觸發的。

數據庫創建后可以手工縮小數據文件和日志文件的空間。

角色分為服務器級角色和數據庫級角色。db_datawriter角色屬于數據庫級角色，具有插入、刪除和更改數據庫中所有用戶數據的權限。

?五、數據庫及數據庫對象

model數據庫用作SQL Server實例上創建的所有數據庫的模板。對model數據庫進行的修改（如數據庫大小、排序規則、恢復模式和其他數據庫選項）將應用于以后創建的所有用戶數據庫，當用戶創建一個數據庫時，系統自動將model數據庫中的全部內容復制到新建數據庫中。

數據庫創建后，允許自動或手動擴大數據文件和日志文件的空間。

數據庫文件，用戶可以自行指定數據文件和日志文件的存放位置。數據庫所包含的文件與文件存儲位置信息均保存在主要數據文件中。一個文件組中的數據文件可以存放在不同磁盤上。

數據文件分為主要數據文件（每個數據庫有且只有一個）、次要數據文件（可無可有，個數無限制）

每個數據庫必須至少有一個事務日志文件，也可以有多個事務日志文件。

日志文件不包括在文件組內，日志文件和數據文件是分開管理的。一個文件不能有多個文件組。如果文件組中有多個文件，則它們在所有文件被填滿前不會自動增長，而填滿后這些文件會循環增長。

tempdb是臨時數據庫，用于保存臨時對象或中間結果集，并為數據的排序等操作提供一個臨時工作空間。每次啟動SQL Server時都會重新創建tempdb數據庫。

架構（Schema，也稱為模式）是數據庫下的一個邏輯命名空間，可以存放表、視圖等數據庫對象。一個數據庫可以包含一個或多個架構，架構由特定的授權用戶所擁有；在同一個數據庫中，架構名必須唯一；架構名可以是顯示的，也可以由DBMS提供默認名。

唯一索引不允許兩行具有相同的索引鍵值。

唯一索引的作用是保證索引鍵值的不重復。在多列唯一索引的情況下，可以確保索引列中每個值的組合都是唯一的。唯一索引和非聚集索引之間沒有限定關系。

聚集索引鍵值的邏輯順序決定表中對應行的物理順序。一個表或視圖只允許同時有一個聚集索引，以及多個非聚焦索引。

如果數據文件中的數據記錄的排列順序與索引文件中索引項的排列順序一致，那么該索引文件就成為聚集索引。

非聚集索引，數據行的物理排序獨立于索引排序。

分離數據庫時需要停用被分離的數據庫，但是不需要停用SQL Server服務。正在被用戶訪問的數據庫不能被分離。

分區表是將表中的數據按水平方式劃分成不同的子集，這些數據子集存儲在數據庫的一個或多個文件組中。分區表是從物理上將一個大表分成幾個小表，但從邏輯上來看還是一個大表。對于用戶而言，所面對的仍然是一個大表，用戶只要對大表進行操作就可以了，數據庫管理系統會自動對小表進行操作。

?六、安全管理

因在U1后面缺少WITH GRANT OPTION語句，U1無權將SELECT權限轉授予其他角色或用戶。

guest是SQL Server中一個特殊的數據庫用戶。

CRANT UPDATE ON TI TO U1語句的作用是用戶U1具有對表11各列數據進行修改的權利，在SQL Server中，擁有UPDATE權限的用戶并不意味著一定擁有SELECT權限。

角色是一組具有相同權限的用戶集合。用戶定義的角色屬于數據庫一級的角色，用戶定義的角色的成員可以是數據庫的用戶，也可以是用戶定義的角色。只要權限沒有被拒絕過，則角色中成員的權限就是其所在角色的權限加上他們自己所具有的權限。

授權語句格式是"GRANT 可以授予的權限 ON 表名 TO 用戶名?"，授權時一個語句中可以授予多個權限，也可以一次授予一個權限。

Oracle的安全控制機制可分為數據庫級的安全控制、表級、行級和列級的安全控制。

SQL Server 2008的身份驗證模式有"windows身份驗證模式"和"混合身份驗證模式"兩種?；旌仙矸蒡炞C模式是指SQL Server允許Windows授權用戶和SQL授權用戶登錄到SQL Server數據庫服務器。

除guest用戶外，所有的數據庫用戶都必須對應一個登錄賬戶。

一個登錄賬戶可以對應多個數據庫用戶。

授權是將合法訪問數據庫或數據庫對象的權限授予用戶的過程（即做任何操作，都需要有相應的授權）。

數據庫用戶一般都來自于服務器上已有的登錄賬戶，讓登錄用戶成為數據庫用戶的操作稱為映射。

db_datereader角色是數據庫級角色，具有查詢數據庫中所有用戶數據的權限。

db_datawriter角色是固定數據庫角色之一，具有插入、刪除和更改數據庫中所有用戶數據的權限。

系統管理員在數據庫服務器上具有全部的權限。每個數據庫管理系統在安裝好之后都有自己默認的系統管理員，SQL Server 2008默認的系統管理員是"sa"。在安裝好之后也可以授予其他用戶具有系統管理員的權限。

?七、運行維護與優化

SQL Server提供了一套綜合的工具，用于監視SQLServer中的事件和優化物理數據庫的設計。

數據庫重組是指按照系統設計要求對數據庫存儲空間進行全面調整，如調整磁盤分區方法和存儲空間、重新安排數據的存儲、整理回收碎塊等，以提高數據庫性能。

數據庫的重構是指由于數據庫應用環境的不斷變化，增加了新的應用或新的實體，取消了某些應用，有的實體與實體間的聯系也發生了變化等，使得原有的數據庫設計不能滿足新的需求，此時需要調整數據庫的模式和內模式。

數據庫的重組并不修改數據庫原有設計的邏輯結構和物理結構，而數據庫的重構則不同，它可以部分修改數據庫的模式和內模式。

數據庫性能優化對數據庫管理員的要求比較高，調整一個數據庫應用系統的性能要求熟悉系統環境、數據庫管理系統、應用程序以及應用程序所使用的數據。

數據庫性能優化是對數據庫管理員的嚴峻考驗，有時候對應用程序的修改需要應用開發人員配合才能完成。

數據庫優化有以下幾方面：外部調整、調整內存分配、調整磁盤1/0、調整競爭。外部調整中除了CPU調整外，還有網絡調整。

數據庫優化中，如果數據庫服務器中運行隊列數量超過邏輯CPU數量說明CPU已經飽和。

除了刪除或創建索引，以及非聚簇索引和聚簇索引的相互轉換外，通過重建索引可以改進系統的性能。

調整索引，優化查詢效率屬于數據庫性能的改進。

寄數據庫存儲介質由RAID5改為RAID1以滿足越來越多的寫操作需求，這一活動屬于數據庫應用系統運行管理與維護中的性能優化調整。

根據監控分析實現的方法不同，監控分析機制分為兩種，一種是由數據庫系統建立的自動監控機制，另一種是由管理員手動實施的監控機制。

（模式調整）派生性冗余列是指表中增加的列由表中的一些數據項經過計算生成。它的作用是在查詢時減少連接操作，避免使用聚合函數。由于增加了派生性冗余字段，破壞了規范化規則（不符合第三范式要求）。

水平分割是根據數據行的使用特點進行分割，分割之后所得的所有表的結構都相同，而存儲的數據不同。水平分割會給應用增加復雜度，特別在查詢所有數據時需要Union（并）操作；大部分情況是局部使用，只有很少情況才全局查詢時適合使用此方法。

垂直分割是根據列的特點進行分割，分割之后所得的所有表中除了都含有主碼列外其余列都不同，其查詢時會減少1/0次數，但其缺點是查詢所有數據時需要Join（連接）操作。

數據庫應用系統投入運行標志著系統開發任務的基本完成和系統運行維護工作的開始。

數據庫系統運行需要依賴服務器、操作系統、存儲、網絡等多種因素。單純地增加數據庫CPU數量并不一定會提高數據庫查詢速度。RAID1提高了讀速度，加強了系統的可靠性，但是磁盤的利用率低，冗余度高，寫的速度并未提高。數據庫管理員進行優化時需要對數據庫系統有深入了解，對業務系統也要深入了解。

在數據庫設計階段，主要強調的是高效率利用存儲空間，減少數據的元余，減少數據的不一致，這個過程也就是規范化的過程。規范化關系解決了數據維護的異常，并使冗余最小化，然而，可能會出現數據處理性能下降的問題。

在大多數情況下，數據庫系統需要考慮的第二個目標是高效率的數據處理，反規范化處理，如增加派生冗余列，增加冗余列，重新組表、分割表和新增匯總表可以有效地提高查詢效率。

數據庫設計過程中，為了提高查詢效率會進行反規范化，但由此會帶來數據冗余。

索引的使用要恰到好處，其使用原則一般如下：
（1）經常在查詢中作為條件被使用的列，應為其建立索引。
（2）頻繁進行排序或分組的列，應為其建立索引。
（3）一個列的值域很大時，應為其建立索引。
（4）如果待排序的列有多個，應在這些列上建立復合索引。
（5）可以使用系統工具來檢查索引的完整性，必要時進行修復。另外，當數據庫表更新大量數據后，刪除并重建索引也可以提高查詢速度。

建立索引的目的就是為了提高查詢效率，查詢的性能在很大程度上取決于存在什么樣的索引來加快選擇和連接的處理。

如果在索引碼上執行大量刪除操作，索引頁可能會出現空間的浪費，而這些被浪費的空間需要在重建索引后才能提高數據庫的性能。

當數據庫表更新大量數據后，刪除并重建索引可以提高查詢速度。

數據庫運行維護工作主要包括數據庫的轉儲和恢復；數據庫的安全性和完整性控制；數據庫性能的監控分析和改進；數據庫的重組和重構。其中新建數據庫用戶屬于數據庫的安全性和完整性控制的一項功能。

數據庫運行維護工作：數據庫軟件升級、調整索引、數據庫管理系統補丁安裝、檢查數據庫空間使用情況、數據庫管理軟件漏洞修復。

數據庫設計過程中，數據庫的一致性設計往往以犧牲效率為代價。

結合數據庫安全設計的五個方面可知，實現安全性需要額外實施一些工作，會降低數據庫性能。

?將數據文件和索引文件放置在同一磁盤上不利于提高查詢效率。

根據監控對象的不同，監控分析可以分為兩種：
（1）對數據庫架構體系的監控
主要監控內容：空間基本信息、空間使用率與剩余空間大小、空間是否具有自動擴展的能力、哪些表的擴展將引起空間的擴展，以及段的占用空間與區間數等。
（2）對數據庫性能的監控
主要監控內容：數據緩沖區的命中率、庫緩沖、用戶鎖、鎖與等待、回滾段、臨時段使用情況、索引的使用情況、等待事件和共享池等。

八、故障管理、備份與恢復

在制定備份策略時，除考慮使用備份恢復時丟失的數據量外，還需考慮數據庫備份所需的時間。檢查點技術大幅度減少了數據庫完全恢復時所必須執行的日志部分。靜態轉儲雖然保證了數據的有效性，但是卻是以降低數據庫的可用性為代價；動態轉出雖然提高了數據庫的可用性，但數據的有效性卻可能得不到保障。差量轉儲和增量轉儲相比，速度慢，占用空間較多，但恢復速度比增量轉儲快。

數據庫備份設備可以是磁帶也可以是磁盤，數據庫備份設備可以為本地設備，也可以使用遠程網絡設備。SQL Server支持兩種備份方式，一種是先建立備份設備，然后再將數據庫備份到備份設備上，這樣的備份設備稱為永久備份設備；另一種是直接將數據庫備份到物理文件上，這樣的備份設備稱為臨時備份設備。創建備份設備的T-SQL存儲過程為spaddumpdevice。

純日志備份只包括一定時間間隔內的事務日志，不包含大容量操作日志記錄。

日志文件記錄每個事務對數據庫的修改操作，主要用來實現數據恢復。

每個數據庫必須至少有一個日志文件，也可以有多個日志文件。

對于非預期的事物內部故障，在保證該事務對其他事務沒有影響的條件下，利用日志文件撤銷其對數據庫的修改，使數據庫恢復到該事物運行之前的狀態。事務故障的恢復是由系統自動完成的，對用戶是透明的。

可預期的事務內部故障可以通過將事務回滾，使數據庫達到一致性狀態。

通常，對于用戶數據庫，簡單恢復模式只用于測試和開發數據庫，或用于主要包含只讀數據的數據庫（如數據倉庫），這種模式并不適合生產系統，因為對生產系統而言，丟失最新的更改是無法接受的。

SQL Server 2008支持數據庫、數據文件兩個級別的數據恢復。

在SQL Server 2008系統數據庫中，只有tempdb數據庫不需要備份，其他的都需要備份。tempdb只是一個臨時數據庫，每次SQL Server啟動時都會重新新建tempdb數據庫。

model數據庫是用戶數據庫模板，每次大量更新后必須備份。

修改數據庫作業后，建議備份msdb數據庫。

對于大型數據庫，差異備份的間隔通常比完整數據庫備份的時間更短，這可降低數據丟失風險。

結尾日志備份是恢復計劃中的最后一個備份。

清理事務日志之后，建議對用戶數據庫進行備份。

在大容量日志恢復模式下可以進行日志備份。

完整恢復模式完整地記錄所有的事務，并將事務日志記錄保留到對其備份完畢為止。

利用事務日志備份進行恢復時要求日志鏈是完整的。

事務日志備份并不備份數據庫本身，它只備份日志記錄，而且只備份從上次備份之后到當前備份時間發生變化的日志內容。

靜態轉儲保證了數據的有效性，卻是以降低數據庫的可用性為代價的（可以不使用日志文件）；而動態轉儲雖然提高了數據庫的可用性，但數據的有效性卻可能得不到保證。為了既能保證數據的有效性又不會降低數據庫的可用性，需要引入日志文件，用它記錄轉儲期間各事務對數據庫的修改活動記錄，然后使用動態轉儲的備份副本加上日志文件就可以將數據庫恢復到某一時刻的正確狀態。

靜態轉儲可以保證數據的有效性，但是卻降低數據庫的可用性，動態轉儲可以提高數據庫的可用性，但數據的有效性得不到保證。為了保證數據的一致性，需使用日志文件和動態轉儲結合使用。在制定備份策略時，需要考慮備份空間、時間等因素。

增量轉儲和差量轉儲相比速度快，存儲空間占用少。

完整數據庫備份的備份空間占用較大。完全數據庫備份備份了數據庫中的全部信息，每次備份需要消耗比較長的時間和資源，但是恢復時間最短。

對于大型數據庫，差異備份的間隔通常比完整數據庫備份的時間更短，這可降低數據丟失風險。

備份策略的制定包括定義備份的類型和頻率、備份所需硬件的特性和速度、備份的測試方法以及備份媒體的存儲位置和方法。

創建數據庫后，由于尚未寫入數據，無須備份。

九、大規模數據庫建構

范圍劃分是按照關系中某個屬性的取值范圍將數據文件劃分為n部分，分別存放到磁盤上。范圍劃分有利于范圍查詢以及點查詢，但是也可能引起數據分布不均勻，導致并行處理能力下降。

輪轉法保證了元組在多個磁盤上平均分配，適合掃描整個關系的應用，負載均衡，并行性好，但是點查詢和范圍查詢效率很低。

散列劃分使用散列函數，根據一個或多個屬性進行散列，適合點查詢，對于順序掃描也非常高效，但是對散列函數的優劣依賴很大。

聚集函數的并行化計算可以采取"先分后合"的方法。

數據分片有四種基本方法：
（1）水平分片是在關系中從行的角度（元組）依據一定條件劃分為不同的片斷，關系中的每一行必須至少屬于一個片斷，以便在需要時可以重構關系。
（2）垂直分片是在關系中從列的角度（屬性）依據一定條件分為不同的片斷，各片斷中應該包含關系的主碼屬性，以便通過連接方法恢復關系。
（3）導出分片是導出水平分片，分片的依據不是本關系屬性的條件，而是其他關系屬性的條件。
（4）混合分片指以上三種方法的混合。

使分布式數據庫具有分布式透明性的主要因素：位置獨立性、數據分片獨立性和數據復制獨立性。

分布式數據庫最基本特征是本地自治、非集中式管理及高可用性。

分片透明性是最高級別的透明性，是指數據分片用戶無需考慮的，完全透明的，在編寫程序時用戶只需要對全局關系進行操作。

分布透明性有如下幾種級別：
（1）分片透明性。分片透明性是最高級別的透明性，位于全局模式與分片模式之間。
（2）位置透明性。位置透明性是指數據分片的分配位置對用戶是透明的，用戶編寫程序時只需要考慮數據分片情況，不需要了解各分片在各個場地的分配情況。
（3）局部數據模型透明性。局部數據模型透明性處于分配模式與局部概念模式之間。全局外模式是全局應用的用戶視圖，即終端用戶看到的邏輯上并未分布的表、視圖等。

分布透明三種級別從高到低的排序是：分片透明性、位置透明性、局部透明性。

在集中式數據庫系統中，查詢代價主要是由CPU代價和1/0代價來衡量的，在分布式數據庫系統中，由于數據分布在多個不同的場地上，使得查詢處理中還要考慮站點間傳輸數據的通信代價（使得查詢執行的通信代價最省）。

Saas，即Software as a Service，中文意思是軟件即服務。

Paas，即Platform as a Service，中文意思是平臺即服務。

共享磁盤結構所有的處理機擁有獨立的內存，通過互聯網共享磁盤。這種結構可以克服共享內存結構，但是由于是通過互聯網實現處理器之間的信息交換，會產生一定的通信代價。

與傳統數據庫相比，XML數據庫具有以下優勢：
（1）XML數據庫能夠對半結構化數據進行有效的存取和管理。如網頁內容就是一種半結構化數據，而傳統的關系數據庫對于類似網頁內容這類半結構化數據無法進行有效的管理。（2）提供對標簽和路徑的操作。傳統數據庫語言允許對數據元素的值進行操作，但不能對元素名稱進行操作，半結構化數據庫提供了對標簽名稱的操作，包括對路徑的操作。
（3）當數據本身具有層次特征時，由于XML數據格式能夠清晰表達數據的層次特征，因此XML數據庫便于對層次化的數據進行操作。XML數據庫適合管理復雜數據結構的數據集。
現階段在現實環境中，一邊使用的是原有的關系數據庫廠商在其傳統商業產品中進行了相關的擴充，使其能夠處理XM，數據的產品。

BigTable表的索引是行關鍵字、列關鍵字和時間戳，每個單元由行關鍵字、列關鍵字和時間戳共同定位。在BigTable中，不僅可以隨意地增減行的數量，同在一定的約束條件下，還可以對列的數量進行擴展。
BigTable數據模型的特點是：
（1）表中的行關鍵字可以是任意的字符串。
（2）列族是由列關鍵字組成的集合，是訪問控制的基本單位。
（3）時間戳記錄了BigTable中每一個數據項所包含的不同版本的數據的時間標識。

并行數據庫系統結構有四種結構：
（1）共享內存結構：通過互聯網共享一個公共的主存儲器，與單機系統的區別是以多個處理器代替單個處理器并行執行事務，通過共享內存傳送消息和數據，實現對一個或多個磁盤的訪問。只共享內存，并沒有共享磁盤空間。
（2）共享磁盤結構：所有處理機擁有獨立的主存儲器，通過互聯網共享磁盤。只是共享磁盤，并沒有共享內存，所以各處理器有獨立的內存。
（3）無共享結構：每個處理機擁有獨立的主存儲器和磁盤，不共享任何資源。無共享結構通過最小化共享資源來降低資源競爭的概率，因此具有很好的拓展性。
（4）層次結構：前三種的結合，分兩層，頂層無共享結構，底層共享內存或共享磁盤。

在并行數據庫中的數據劃分與并行算法中，范圍劃分會引起數據分布不均勻，導致并行處理能力下降。

并行數據庫僅僅依靠采用多處理器、共享硬件資源等手段無法實現真正意義上的并行處理，只有當數據分布合理、易于并行處理，才能將并行數據庫的性能最優化。

并行數據庫系統經常通過負載均衡的方法來提高數據庫系統的業務吞吐率。

十、數據倉庫與數據挖掘

快照是關于指定數據集合的一個完全可用拷貝，該拷貝包括相應數據在某個時間點（拷貝開始的時間點）的映像?？煺湛梢允瞧渌硎镜臄祿囊粋€副本，也可以是數據的一個復制品。它反映的是某個時間點內的數據，該數據具有不可以改變性。

各商品銷售明細表、電信公司通話詳單是屬于一個動態信息表，每個時刻的信息都不一樣，因此各商品銷售明細表不適合用快照方式更新。

元數據是關于數據的數據，或者叫做描述數據的數據，它描述了數據的結構、內容、鏈和索引等項的內容。

建立數據倉庫的主要目的在于根據決策需求對企業的數據采取適當的手段進行集成，形成一個綜合的、面相分析的數據環境，用于支持企業的信息型、決策型的分析應用。

數據倉庫是服務于決策支持的數據集合。

數據倉庫中數據特征包括

面向主題性：從實際需求出發，具有較高的抽象性，數據可用性比OLTP較為寬松。
集成性：需要將數據抽取、轉換、清理、裝載。
不可更新性：是面向決策支持應用主題的，數據進入數據倉庫后不允許修改。
時間特性：數據需要定期更新。

聚類方法包括統計方法、機器學習方法、神經網絡方法和面向數據庫的方法等。在機器學習中，聚類稱作無監督（或無教師）歸納。與分類相比，分類的例子或數據對象均有類別標記，而聚類的例子則沒有標記，需要由聚類算法來自動確定。聚類的核心就是將一個數據集中的數據進行分組，使得每一組內的數據盡可能的相似而不同組間的數據盡可能不同。

有監督學習：根據樣本數據，采用分類算法，訓練分類器。

分類器的構造方法有統計方法、機器學習方法、神經網絡方法等。

統計方法包括貝葉斯法和非參數法；機器學習方法包括決策樹算法和規則歸納算法；神經網絡方法主要是BP神經網絡算法。K-means屬于聚類算法。

決策支持系統是指輔助需要決策的人或系統進行決策的系統。

機器學習是指機器采用一些方法或模型從數據中習得知識的過程。

數據挖掘可以簡單地理解為從大量數據中提取或挖掘知識，是數據庫知識發現的一個步驟。

粒度高的數據是由粒度低的數據綜合而成的。粒度越大，綜合程度越高；粒度越小，綜合程度越低。粒度影響數據倉庫的數據量以及系統能回答的查詢的類型。粒度越小，細節程度越高，能回答的查詢就越多。但是，因為需要存儲低粒度級的細節數據，數據量就比較大，空間代價也大。

封鎖粒度越大，數據庫系統能夠封鎖的數據單元就越少，封鎖開銷也就越小，并發度也就隨之降低。

數據集成是將源自不同數據源的數據經過抽取、轉換、清理、裝載等操作載入數據倉庫的過程，是實施數據倉庫的重要步驟。由于對大量的原始數據要加以提煉，要減輕分析工作給處理業務數據的服務器帶來的壓力，要規范各源數據，以及要處理那些難以直接使用的數據，數據集成在數據倉庫設計中是必不可少的一環，ETL是實現數據集成的主要技術。

ETL工具是指從OLTP系統或其他數據環境中抽取數據的工具。在實踐中，人們RETLI具從OLTP系統抽取出數據再進行分析利用，而不是在OLTP系統中直接進行數據分析利用的最主要原因是解決分析型應用程序與OLT應用程序之間的性能沖突問題。

水平分片是在關系中從行的角度（元組）依據一定條件劃分為不同的片斷，關系中的每一行必須至少屬于一個片斷，以便在需要時可以重構關系。

垂直分片是在關系中從列的角度（屬性）依據一定條件分為不同的片斷，各片斷中應該包含關系的主碼屬性，以便通過連接方法恢復關系。垂直分片后，每個分片都包含主鍵。

下一篇博客：https://blog.csdn.net/weixin_44940488/article/details/119417955

總結

以上是生活随笔為你收集整理的一、全国计算机三级数据库考试——理论知识总结（选择题）的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：前端学习（2033）vue之电商管理系统
下一篇：计算机三级数据库：课本知识点总结以及备考

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

一、全国计算机三级数据库考试——理论知识总结（选择题）

一、數據庫分析與設計

二、UML與數據庫應用系統

三、高級查詢

?四、數據庫后臺編程技術

?五、數據庫及數據庫對象

?六、安全管理

?七、運行維護與優化

八、故障管理、備份與恢復