SQL查询入门(上篇)
? ? ? SQL語言是一門簡單易學卻又功能強大的語言,它能讓你快速上手并寫出比較復雜的查詢語句。但對于大多數開發者來說,使用SQL查詢數據庫并沒有一個抽象的過程和一個合理的步驟,這很可能會使在寫一些特定的SQL查詢語句來解決特定問題時被”卡”住,本系列文章主要講述SQL查詢時一些基本的理論,以及寫查詢語句的抽象思路。
?
SQL查詢簡介
????? SQL語言起源于1970年E.J.Codd發表的關系數據庫理論,所以SQL是為關系數據庫服務的。而對于SQL查詢,是指從數據庫中取得數據的子集,這句話貌似聽著有些晦澀是吧,下面通過幾張圖片簡單說明一下:
????? 假如一個數據庫中只有一個表,再假如所有數據如下圖(取自AdventureWork示例數據庫):
????
?
???? 而對于子集的概念,look下圖:
?
???????
???? 最后,子集如下:
?
?
??? 其實,SQL中無論多復雜的查詢,都可以抽象成如上面的過程.
?
精確查詢的前置條件
?
??? 對于正確取得所需要的數據子集.除了需要思路正確并將思路正確轉變為對應SQL查詢語句之外。還有很重要的一點是需要數據庫有著良好的設計.這里的良好設計我所指的是數據庫的設計符合業務邏輯并至少實現第三范式,對于實現第三范式,這只是我個人觀點,對于范式的簡單介紹,請看我的博客:數據庫范式那些事.如果數據庫設計很糟糕,存在很多冗余,數據庫中信息存在大量異常,則即使SQL寫的正確,也無法取得精確的結果。
?
兩種方式,同一種結果
?
??? 在SQL中,取得相同的數據子集可以用不同的思路或不同的SQL語句,因為SQL源于關系數據庫理論,而關系數據庫理論又源于數學,思考如何構建查詢語句時,都可以抽象為兩種方法:
????1.關系代數法
????? 關系代數法的思路是對數據庫進行分步操作,最后取得想要的結果.
????? 比如如下語句:
Select Name,Department,Age From Employee where Age>20
????? 關系代數的思路描述上面語句為:對表Employee表進行投影(選擇列)操作,然后對結果進行篩選,只取得年齡大于20的結果.
?
????? 2.關系演算法
?????? 相比較關系代數法而言,關系演算法更多關注的是取得數據所滿足的條件.上面SQL可以用關系演算法被描述為:我想得到所有年齡大于20的員工的姓名,部門和年齡。
?
???? 為什么需要兩種方法
?
??? 對于簡單的查詢語句來說,上面兩種方法都不需要.用腳就可以想出來了。問題在于很多查詢語句都會非常復雜。對于關系演算法來說更多的是關注的是所取出信息所滿足的條件,而對于關系代數法來說,更多關注的是如何取出特定的信息.簡單的說,關系演算法表示的是”what”,而關系代數法表達的是”how”.SQL語句中所透漏的思路,有些時候是關系代數法,有些時候是關系演算法,還有些是兩種思路的混合.
???? 對于某些查詢情況,關系代數法可能會更簡單,而對于另外一些情況,關系演算法則會顯得更直接.還有一些情況.我們需要混合兩種思路。所以這兩種思維方式在寫SQL查詢時都是必須的.
?
單表查詢
????? 單表查詢是所有查詢的中間狀態,既是多個表的復雜查詢在最終進行這種連接后都能夠被抽象成單表查詢。所以先從單表查詢開始。
?
選擇列的子集
?????? 根據上面數據子集的說法,選擇列是通過在select語句后面添加所要選擇的列名實現的:
???? 比如下面數據庫中通過在select后面選擇相應的列名實現選擇列的子集.
????
?? 相應sql語句如下:
SELECT [Name],[GroupName]FROM [AdventureWorks].[HumanResources].[Department]?
選擇行的子集
????? 選擇行的子集是在Sql語句的where子句后面加上相應的限制條件,當where子句后面的表達式為“真”時,也就是滿足所謂的“條件”時,相應的行的子集被返回。
????? where子句后面的運算符分為兩類,分別是比較運算符和邏輯運算符.
???? 比較運算符是將兩個相同類型的數據進行比較,進而返回布爾類型(bool)的運算符,在SQL中,比較運算符一共有六種,分別為等于(=),小于(<),大于(>),小于或等于(<=),大于或等于(>=)以及不等于(<>),其中小于或等于和大于或等于可以看成是比較運算符和邏輯運算符的結合體。
????? 而邏輯運算符是將兩個布爾類型進行連接,并返回一個新的布爾類型的運算符,在SQL中,邏輯運算符通常是將比較運算符返回的布爾類型相連接以最終確定where子句后面滿足條件的真假。邏輯運算符一種有三種,與(AND),或(OR),非(NOT).
??
??????
?? 比如上面,我想選擇第二條和第六條,為了說明比較運算符和邏輯運算符,可以使用如下Sql語句:
SELECT [Name],[GroupName]FROM [AdventureWorks].[HumanResources].[Department]WHERE DepartmentID>1 and DepartmentID<3 or DepartmentID>5 and DepartmentID<7? 由此我們可以看出,這幾種運算符是有優先級的,優先級由大到小排列是比較運算符>于(And)>非(Or)
?? 當然,運算符也可以通過小括號來改變優先級,對于上面那個表
???
?? 對于不加括號時:
SELECT *FROM [AdventureWorks].[HumanResources].[Department]WHERE DepartmentID>=1 and DepartmentID<=3 and DepartmentID>=5 or DepartmentID<=7???
? 加了括號改變運算順序后:
SELECT *FROM [AdventureWorks].[HumanResources].[Department]WHERE DepartmentID>=1 and DepartmentID<=3 and (DepartmentID>=5 or DepartmentID<=7)?
?
很特別的NULL
??? 假如在一個用戶注冊的表中,一些選填信息并不需要用戶必須填寫,則在數據庫中保存為null,這些null值在利用上面where子句后的運算符時,有可能造成數據丟失,比如一個選填信息是性別(Gender),假設下面兩條條件子句:
where Gender="M"where NOT (Gender="M")
?? 由于null值的存在,這兩條語句返回的數據行加起來并不是整個表中的所有數據。所以,當將null值考慮在內時,where后面的條件子句擁有可能的值從真和假,增加為真,假,以及未知(null)。這些是我們在現實世界中想一些問題的時候可能的答案--真的,假的,我不知道。
??? 所以我們如何在這種情況下不丟失數據呢,對于上面的例子來說,如何才能讓整個表的數據不被丟失呢,這里必須將除了“真”,“假”以外的“未知”這個選項包含在內,SQL提供了IS NULL來表明未知這個選項:
where Gender IS NULL?? 將上面語句加入進去,則不會再丟失數據。
?
排序結果
????? 上面的那些方法都是關于取出數據,而下面是關于將取出的子集進行排序。SQL通過Order by子句來進行排序,Order by子句是Sql查詢語句的最后一個子句,也就是說Order by子句之后不能再加任何的子句了。
????? Order By子句分為升序(ASC)和降序(DESC),如果不指定升序或者降序,則默認為升序(由小到大),而Order by是根據排序依據的數據類型決定,分別為3種數據類型可以進行排序:
???? 字符按照字母表進行排序,數字根據數字大小排序,時間日期根據時間的先后進行排序。
?????
其它一些有關的
? 視圖
?????? 視圖可以看作是一個保存的虛擬表,也可以簡單看做是保存的一個查詢語句。視圖的好處是視圖可以根據視圖所查詢表的內容的改變而改變,打個比方來理解這句話是:
????
???? 使用視圖的優點是可以對查詢進行加密以及便于管理,據說還可以優化性能(我不認可這點).
?
防止重復
?????? 有時候我們對于取出的數據子集不想重復,比如你想知道一些特定的員工一共屬于幾個部門
SELECT [EmployeeID],[DepartmentID]FROM [AdventureWorks].[HumanResources].[EmployeeDepartmentHistory]
?? 這樣的結果是沒有意義的,SQL提供了Distinct關鍵字來實現這點:
SELECT distinct DepartmentIDFROM [AdventureWorks].[HumanResources].[EmployeeDepartmentHistory]?
聚合函數
???? 所謂聚合函數,是為了一些特定目的,將同一列多個值聚合為一個,比如我想知道一群人中最大年齡是多少可以利用MAX(Age),比如我想知道一個班級平均測驗成績是多少可以用AVG(Result)……
?
?
?
總結
???? 文章簡單概述了SQL查詢的原理以及簡單的單表查詢,這些都是數據庫查詢的基礎概念,對于進行復雜查詢來說,弄明白這些概念是必不可少的。
總結
以上是生活随笔為你收集整理的SQL查询入门(上篇)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: sql复杂查询语句总结
- 下一篇: SQL查询入门(中篇)