當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

你当真了解count(*)count(id)count(1)吗？

發(fā)布時間：2024/2/28 编程问答 47 豆豆

生活随笔收集整理的這篇文章主要介紹了你当真了解count(*)count(id)count(1)吗？小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

首先什么是count？?

關(guān)于count函數(shù)，在mysql中也有描述：

簡單翻譯一下：

1、COUNT(expr) ，返回SELECT語句檢索的行中expr的值不為NULL的數(shù)量。結(jié)果是一個BIGINT值。

2、如果查詢結(jié)果沒有命中任何記錄，則返回0

3、但是，值得注意的是，COUNT(*)?的統(tǒng)計結(jié)果中，會包含值為NULL的行數(shù)。

那我們平常使用count中，除了COUNT(id)和COUNT(*)以外，還可以使用COUNT(常量)（如COUNT(1)）來統(tǒng)計行數(shù)，那么這三條SQL語句有什么區(qū)別呢？到底哪種效率更高呢？為什么《阿里巴巴Java開發(fā)手冊》中強(qiáng)制要求不讓使用?COUNT(列名）或?COUNT(常量)來替代?COUNT(*)呢？

那么count（列名）count（常量）count（*）之間的區(qū)別是？

在count（expr）中，expr的三個條件分別是列名、?常量?和?*,常量?是一個固定值，肯定不為NULL。*可以理解為查詢整行，所以肯定也不為NULL，那么就只有列名的查詢結(jié)果有可能是NULL了。

所以，?COUNT(常量)?和?COUNT(*)表示的是直接查詢符合條件的數(shù)據(jù)庫表的行數(shù)。而COUNT(列名)表示的是查詢符合條件的列的值不為NULL的行數(shù)。

除了查詢得到結(jié)果集有區(qū)別之外，COUNT(*)相比COUNT(常量)?和?COUNT(列名)來講，COUNT(*)是SQL92定義的標(biāo)準(zhǔn)統(tǒng)計行數(shù)的語法，因為他是標(biāo)準(zhǔn)語法，所以MySQL數(shù)據(jù)庫對他進(jìn)行過很多優(yōu)化。

【注】SQL92，是數(shù)據(jù)庫的一個ANSI/ISO標(biāo)準(zhǔn)。它定義了一種語言（SQL）以及數(shù)據(jù)庫的行為（事務(wù)、隔離級別等）。

那么**MySQL數(shù)據(jù)庫對count（*）進(jìn)行的優(yōu)化到底是哪方面？**

這里的介紹要區(qū)分不同的執(zhí)行引擎。MySQL中比較常用的執(zhí)行引擎就是InnoDB和MyISAM。

MyISAM和InnoDB有很多區(qū)別，其中有一個關(guān)鍵的區(qū)別和我們接下來要介紹的COUNT(*)有關(guān)，那就是MyISAM不支持事務(wù)，MyISAM中的鎖是表級鎖；而InnoDB支持事務(wù)，并且支持行級鎖。

因為MyISAM的鎖是表級鎖，所以同一張表上面的操作需要串行進(jìn)行，所以，MyISAM做了一個簡單的優(yōu)化，那就是它可以把表的總行數(shù)單獨(dú)記錄下來，如果從一張表中使用COUNT(*)進(jìn)行查詢的時候，可以直接返回這個記錄下來的數(shù)值就可以了，當(dāng)然，前提是不能有where條件。

MyISAM之所以可以把表中的總行數(shù)記錄下來供COUNT(*)查詢使用，那是因為MyISAM數(shù)據(jù)庫是表級鎖，不會有并發(fā)的數(shù)據(jù)庫行數(shù)修改，所以查詢得到的行數(shù)是準(zhǔn)確的。

但是，對于InnoDB來說，就不能做這種緩存操作了，因為InnoDB支持事務(wù)，其中大部分操作都是行級鎖，所以可能表的行數(shù)可能會被并發(fā)修改，那么緩存記錄下來的總行數(shù)就不準(zhǔn)確了。

但是，InnoDB還是針對COUNT(*)語句做了些優(yōu)化的。

在InnoDB中，使用COUNT(*)查詢行數(shù)的時候，不可避免的要進(jìn)行掃表了，那么，就可以在掃表過程中下功夫來優(yōu)化效率了。

從MySQL 8.0.13開始，針對InnoDB的SELECT COUNT(*) FROM tbl_name語句，確實在掃表的過程中做了一些優(yōu)化。前提是查詢語句中不包含WHERE或GROUP BY等條件。

我們知道，COUNT(*)的目的只是為了統(tǒng)計總行數(shù)，所以，他根本不關(guān)心自己查到的具體值，所以，他如果能夠在掃表的過程中，選擇一個成本較低的索引進(jìn)行的話，那就可以大大節(jié)省時間。

我們知道，InnoDB中索引分為聚簇索引（主鍵索引）和非聚簇索引（非主鍵索引），聚簇索引的葉子節(jié)點(diǎn)中保存的是整行記錄，而非聚簇索引的葉子節(jié)點(diǎn)中保存的是該行記錄的主鍵的值。

所以，相比之下，非聚簇索引要比聚簇索引小很多，所以MySQL會優(yōu)先選擇最小的非聚簇索引來掃表。所以，當(dāng)我們建表的時候，除了主鍵索引以外，創(chuàng)建一個非主鍵索引還是有必要的。

至此，我們介紹完了MySQL數(shù)據(jù)庫對于COUNT(*)的優(yōu)化，這些優(yōu)化的前提都是查詢語句中不包含WHERE以及GROUP BY條件。

那**COUNT(*)和COUNT(1)到底有沒有區(qū)別？**

對于二者有沒有區(qū)別，眾說紛壇。我覺得最好的方法是先測試一下二者的效率。并且在足夠量的數(shù)據(jù)中。

在網(wǎng)上：

有的說COUNT(*)執(zhí)行時會轉(zhuǎn)換成COUNT(1)，所以COUNT(1)少了轉(zhuǎn)換步驟，所以更快。

還有的說，因為MySQL針對COUNT(*)做了特殊優(yōu)化，所以COUNT(*)更快。

那么，到底哪種說法是對的呢？看下MySQL官方文檔是怎么說的：

InnoDB handles SELECT COUNT(*) and SELECT COUNT(1) operations in the same way. There is no performance difference.

畫重點(diǎn)：same way?,?no performance difference。所以，對于COUNT(1)和COUNT(*)，MySQL的優(yōu)化是完全一樣的，根本不存在誰比誰快！

那既然COUNT(*)和COUNT(1)一樣，建議用哪個呢？

建議使用COUNT(*)！因為這個是SQL92定義的標(biāo)準(zhǔn)統(tǒng)計行數(shù)的語法，而且本文只是基于MySQL做了分析，關(guān)于Oracle中的這個問題，也是眾說紛紜的呢。

那至于count（字段）呢？

他的查詢就比較簡單粗暴了，就是進(jìn)行全表掃描，然后判斷指定字段的值是不是為NULL，不為NULL則累加。

相比COUNT(*)，COUNT(字段)多了一個步驟就是判斷所查詢的字段是否為NULL，所以他的性能要比COUNT(*)慢。

總結(jié)：

本文介紹了COUNT函數(shù)的用法，主要用于統(tǒng)計表行數(shù)。主要用法有COUNT(*)、COUNT(字段)和COUNT(1)。

因為COUNT(*)是SQL92定義的標(biāo)準(zhǔn)統(tǒng)計行數(shù)的語法，所以MySQL對他進(jìn)行了很多優(yōu)化，MyISAM中會直接把表的總行數(shù)單獨(dú)記錄下來供COUNT(*)查詢，而InnoDB則會在掃表的時候選擇最小的索引來降低成本。當(dāng)然，這些優(yōu)化的前提都是沒有進(jìn)行where和group的條件查詢。

在InnoDB中COUNT(*)和COUNT(1)實現(xiàn)上沒有區(qū)別，而且效率一樣，但是COUNT(字段)需要進(jìn)行字段的非NULL判斷，所以效率會低一些。

因為COUNT(*)是SQL92定義的標(biāo)準(zhǔn)統(tǒng)計行數(shù)的語法，并且效率高，所以請直接使用COUNT(*)查詢表的行數(shù)！

總結(jié)

以上是生活随笔為你收集整理的你当真了解count(*)count(id)count(1)吗？的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： hbase shell中命令无法删除？
下一篇：淘汰算法LRU是什么？