Mysql group by 排序问题
?
類如 有一個(gè) 帖子的回復(fù)表,posts( id , tid , subject , message , dateline ) , id 為 自動(dòng)增長(zhǎng)字段, tid為該回復(fù)的主題帖子的id(外鍵關(guān)聯(lián)), subject 為回復(fù)標(biāo)題, message 為回復(fù)內(nèi)容, dateline 為回復(fù)時(shí)間,用UNIX 時(shí)間戳表示, 現(xiàn)在要求 選出 前???
?類如 有一個(gè) 帖子的回復(fù)表,posts( id , tid , subject , message ,? dateline ) ,
id 為 自動(dòng)增長(zhǎng)字段, tid為該回復(fù)的主題帖子的id(外鍵關(guān)聯(lián)),? subject 為回復(fù)標(biāo)題, message 為回復(fù)內(nèi)容, dateline 為回復(fù)時(shí)間,用UNIX 時(shí)間戳表示,
現(xiàn)在要求 選出 前十個(gè)來自不同主題的最新回復(fù)
SELECT * FROM posts GROUP BY? tid? LIMIT 10
這樣一個(gè)sql語句選出來的并非你想要的 最新的回復(fù),而是最早的回復(fù),實(shí)際上是某篇主題的第一條回復(fù)記錄!
也就是說 GROUP BY 語句沒有排序,那么怎么才能讓 GROUP 按照 dateline 倒序排列呢?加上 order by 子句?
看下面:
SELECT * FROM posts GROUP BY? tid? ORDER BY dateline DESC LIMIT 10
這條語句選出來的結(jié)果和上面的完全一樣,不過把結(jié)果倒序排列 了,而選擇出來的每一條記錄仍然是上面的記錄,原因是 group by 會(huì)比 order by 先執(zhí)行,這樣也就沒有辦法將 group by 之前,也就是在分組之前進(jìn)行排序了, 有網(wǎng)友會(huì)寫出下面的sql 語句:
SELECT * FROM posts GROUP BY? tid DESC ORDER BY dateline DESC LIMIT 10
也就是說 在 GROUP BY 的字段 tid 后面加上遞減順序,這樣不就可以取得分組時(shí)的最后回復(fù)了嗎?這個(gè)語句執(zhí)行結(jié)果會(huì)和上面的一模一樣,這里加上 DESC 和ASC對(duì)執(zhí)行結(jié)果沒有任何影響!其實(shí)這是一個(gè)錯(cuò)誤的語句,原因是GROUP BY 之前并沒有排序功能,mysql 手冊(cè)上面說,GROUP BY 時(shí)是按照某種順序排序的,某種順序到底是什么順序?其實(shí)根本沒有順序,因?yàn)榘凑誸id分組,其實(shí)也就是說,把tid相等的歸納到一個(gè)組,這樣想的 話,GROUP BY tid DESC 可以認(rèn)為是在按照 tid 分組的時(shí)候,按照tid進(jìn)行倒序排列,這不扯嗎,既然是按照tid分組,當(dāng)然是tid相等的歸到一組,而這時(shí)候按照tid倒敘還是升序有個(gè)P用!
于 是有網(wǎng)友發(fā)明下面的語句:
SELECT * FROM posts GROUP BY? tid , dateline DESC ORDER BY dateline DESC LIMIT 10
心 想這樣我就可以在分組前按照? dateline 倒序排列了,其實(shí)這個(gè)語句并沒有起到按照tid分組的作用,原因還是上面的,在group by 字段后加 desc 還是 asc 是錯(cuò)誤的寫法,而這種寫法 網(wǎng)友本意是想 按照 tid 分組,并且在分組的時(shí)候按照 dateline排倒序!而實(shí)際這句相當(dāng)于下面的寫法:(去掉 GROUP BY 字段后面的 DESC)
SELECT * FROM posts GROUP BY? tid , dateline ORDER BY dateline DESC LIMIT 10
也就是說,按照 tid 和 dateline 聯(lián)合分組,只有在記錄tid和dateline 同時(shí)相等的時(shí)候才歸納到一組,這顯然不可能, 因?yàn)?dateline 時(shí)間線基本上是唯一的!
有人寫出下面的語句:
SELECT *,max(dateline) as max_line FROM posts GROUP BY? tid ORDER BY dateline DESC LIMIT 10
這條語句的沒錯(cuò)是選出了最大發(fā)布時(shí)間,但是你可 以對(duì)比一下 dateline 和 max_dateline 并不相等!(可能有相當(dāng)?shù)那闆r,就是分組的目標(biāo)記錄只有一條的時(shí)候!)
為 什么呢?原因很簡(jiǎn)單,這條語句相當(dāng)于是 在group by 以后選出 本組的最大的 發(fā)布時(shí)間!對(duì)分組沒有起到任何影響!因?yàn)镾ELECT子句是最后執(zhí)行的!
后來更有網(wǎng)友發(fā)明了下面的寫法!
SELECT *,max(dateline) as max_line FROM posts GROUP BY? tid HAVING dateline=max(dateline)
ORDER BY dateline DESC LIMIT 10
這條語句的預(yù)期結(jié)果和想象中的并不相同!因?yàn)槟銜?huì)發(fā)現(xiàn),分組的結(jié)果 中大量的記錄沒有了!為什么?因?yàn)?HAVING 是在分組的時(shí)候執(zhí)行的,也就說:在分組的時(shí)候加上一個(gè)這樣的條件:選擇出來的 dateline 要和 本組最大的dateline 相等,執(zhí)行的結(jié)果和下面的語句相同:
SELECT *,max(dateline) as max_line FROM posts GROUP BY? tid HAVING count(*)=1
ORDER BY dateline DESC LIMIT 10
看 了這條sql語句是不是明白了呢?
dateline=max(dateline) 只有在分組中的記錄只有一條的時(shí)候才成立,原因很明白吧!只有一條他才會(huì)和本組的最大發(fā)布時(shí)間相等阿,(默認(rèn)dateline為不重復(fù)的值)
原 因還是因?yàn)?group by 并沒有排序功能,所有的這些排序功能只是錯(cuò)覺,所以你最終選出的 dateline 和max(dateline) 永遠(yuǎn)不可能相等,除非本組的記錄只有一條!GROUP BY 在分組的時(shí)候,可能是一個(gè)一個(gè)來找的,發(fā)現(xiàn)有相等的tid,去掉,保留第一個(gè)發(fā)現(xiàn)的那一條記錄,所以找出來的 記錄永遠(yuǎn)只是按照默認(rèn)索引順序排列的!
那 么說了這么多,到底有沒有辦法讓 group by 執(zhí)行前分組阿?有的 ,子查詢阿!
最簡(jiǎn)單的 :
SELECT * FROM (SELECT * FROM posts ORDER BY dateline DESC) GROUP BY? tid ORDER BY dateline DESC LIMIT 10
也 有網(wǎng)友利用自連接實(shí)現(xiàn)的 ,這樣的效率應(yīng)該比上面的子查詢效率高,不過,為了簡(jiǎn)單明了,就只用這樣一種了,GROUP BY沒有排序功能,可能是mysql弱智的地方,也許是我還沒有發(fā)現(xiàn),
期待高人拍磚!
轉(zhuǎn)載于:https://www.cnblogs.com/ldms/p/5260697.html
總結(jié)
以上是生活随笔為你收集整理的Mysql group by 排序问题的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: MinGW和MSYS的自动安装 【转】
- 下一篇: DES加密解密与AES加密解密