當(dāng)前位置：首頁 > 运维知识 > 数据库 >内容正文

数据库

mysql开窗函数over_oracle分析函数技术详解（配上开窗函数over()）

發(fā)布時間：2024/7/23 数据库 56 豆豆

生活随笔收集整理的這篇文章主要介紹了 mysql开窗函数over_oracle分析函数技术详解（配上开窗函数over()）小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

一、Oracle分析函數(shù)入門分析函數(shù)是什么？分析函數(shù)是Oracle專門用于解決復(fù)雜報表統(tǒng)計需求的功能強大的函數(shù)，它可以在數(shù)據(jù)中進行分組然后計算基于組的某種統(tǒng)計，并且每一組的每一行都可以返回一個統(tǒng)計。分析函數(shù)和聚合函數(shù)的不同之處是什么？普通的聚

一、Oracle分析函數(shù)入門

分析函數(shù)是什么？

分析函數(shù)是Oracle專門用于解決復(fù)雜報表統(tǒng)計需求的功能強大的函數(shù)，它可以在數(shù)據(jù)中進行分組然后計算基于組的某種統(tǒng)計值，并且每一組的每一行都可以返回一個統(tǒng)計值。

分析函數(shù)和聚合函數(shù)的不同之處是什么？

普通的聚合函數(shù)用group by分組，每個分組返回一個統(tǒng)計值，而分析函數(shù)采用partition by分組，并且每組每行都可以返回一個統(tǒng)計值。

分析函數(shù)的形式

分析函數(shù)帶有一個開窗函數(shù)over()，包含三個分析子句:分組(partition by), 排序(order by), 窗口(rows) ，他們的使用形式如下：over(partition by xxx order by yyy rows between zzz)。

注：窗口子句在這里我只說rows方式的窗口,range方式和滑動窗口也不提

分析函數(shù)例子(在scott用戶下模擬)

示例目的：顯示各部門員工的工資，并附帶顯示該部分的最高工資。

--顯示各部門員工的工資，并附帶顯示該部分的最高工資。SELECT E.DEPTNO,

E.EMPNO,

E.ENAME,

E.SAL,

LAST_VALUE(E.SAL)

OVER(PARTITION BY E.DEPTNO

ORDER BY E.SAL ROWS

--unbounded preceding and unbouned following針對當(dāng)前所有記錄的前一條、后一條記錄，也就是表中的所有記錄 --unbounded：不受控制的，無限的 --preceding：在...之前 --following：在...之后 BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING) MAX_SAL

FROM EMP E;

運行結(jié)果：

示例目的：按照deptno分組，然后計算每組值的總和

SELECT EMPNO,

ENAME,

DEPTNO,

SAL,

SUM(SAL) OVER(PARTITION BY DEPTNO ORDER BY ENAME) max_sal

FROM SCOTT.EMP;

運行結(jié)果：

示例目的：對各部門進行分組，并附帶顯示第一行至當(dāng)前行的匯總

SELECT EMPNO,

ENAME,

DEPTNO,

SAL,

--注意ROWS BETWEEN unbounded preceding AND current row 是指第一行至當(dāng)前行的匯總 SUM(SAL) OVER(PARTITION BY DEPTNO

ORDER BY ENAME

ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) max_sal

FROM SCOTT.EMP;

運行結(jié)果：

示例目標(biāo)：當(dāng)前行至最后一行的匯總

SELECT EMPNO,

ENAME,

DEPTNO,

SAL,

--注意ROWS BETWEEN current row AND unbounded following 指當(dāng)前行到最后一行的匯總 SUM(SAL) OVER(PARTITION BY DEPTNO

ORDER BY ENAME

ROWS BETWEEN CURRENT ROW AND UNBOUNDED FOLLOWING) max_sal

FROM SCOTT.EMP;

運行結(jié)果：

示例目標(biāo)：當(dāng)前行的上一行(rownum-1)到當(dāng)前行的匯總

SELECT EMPNO,

ENAME,

DEPTNO,

SAL,

--注意ROWS BETWEEN 1 preceding AND current row 是指當(dāng)前行的上一行(rownum-1)到當(dāng)前行的匯總 SUM(SAL) OVER(PARTITION BY DEPTNO

ORDER BY ENAME ROWS

BETWEEN 1 PRECEDING AND CURRENT ROW) max_sal

FROM SCOTT.EMP;

運行結(jié)果：

示例目標(biāo)：當(dāng)前行的上一行(rownum-1)到當(dāng)前行的下輛行(rownum+2)的匯總

SELECT EMPNO,

ENAME,

DEPTNO,

SAL,

--注意ROWS BETWEEN 1 preceding AND 1 following 是指當(dāng)前行的上一行(rownum-1)到當(dāng)前行的下輛行(rownum+2)的匯總 SUM(SAL) OVER(PARTITION BY DEPTNO

ORDER BY ENAME

ROWS BETWEEN 1 PRECEDING AND 2 FOLLOWING) max_sal

FROM SCOTT.EMP;

運行結(jié)果：

二、理解over()函數(shù)

1.1、兩個order by的執(zhí)行時機

分析函數(shù)(以及與其配合的開窗函數(shù)over())是在整個sql查詢結(jié)束后(sql語句中的order by的執(zhí)行比較特殊)再進行的操作, 也就是說sql語句中的order by也會影響分析函數(shù)的執(zhí)行結(jié)果：

a) 兩者一致：如果sql語句中的order by滿足與分析函數(shù)配合的開窗函數(shù)over()分析時要求的排序，即sql語句中的order by子句里的內(nèi)容和開窗函數(shù)over()中的order

by子句里的內(nèi)容一樣，

那么sql語句中的排序?qū)⑾葓?zhí)行,分析函數(shù)在分析時就不必再排序；

b) 兩者不一致：如果sql語句中的order by不滿足與分析函數(shù)配合的開窗函數(shù)over()分析時要求的排序，即sql語句中的order by子句里的內(nèi)容和開窗函數(shù)over()中的order

by子句里的內(nèi)容不一樣，

那么sql語句中的排序?qū)⒆詈笤诜治龊瘮?shù)分析結(jié)束后執(zhí)行排序。

1.2、開窗函數(shù)over()分析函數(shù)中的分組/排序/窗口

開窗函數(shù)over()分析函數(shù)包含三個分析子句：分組子句(partition by)，排序子句(order by)，窗口子句(rows)

窗口就是分析函數(shù)分析時要處理的數(shù)據(jù)范圍，就拿sum來說,它是sum窗口中的記錄而不是整個分組中的記錄，因此我們在想得到某個欄位的累計值時，我們需要把窗口指定到該分組中的第一行數(shù)據(jù)到當(dāng)前行, 如果你指定該窗口從該分組中的第一行到最后一行,那么該組中的每一個sum值都會一樣，即整個組的總和。

窗口子句在這里我只說rows方式的窗口，range方式和滑動窗口也不提。

窗口子句中我們經(jīng)常用到指定第一行，當(dāng)前行，最后一行這樣的三個屬性：

第一行是 unbounded preceding，

當(dāng)前行是 current row，

最后一行是 unbounded following，

注釋：

當(dāng)開窗函數(shù)over()出現(xiàn)分組(partition by)子句時，

unbounded preceding即第一行是指表中一個分組里的第一行，unbounded following即最后一行是指表中一個分組里的最后一行；

當(dāng)開窗函數(shù)over()省略了分組(partition

by)子句時，

unbounded preceding即第一行是指表中的第一行，unbounded following即最后一行是指表中的最后一行。

窗口子句不能單獨出現(xiàn)，必須有order by子句時才能出現(xiàn)，

例如:

last_value(sal) over(partition by deptno

order by sal

rows between unbounded preceding and unbounded following)

以上示例指定窗口為整個分組。而出現(xiàn)order by子句的時候，不一定要有窗口子句，但效果會很不一樣，此時的窗口默認是當(dāng)前組的第一行到當(dāng)前行！

如果省略分組,則把全部記錄當(dāng)成一個組。

a) 如果存在order by則默認窗口是unbounded preceding and current row --當(dāng)前組的第一行到當(dāng)前行

b) 如果這時省略order by則窗口默認為unbounded preceding and unbounded following --整個組

而無論是否省略分組子句，如下結(jié)論都是成立的：

1、窗口子句不能單獨出現(xiàn)，必須有order by子句時才能出現(xiàn)。

2、當(dāng)省略窗口子句時:a) 如果存在order by則默認的窗口是unbounded preceding and current row --當(dāng)前組的第一行到當(dāng)前行，即在當(dāng)前組中，第一行到當(dāng)前行

b) 如果同時省略order by則默認的窗口是unbounded preceding and unbounded following --整個組

所以，

lag(sal) over(order by sal) 解釋

over(order by salary)表示意義如下：

首先，我們要知道由于省略分組子句，所以當(dāng)前組的范圍為整個表的數(shù)據(jù)行，

然后，在當(dāng)前組(此時為整個表的數(shù)據(jù)行)這個范圍里執(zhí)行排序(即order by salary)，

最后，我們知道分析函數(shù)lag(sal)在當(dāng)前組(此時為整個表的數(shù)據(jù)行)這個范圍里的窗口范圍為當(dāng)前組的第一行到當(dāng)前行，即分析函數(shù)lag(sal)在這個窗口范圍執(zhí)行。

參見：

Oracle的LAG和LEAD分析函數(shù)

Oracle分析函數(shù)ROW_NUMBER()|RANK()|LAG()使用詳解

1.3、幫助理解over()的實例

例1：關(guān)注點：sql無排序，over()排序子句省略

SELECT DEPTNO, EMPNO, ENAME, SAL,

LAST_VALUE(SAL) OVER(PARTITION BY DEPTNO)

FROM EMP;

運行結(jié)果：

例2：關(guān)注點：sql無排序，over()排序子句有，窗口省略

SELECT DEPTNO,

EMPNO,

ENAME,

SAL,

LAST_VALUE(SAL) OVER(PARTITION BY DEPTNO

ORDER BY SAL DESC)

FROM EMP;

運行結(jié)果：

例3：關(guān)注點：sql無排序，over()排序子句有，窗口也有，窗口特意強調(diào)全組數(shù)據(jù)

SELECT DEPTNO,

EMPNO,

ENAME,

SAL,

LAST_VALUE(SAL)

OVER(PARTITION BY DEPTNO

ORDER BY SAL

ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING) MAX_SAL

FROM EMP;

運行結(jié)果：

例4：關(guān)注點：sql有排序(正序)，over()排序子句無，先做sql排序再進行分析函數(shù)運算

SELECT DEPTNO,

MGR,

ENAME,

SAL,

HIREDATE,

LAST_VALUE(SAL) OVER(PARTITION BY DEPTNO) LAST_VALUE

FROM EMP

WHERE DEPTNO = 30

ORDER BY DEPTNO, MGR;

運行結(jié)果：

例5：關(guān)注點：sql有排序(倒序)，over()排序子句無，先做sql排序再進行分析函數(shù)運算

SELECT DEPTNO,

MGR,

ENAME,

SAL,

HIREDATE,

LAST_VALUE(SAL) OVER(PARTITION BY DEPTNO) LAST_VALUE

FROM EMP

WHERE DEPTNO = 30

ORDER BY DEPTNO, MGR DESC;

運行結(jié)果：

例6：關(guān)注點：sql有排序(倒序)，over()排序子句有，窗口子句無，此時的運算是：sql先選數(shù)據(jù)但是不排序，而后排序子句先排序并進行分析函數(shù)處理(窗口默認為第一行到當(dāng)前行)，最后再進行sql排序

SELECT DEPTNO,

MGR,

ENAME,

SAL,

HIREDATE,

MIN(SAL) OVER(PARTITION BY DEPTNO ORDER BY SAL ASC) LAST_VALUE

FROM EMP

WHERE DEPTNO = 30

ORDER BY DEPTNO, MGR DESC;

運行結(jié)果：

SELECT DEPTNO,

MGR,

ENAME,

SAL,

HIREDATE,

MIN(SAL) OVER(PARTITION BY DEPTNO ORDER BY SAL DESC) LAST_VALUE

FROM EMP

WHERE DEPTNO = 30

ORDER BY DEPTNO, MGR DESC;

運行結(jié)果：

三、常見分析函數(shù)詳解

為了方便進行實踐，特將演示表和數(shù)據(jù)羅列如下：

一、創(chuàng)建表

create table t(

bill_month varchar2(12) ,

area_code number,

net_type varchar(2),

local_fare number

);

二、插入數(shù)據(jù)

insert into t values('200405',5761,'G', 7393344.04);

insert into t values('200405',5761,'J', 5667089.85);

insert into t values('200405',5762,'G', 6315075.96);

insert into t values('200405',5762,'J', 6328716.15);

insert into t values('200405',5763,'G', 8861742.59);

insert into t values('200405',5763,'J', 7788036.32);

insert into t values('200405',5764,'G', 6028670.45);

insert into t values('200405',5764,'J', 6459121.49);

insert into t values('200405',5765,'G', 13156065.77);

insert into t values('200405',5765,'J', 11901671.70);

insert into t values('200406',5761,'G', 7614587.96);

insert into t values('200406',5761,'J', 5704343.05);

insert into t values('200406',5762,'G', 6556992.60);

insert into t values('200406',5762,'J', 6238068.05);

insert into t values('200406',5763,'G', 9130055.46);

insert into t values('200406',5763,'J', 7990460.25);

insert into t values('200406',5764,'G', 6387706.01);

insert into t values('200406',5764,'J', 6907481.66);

insert into t values('200406',5765,'G', 13562968.81);

insert into t values('200406',5765,'J', 12495492.50);

insert into t values('200407',5761,'G', 7987050.65);

insert into t values('200407',5761,'J', 5723215.28);

insert into t values('200407',5762,'G', 6833096.68);

insert into t values('200407',5762,'J', 6391201.44);

insert into t values('200407',5763,'G', 9410815.91);

insert into t values('200407',5763,'J', 8076677.41);

insert into t values('200407',5764,'G', 6456433.23);

insert into t values('200407',5764,'J', 6987660.53);

insert into t values('200407',5765,'G', 14000101.20);

insert into t values('200407',5765,'J', 12301780.20);

insert into t values('200408',5761,'G', 8085170.84);

insert into t values('200408',5761,'J', 6050611.37);

insert into t values('200408',5762,'G', 6854584.22);

insert into t values('200408',5762,'J', 6521884.50);

insert into t values('200408',5763,'G', 9468707.65);

insert into t values('200408',5763,'J', 8460049.43);

insert into t values('200408',5764,'G', 6587559.23);

insert into t values('200408',5764,'J', 7342135.86);

insert into t values('200408',5765,'G', 14450586.63);

insert into t values('200408',5765,'J', 12680052.38);

commit;

三、first_value()與last_value()：求最值對應(yīng)的其他屬性

問題、取出每月通話費最高和最低的兩個地區(qū)。

SELECT BILL_MONTH,

AREA_CODE,

SUM(LOCAL_FARE) LOCAL_FARE,

FIRST_VALUE(AREA_CODE)

OVER(PARTITION BY BILL_MONTH

ORDER BY SUM(LOCAL_FARE) DESC

ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING) FIRSTVAL,

LAST_VALUE(AREA_CODE)

OVER(PARTITION BY BILL_MONTH

ORDER BY SUM(LOCAL_FARE) DESC

ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING) LASTVAL

FROM T

GROUP BY BILL_MONTH, AREA_CODE

ORDER BY BILL_MONTH

運行結(jié)果：

四、rank(),dense_rank()與row_number()：求排序

rank，dense_rank，row_number函數(shù)為每條記錄產(chǎn)生一個從1開始至n的自然數(shù)，n的值可能小于等于記錄的總數(shù)。這3個函數(shù)的唯一區(qū)別在于當(dāng)碰到相同數(shù)據(jù)時的排名策略。

①row_number：

row_number函數(shù)返回一個唯一的值，當(dāng)碰到相同數(shù)據(jù)時，排名按照記錄集中記錄的順序依次遞增。

②dense_rank：

dense_rank函數(shù)返回一個唯一的值，當(dāng)碰到相同數(shù)據(jù)時，此時所有相同數(shù)據(jù)的排名都是一樣的。

③rank：

rank函數(shù)返回一個唯一的值，當(dāng)碰到相同的數(shù)據(jù)時，此時所有相同數(shù)據(jù)的排名是一樣的，同時會在最后一條相同記錄和下一條不同記錄的排名之間空出排名。

演示數(shù)據(jù)在Oracle自帶的scott用戶下：

1、rank()值相同時排名相同，其后排名跳躍不連續(xù)

SELECT *

FROM (SELECT DEPTNO,

RANK() OVER(PARTITION BY DEPTNO ORDER BY SAL DESC) RW,

ENAME,

SAL

FROM SCOTT.EMP)

WHERE RW <= 4;

運行結(jié)果：

2、dense_rank()值相同時排名相同，其后排名連續(xù)不跳躍

SELECT *

FROM (SELECT DEPTNO,

DENSE_RANK() OVER(PARTITION BY DEPTNO ORDER BY SAL DESC) RW,

ENAME,

SAL

FROM SCOTT.EMP)

WHERE RW <= 4;

運行結(jié)果：

3、row_number()值相同時排名不相等，其后排名連續(xù)不跳躍

SELECT *

FROM (SELECT DEPTNO,

ROW_NUMBER() OVER(PARTITION BY DEPTNO ORDER BY SAL DESC) RW,

ENAME,

SAL

FROM SCOTT.EMP)

WHERE RW <= 4;

運行結(jié)果：

五、lag()與lead()：求之前或之后的第N行

lag和lead函數(shù)可以在一次查詢中取出同一字段的前n行的數(shù)據(jù)和后n行的值。這種操作可以使用對相同表的表連接來實現(xiàn)，不過使用lag和lead有更高的效率。

lag(arg1,arg2,arg3)

第一個參數(shù)是列名，

第二個參數(shù)是偏移的offset，

第三個參數(shù)是超出記錄窗口時的默認值。

舉例如下：

SQL> select * from kkk;

ID NAME

---------- --------------------

1 1name

2 2name

3 3name

4 4name

5 5name

SQL> select id,name,lag(name,1,0) over(order by id) from kkk;

ID NAME LAG(NAME,1,0)OVER(ORDERBYID)

---------- -------------------- ----------------------------

1 1name 0

2 2name 1name

3 3name 2name

4 4name 3name

5 5name 4name

SQL> select id,name,lead(name,1,0) over(order by id) from kkk;

ID NAME LEAD(NAME,1,0)OVER(ORDERBYID)

---------- -------------------- -----------------------------

1 1name 2name

2 2name 3name

3 3name 4name

4 4name 5name

5 5name 0

SQL> select id,name,lead(name,2,0) over(order by id) from kkk;

ID NAME LEAD(NAME,2,0)OVER(ORDERBYID)

---------- -------------------- -----------------------------

1 1name 3name

2 2name 4name

3 3name 5name

4 4name 0

5 5name 0

SQL> select id,name,lead(name,1,'linjiqin') over(order by id) from kkk;

ID NAME LEAD(NAME,1,'ALSDFJLASDJFSAF')

---------- -------------------- ------------------------------

1 1name 2name

2 2name 3name

3 3name 4name

4 4name 5name

5 5name linjiqin

---------------------------------------------------------------------------------------

六、rollup()與cube()：排列組合分組

1)、group by rollup(a, b, c)：

首先會對(a、b、c)進行g(shù)roup by，

然后再對(a、b)進行g(shù)roup by，

其后再對(a)進行g(shù)roup by，

最后對全表進行匯總操作。

2)、group by cube(a, b, c)：

則首先會對(a、b、c)進行g(shù)roup by，

然后依次是(a、b)，(a、c)，(a)，(b、c)，(b)，(c)，

最后對全表進行匯總操作。

1、生成演示數(shù)據(jù)：

Connected to Oracle Database 10g Enterprise Edition Release 10.2.0.1.0

Connected as ds_trade

SQL> conn system/oracle as sysdba

Connected to Oracle Database 10g Enterprise Edition Release 10.2.0.3.0

Connected as SYS

SQL> create table scott.t as select * from dba_indexes;

Table created

SQL> connect scott/oracle

Connected to Oracle Database 10g Enterprise Edition Release 10.2.0.3.0

Connected as scott

SQL>

2、普通group by體驗

sql> select owner, index_type, status, count(*) from t where owner like 'SY%' group by owner, index_type, status;

3、group by rollup(A,B,C)

GROUP BY ROLLUP(A, B, C)：

首先會對(A、B、C)進行GROUP BY，

然后再對(A、B)進行GROUP BY，

其后再對(A)進行GROUP BY，

最后對全表進行匯總操作。

sql> select owner, index_type, status, count(*) from t where owner like 'SY%' group by ROLLUP(owner, index_type, status);

4、group by cube(A,B,C)

GROUP BY CUBE(A, B, C)：

則首先會對(A、B、C)進行GROUP BY，

然后依次是(A、B)，(A、C)，(A)，(B、C)，(B)，(C)，

最后對全表進行匯總操作。

sql> select owner, index_type, status, count(*) from t where owner like 'SY%' group by cube(owner, index_type, status);

七、max(),min(),sun()與avg()：求移動的最值總和與平均值

問題：計算出各個地區(qū)連續(xù)3個月的通話費用的平均數(shù)(移動平均值)

SELECT AREA_CODE,

BILL_MONTH,

LOCAL_FARE,

SUM(LOCAL_FARE) OVER(PARTITION BY AREA_CODE

ORDER BY TO_NUMBER(BILL_MONTH)

RANGE BETWEEN 1 PRECEDING AND 1 FOLLOWING) "3month_sum",

AVG(LOCAL_FARE) OVER(PARTITION BY AREA_CODE

ORDER BY TO_NUMBER(BILL_MONTH)

RANGE BETWEEN 1 PRECEDING AND 1 FOLLOWING) "3month_avg",

MAX(LOCAL_FARE) OVER(PARTITION BY AREA_CODE

ORDER BY TO_NUMBER(BILL_MONTH)

RANGE BETWEEN 1 PRECEDING AND 1 FOLLOWING) "3month_max",

MIN(LOCAL_FARE) OVER(PARTITION BY AREA_CODE

ORDER BY TO_NUMBER(BILL_MONTH)

RANGE BETWEEN 1 PRECEDING AND 1 FOLLOWING) "3month_min"

FROM (SELECT T.AREA_CODE, T.BILL_MONTH, SUM(T.LOCAL_FARE) LOCAL_FARE

FROM T

GROUP BY T.AREA_CODE, T.BILL_MONTH)

運行結(jié)果：

問題：求各地區(qū)按月份累加的通話費

SELECT AREA_CODE,

BILL_MONTH,

LOCAL_FARE,

SUM(LOCAL_FARE) OVER(PARTITION BY AREA_CODE

ORDER BY BILL_MONTH ASC) "last_sum_value"

FROM (SELECT T.AREA_CODE, T.BILL_MONTH, SUM(T.LOCAL_FARE) LOCAL_FARE

FROM T

GROUP BY T.AREA_CODE, T.BILL_MONTH)

ORDER BY AREA_CODE, BILL_MONTH

運行結(jié)果：

--------------------------------------------------------------------------

Blog：http://www.cnblogs.com/linjiqin/

J2EE、Android、Linux、Oracle QQ交流群：142463980、158560018(滿)

另見：《Oracle分析函數(shù)ROW_NUMBER()|RANK()|LAG()使用詳解》

本文原創(chuàng)發(fā)布php中文網(wǎng)，轉(zhuǎn)載請注明出處，感謝您的尊重！

總結(jié)

以上是生活随笔為你收集整理的mysql开窗函数over_oracle分析函数技术详解（配上开窗函数over()）的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：语义分割和实例分割_一文读懂语义分割与实
下一篇： php bind_param,php

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

数据库

mysql开窗函数over_oracle分析函数技术详解（配上开窗函数over()）

總結(jié)