當前位置：首頁 > 运维知识 > 数据库 >内容正文

数据库

腾讯基于 Flink SQL 的功能扩展与深度优化实践

發(fā)布時間：2024/9/3 数据库 43 豆豆

生活随笔收集整理的這篇文章主要介紹了腾讯基于 Flink SQL 的功能扩展与深度优化实践小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

簡介：本文由騰訊高級工程師杜立分享，主要介紹騰訊實時計算平臺針對 Flink SQL 所做的優(yōu)化。

整理：戴季國（Flink 社區(qū)志愿者）
校對：苗文婷（Flink 社區(qū)志愿者）

摘要：本文由騰訊高級工程師杜立分享，主要介紹騰訊實時計算平臺針對 Flink SQL 所做的優(yōu)化，內(nèi)容包括：

Flink SQL 現(xiàn)狀

窗口功能的擴展

回撤流的優(yōu)化

未來的規(guī)劃

一、背景及現(xiàn)狀

1. 三種模式的分析

Flink 作業(yè)目前有三種創(chuàng)建方式：JAR 模式、畫布模式和 SQL 模式。不同的提交作業(yè)的方式針對的人群也是不一樣的。

■ Jar 模式

Jar 模式基于 DataStream/DataSet API 開發(fā)，主要針對的是底層的開發(fā)人員。

優(yōu)點：

· 功能靈活多變，因為它底層的 DataStream/DataSet API 是 Flink 的原生 API，你可以用它們開發(fā)任何你想要的算子功能或者 DAG 圖；
· 性能優(yōu)化方便，可以非常有針對性的去優(yōu)化每一個算子的性能。

缺點：

· 依賴更新繁瑣，無論擴展作業(yè)邏輯或是 Flink 版本的升級，都要去更新作業(yè)的代碼以及依賴版本；
· 學習門檻較高。

■ 畫布模式

所謂的畫布模式，一般來講會提供一個可視化的拖拉拽界面，讓用戶通過界面化的方式去進行拖拉拽操作，以完成 Flink 作業(yè)的編輯。它面向一些小白用戶。

優(yōu)點：

· 操作便捷，畫布上可以很方便地定義 Flink 的作業(yè)所包含的各種算子；
· 功能較全，它基于 Table API 開發(fā)，功能覆蓋比較完整；
· 易于理解，DAG 圖比較直觀，用戶能夠非常容易的去理解整個作業(yè)的運行流程。

缺點：

· 配置復雜：每一個算子都需要去逐個的去配置，如果整個 DAG 圖非常復雜，相應的配置工作也會非常大；
· 邏輯重用困難：如果作業(yè)非常的多，不同的作業(yè)之間想去共享 DAG 邏輯的話非常困難。

■ SQL 模式

SQL 語言已經(jīng)存在了很長時間了，它有自己的一套標準，主要面向數(shù)據(jù)分析人員。只要遵循既有的 SQL 標準，數(shù)據(jù)分析人員就可以在不同的平臺和計算引擎之間進行切換。

優(yōu)點：

· 清晰簡潔，易于理解和閱讀；
· 與計算引擎解耦，SQL 與計算引擎及其版本是解耦的，在不同的計算引擎之間遷移業(yè)務邏輯不需要或極少需要去更改整段 SQL。同時，如果想升級 Flink 版本，也是不需要去更改 SQL；
· 邏輯重用方便，可以通過 create view 的方式去重用我們的 SQL 邏輯。

缺點：

· 語法不統(tǒng)一，比如說流與維表 Join，Flink 1.9 之前使用 Lateral Table Join 語法，但是在 1.9 之后，更改成了 PERIOD FOR SYSTEM_TIME 語法，這種語法遵循了 SQL ANSI 2011 標準。語法的變動使得用戶有一定的學習成本；
· 功能覆蓋不全：Flink SQL 這個模塊存在的時間不是很長，導致它的功能的一個覆蓋不是很全。
· 性能調(diào)優(yōu)困難：一段 SQL 的執(zhí)行效率主要由幾個部分來決定，一個就是 SQL 本身所表達的業(yè)務邏輯；另一部分是翻譯 SQL 所產(chǎn)生的執(zhí)行計劃的一個優(yōu)化；第三部分的話，在產(chǎn)生最優(yōu)的邏輯執(zhí)行計劃之后，翻譯成本地的 native code 的時候方案也決定了 SQL 的執(zhí)行效率；對于用戶來講的，他們所能優(yōu)化的內(nèi)容可能只局限于 SQL 所表達的業(yè)務邏輯。
· 問題定位困難：SQL 是一個完整的執(zhí)行流程，如果我們發(fā)現(xiàn)某些數(shù)據(jù)不對，想針對性地去排查到底是哪個算子出了問題，是比較的困難的。一般來講，我們想定位 Flink SQL 的問題，只能先不斷的精簡我們的整個 SQL 邏輯，然后不斷地去嘗試輸出，這個成本是非常高的。騰訊實時計算平臺后期會針對這個問題，增加 trace 日志和 metrics 信息，輸出到產(chǎn)品側(cè)以幫助用戶定位 Flink SQL 使用上的問題。

2. 騰訊實時計算平臺目前的工作

■ 擴展語法

定義了 window table-valued function 語法，以幫助用戶實現(xiàn)基于窗口的流 Join 和交并差操作。另外，實現(xiàn)了自己的流與維表 Join 的語法。

■ 新增功能

新增的一些功能，包括兩個新的 Window 的類型，Incremental Window（增量窗口）和 Ehanced Tumble Window（增強窗口）。實現(xiàn)了 Eventtime Field 與 Table Source 的解耦，很多時候 Eventtime Field 并不能通過 Table Source 字段定義出來，比如 Table Source 是一個子查詢或者某個時間字段是由函數(shù)轉(zhuǎn)換得出，想要用這些中間生成的時間字段作為 Eventtime Field 目前是做不到的，我們目前的方案是，讓用戶可以選擇物理表中任意的時間字段來定義 Window 的時間屬性并輸出 WaterMark。

■ 性能調(diào)優(yōu)

回撤流優(yōu)化；
內(nèi)聯(lián) UDF，如果相同的 UDF 既出現(xiàn)在 LogicalProject 中，又出現(xiàn)在 Where 條件中，那么 UDF 會進行多次調(diào)用。將邏輯執(zhí)行計劃中重復調(diào)用的 UDF 提取出來，將該 UDF 的執(zhí)行結(jié)果進行緩存，避免多次調(diào)用；

■ Bucket Join

流表維表 Join 中存在數(shù)據(jù)冷啟動問題，如果 Flink 任務在啟動時大量加載外部數(shù)據(jù)，很容易造成反壓。可以在啟動時利用 State Processor API 等手段將全部數(shù)據(jù)預加載到內(nèi)存中。但這種方案存在一種問題，維表數(shù)據(jù)加載到所有的 subtask 里面會造成較大的內(nèi)存消耗。因此我們的解決方案是，在維表的定義中指定一個 bucket 信息，流與維表進行 Join 的時候會基于 bucket 信息去加載維表中對應分片的數(shù)據(jù)，同時在翻譯執(zhí)行計劃的時候流表拿到 bucket 信息，以保證流與維表的數(shù)據(jù)都會基于同一個 bucket 信息進行 Join。這種方式能大大減少全量維表數(shù)據(jù)預加載帶來的內(nèi)存消耗問題。

二、窗口功能擴展

騰訊實時計算平臺基于現(xiàn)有 Flink SQL 語法進行了一些擴展，并另外定義了兩種新的 Window 類型。

1. 新的窗口操作

現(xiàn)有如下需求，需要在兩條流上針對某個時間窗口做 Join 操作或者交并差操作。

使用 Flink SQL 基于某個 Window 去做雙流 Join，現(xiàn)有的方案有兩種，第一種方案就是先做 Join 再做 Group By，第二種就是 Interval Join。首先來分析一下第一種方案能否滿足需求。

■ 1.1 先 Join 再開窗

先 Join 再開窗的邏輯如上圖所示，根據(jù)邏輯執(zhí)行計劃可以看到 Join 節(jié)點在 Window Aggregate 節(jié)點之下，所以會先進行流與流的 Join，Join 完了之后再去做Window Aggregate。

圖中右側(cè)的流程圖也可以看出，首先兩邊的流會做一個 Connect，然后基于 Join Key 做 Keyby 操作，以此保證兩條流中擁有相同 Join Key 的數(shù)據(jù)能夠 Shuffle 到同一個 task 上。左流會將數(shù)據(jù)存到自己的狀態(tài)中，同時會去右流的狀態(tài)中進行 Match，如果能 Match 上會將 Match 后的結(jié)果輸出到下游。這種方案存在以下兩個問題：

狀態(tài)無法清理：因為 Join 在開窗之前，Join 里面并沒有帶 Window 的信息，即使下游的 Window 觸發(fā)并完成計算，上游兩條流的 Join 狀態(tài)也無法被清理掉，頂多只能使用基于 TTL 的方式去清理。

語義無法滿足需求：原始的需求是想在兩條流中基于相同的時間窗口去把數(shù)據(jù)進行切片后再 Join，但是當前方案并不能滿足這樣的需求，因為它先做 Join，使用 Join 后的數(shù)據(jù)再進行開窗，這種方式不能確保兩條流中參與 Join 的數(shù)據(jù)是基于同一窗口的。

■ 1.2 Interval Join

Interval Join 相對于前面一種寫法，好處就是不存在狀態(tài)無法清理的問題，因為在掃描左右兩條流的數(shù)據(jù)時可以基于某一確定的窗口，過了窗口時間后，狀態(tài)是可以被清理掉的。

但是這種方案相對于第一種方案而言，數(shù)據(jù)準確性可能會更差一點，因為它對于窗口的劃分不是基于一個確定窗口，而是基于數(shù)據(jù)進行驅(qū)動，即當前數(shù)據(jù)可以 Join 的另一條流上的數(shù)據(jù)的范圍是基于當前數(shù)據(jù)所攜帶的 Eventtime 的。這種窗口劃分的語義與我們的需求還是存在一定差距的。

想象一下現(xiàn)有兩條速率不一致的流，以 low 和 upper 兩條邊界來限定左流可以 Join 的右流的數(shù)據(jù)范圍，在如此死板的范圍約束下，右流總會存在一些有效數(shù)據(jù)落在時間窗口 [left + low, left + upper] 之外，導致計算不夠準確。因此，最好還是按照窗口對齊的方式來劃分時間窗口，讓兩條流中 Eventtime 相同的數(shù)據(jù)落在相同的時間窗口。

■ 1.3 Windowing Table-Valued Function

騰訊擴展出了 Windowing Table-Valued Function 語法，該語法可以滿足“在兩條流上針對某個時間窗口做 Join 操作或者交并差操作”的需求。在 SQL 2016 標準中就有關于這一語法的描述，同時該語法在 Calcite1.23 里面就已存在。

Windowing Table-Valued Function 語法中的 Source 可以把它整個的語義描述清楚，From 子句里面包含了 Window 定義所需要的所有信息，包括 Table Source、Eventtime Field、Window Size 等等。

從上圖的邏輯計劃可以看出，該語法在 LogiclTableScan 上加了一個叫 LogicalTableFunctionScan 的節(jié)點。另外，LogicalProject 節(jié)點（輸出節(jié)點）多了兩個字段叫作 WindowStart 和 WindowEnd，基于這兩個字段可以把數(shù)據(jù)歸納到一個確定的窗口。基于以上原理，Windowing Table-Valued Function 語法可以做到下面這些事情：

在單流上面，可以像現(xiàn)有的 Group Window 語法一樣去劃分出一個時間窗口。寫法如上圖，Window 信息全部放到 From 子句中，然后再進行 Group By。這種寫法應該更符合大眾對于時間窗口的理解，比當前 Flink SQL 中的 Group Window 的寫法更加直觀一點。我們在翻譯單流上的 Windowing Table-Valued Function 語法時做了一個討巧，即在實現(xiàn)這段 SQL 的物理翻譯時，并沒有去翻譯成具體的 DataStream API，而是將其邏輯執(zhí)行計劃直接變換到現(xiàn)在的 Group Window 的邏輯執(zhí)行計劃，也就是說共用了底層物理執(zhí)行計劃的代碼，只是做了一個邏輯執(zhí)行計劃的等價。

另外，可以對 Window 里面的數(shù)據(jù)做一些 Sort 或者 TopN 的一些輸出，因為 Windowing Table-Valued Function 語法已經(jīng)提前把數(shù)據(jù)劃分進了一個個確定的窗口。如上圖所示，首先在 From 子句里面把窗口劃分好，然后 Order By 和 Limit 緊接其后，直接表達了排序和 TopN 語義。

在雙流上面，可以滿足“在兩條流上針對某個時間窗口做 Join 操作或者交并差操作”的原始需求。語法如上圖，首先把兩個窗口的 Window Table 構(gòu)造好，然后利用 Join 關鍵字進行 Join 操作即可；交并差操作也一樣，與傳統(tǒng)數(shù)據(jù)庫 SQL 的交并差操作無二。

■ 1.4 實現(xiàn)細節(jié)

下面簡單介紹一下我們在實現(xiàn) Windowing Table-Valued Function 語法時的一些細節(jié)。

1.4.1 窗口的傳播

原始的邏輯計劃翻譯方式，先基于 LogicalTableScan，然后再翻譯到 Windowing Table-Valued Function，最后再翻譯到 OrderBy Limit 子句。整個過程會存儲很多次狀態(tài)，對于性能來講會是比較大的一個消耗，因此做了如下優(yōu)化，把多個 Logical Relnode 合并在一起去翻譯，這樣可以減少中間環(huán)節(jié)代碼的產(chǎn)生，從而提高性能。

1.4.2 時間屬性字段

可以看到 Windowing Table-Valued Function 的語法：

SELECT * FROM TABLE(TUMBLE(TABLE <data>, DESCRIPTOR(<timecol>), <size> [, <offset>]))

table 不僅僅可以是一張表，還可以是一個子查詢。所以如果定義 Eventtime Field 的時候，把時間屬性和 Table Source 綁定，且 Table Source 恰好是一個子查詢，此時就無法滿足我們的需求。所以我們在實現(xiàn)語法的時候，把時間屬性字段跟 Table Source 解耦，反之，用戶使用物理表中的任意一個時間字段來作為時間屬性，從而產(chǎn)生 watermark。

1.4.3 時間水印

Watermark 的使用邏輯與在其他語法中一樣，兩條流的所有的 Input Task 的最小時間水印，決定窗口的時間水印，以此來觸發(fā)窗口計算。

1.4.4 使用約束

目前 Windowing Table-Valued Function 的使用存在一些約束。首先，兩條流的窗口類型必須是一致的，而且窗口大小也是一樣的。然后，目前還沒有實現(xiàn) Session Window 相關的功能。

2. 新的窗口類型

接下來的介紹擴展出兩個新的窗口類型。

■ 2.1 Incremental Window

有如下需求，用戶希望能夠繪制一天內(nèi)的 pv/uv 曲線，即在一天內(nèi)或一個大的窗口內(nèi)，輸出多次結(jié)果，而非等窗口結(jié)束之后統(tǒng)一輸出一次結(jié)果。針對該需求，我們擴展出了 Incremental Window。

2.1.1 多次觸發(fā)

基于 Tumble Window，自定義了 Incremental Trigger。該觸發(fā)器確保，不僅僅是在 Windows 結(jié)束之后才去觸發(fā)窗口計算，而是每個 SQL 中所定義的 Interval 周期都會觸發(fā)一次窗口計算。

如上圖中的 SQL 案例，總的窗口大小是一秒，且每 0.2 秒觸發(fā)一次，所以在窗口內(nèi)會觸發(fā) 5 次窗口計算。且下一次的輸出結(jié)果是基于上一次結(jié)果進行累計計算。

2.1.2 Lazy Trigger

針對 Incremental Window 做了一個名為 Lazy Trigger 的優(yōu)化。在實際的生產(chǎn)過程中，一個窗口相同 Key 值在多次觸發(fā)窗口計算后輸出的結(jié)果是一樣的。對于下游來講，對于這種數(shù)據(jù)是沒必要去重復接收的。因此，如果配置了 Lazy Trigger 的話，且在同一個窗口的同一個 Key 下，下一次輸出的值跟上一次的是一模一樣的，下游就不會接收到這次的更新數(shù)據(jù)，由此減少下游的存儲壓力和并發(fā)壓力。

■ 2.2 Enhanced Tumble Window

有如下需求，用戶希望在 Tumble Window 觸發(fā)之后，不去丟棄遲到的數(shù)據(jù)，而是再次觸發(fā)窗口計算。如果使用 DataStream API，使用 SideOutput 就可以完成需求。但是對于 SQL，目前是沒辦法做到的。因此，擴展了現(xiàn)有的 Tumble Window，把遲到的數(shù)據(jù)也收集起來，同時遲到的數(shù)據(jù)并不是每來一條就重新觸發(fā)窗口計算并向下游輸出，而是會重新定義一個 Trigger，Trigger 的時間間隔使用 SQL 中定義的窗口大小，以此減少向下游發(fā)送數(shù)據(jù)的頻率。

同時，側(cè)輸出流在累計數(shù)據(jù)的時候也會使用 Window 的邏輯再做一次聚合。這里需要注意，如果下游是類似于HBase這樣的數(shù)據(jù)源，對于相同的 Window 相同的 Key，前一條正常被窗口觸發(fā)的數(shù)據(jù)會被遲到的數(shù)據(jù)覆蓋掉。理論上，遲到的數(shù)據(jù)跟正常窗口觸發(fā)的數(shù)據(jù)的重要性是一樣的，不能相互覆蓋。最后，下游會將收到的同一個窗口同一個 Key 下的正常數(shù)據(jù)和延遲數(shù)據(jù)再做一次二次聚合。

三、回撤流優(yōu)化

接下來介紹一下在回撤流上所做的一些優(yōu)化。

1. 流表二義性

回顧一下關于在 Flink SQL 中關于回撤流的一些概念。

首先介紹一下持續(xù)查詢（Continuous Query），相對于批處理一次執(zhí)行輸出一次結(jié)果的特點，流的聚合是上游來一條數(shù)據(jù)，下游的話就會接收一條更新的數(shù)據(jù)，即結(jié)果是不斷被上游的數(shù)據(jù)所更新的。因此，對于同一個 Key 下游能夠接收到多條更新結(jié)果。

2. 回撤流

以上圖的 SQL 為例，當?shù)诙l Java 到達聚合算子時，會去更新第一條 Java 所產(chǎn)生的狀態(tài)并把結(jié)果發(fā)送到下游。如果下游對于多次更新的結(jié)果不做任何處理，就會產(chǎn)生錯誤的結(jié)果。針對這種場景，Flink SQL 引入了回撤流的概念。

所謂回撤流的話，就是在原始數(shù)據(jù)前加了一個標識位，以 True/False 進行標識。如果標識位是 False，就表示這是一條回撤消息，它通知下游對這條數(shù)據(jù)做 Delete 操作；如果標識位是 True，下游直接會做 Insert 操作。

■ 2.1 什么時候產(chǎn)生回撤流

目前，Flink SQL 里面產(chǎn)生回撤流有以下四種場景：

Aggregate Without Window（不帶 Window 的聚合場景）
Rank
Over Window
Left/Right/Full Outer Join

解釋一下 Outer Join 為什么會產(chǎn)生回撤。以 Left Outer Join 為例，且假設左流的數(shù)據(jù)比右流的數(shù)據(jù)先到，左流的數(shù)據(jù)會去掃描右流數(shù)據(jù)的狀態(tài)，如果找不到可以 Join 的數(shù)據(jù)，左流并不知道右流中是確實不存在這條數(shù)據(jù)還是說右流中的相應數(shù)據(jù)遲到了。為了滿足 Outer join 的語義的話，左邊流數(shù)據(jù)還是會產(chǎn)生一條 Join 數(shù)據(jù)發(fā)送到下游，類似于 MySQL Left Join，左流的字段以正常的表字段值填充，右流的相應字段以 Null 填充，然后輸出到下游，如下圖所示：

（圖片來源于云棲社區(qū)）

后期如果右流的相應數(shù)據(jù)到達，會去掃描左流的狀態(tài)再次進行 Join，此時，為了保證語義的正確性，需要把前面已經(jīng)輸出到下游的這條特殊的數(shù)據(jù)進行回撤，同時會把最新 Join 上的數(shù)據(jù)輸出到下游。注意，對于相同的 Key，如果產(chǎn)生了一次回撤，是不會再產(chǎn)生第二次回撤的，因為如果后期再有該 Key 的數(shù)據(jù)到達，是可以 Join 上另一條流上相應的數(shù)據(jù)的。

■ 2.2 如何處理回撤消息

下面介紹 Flink 中處理回撤消息的邏輯。

對于中間計算節(jié)點，通過上圖中的 4 個標志位來控制，這些標識位表示當前節(jié)點是產(chǎn)生 Update 信息還是產(chǎn)生 Retract 信息，以及當前節(jié)點是否會消費這個 Retract 信息。這 4 個標識位能夠決定整個關于 Retract 的產(chǎn)生和處理的邏輯。

對于 Sink 節(jié)點，目前 Flink 中有三種 sink 類型，AppendStreamTableSink、RetractStreamTableSink 和 UpsertStreamTableSink。AppendStreamTableSink 接收的上游數(shù)據(jù)是一條 Retract 信息的話會直接報錯的，因為它只能描述 Append-Only 語義；RetractStreamTableSink 則可以處理 Retract 信息，如果上游算子發(fā)送一個 Retract 信息過來，它會對消息做 Delete 操作，如果上游算子發(fā)送的是正常的更新信息，它會對消息做 Insert 操作；UpsertStreamTableSink 可以理解為對于RetractStreamTableSink 做了一些性能的優(yōu)化。如果 Sink 數(shù)據(jù)源支持冪等操作，或者支持按照某 key 做 Update 操作，UpsertStreamTableSink 會在 SQL 翻譯的時候把上游 Upsert Key 傳到 Table Sink 里面，然后基于該 Key 去做 Update 操作。

■ 2.3 相關優(yōu)化

我們基于回撤流做以下優(yōu)化。

2.3.1 中間節(jié)點的優(yōu)化

產(chǎn)生回撤信息最根本的一個原因是不斷地向下游多次發(fā)送更新結(jié)果，因此，為了減少更新的頻率并降低并發(fā)，可以把更新結(jié)果累計一部分之后再發(fā)送出去。如上圖所示：

第一個場景是一個嵌套 AGG 的場景（例如兩次 Count操作），在第一層 Group By 嘗試將更新結(jié)果發(fā)送到下游時候會先做一個 Cache，從而減少向下游發(fā)送數(shù)據(jù)頻率。當達到了 Cache 的觸發(fā)條件時，再把更新結(jié)果發(fā)送到下游。
第二個場景是 Outer Join，前面提到，Outer Join 產(chǎn)生回撤消息是因為左右兩邊數(shù)據(jù)的速率不匹配。以 Left Outer Join 為例，可以把左流的數(shù)據(jù)進行 Cache。左流數(shù)據(jù)到達時會去右流的狀態(tài)里面查找，如果能找到可以與之 Join的數(shù)據(jù)則不作緩存；如果找不到相應數(shù)據(jù)，則對這條 Key 的數(shù)據(jù)先做緩存，當?shù)竭_某些觸發(fā)條件時，再去右流狀態(tài)中查找一次，如果仍然找不到相應數(shù)據(jù)，再去向下游發(fā)送一條包含 Null 值的 Join 數(shù)據(jù)，之后右流相應數(shù)據(jù)到達就會將 Cache 中該 Key 對應的緩存清空，并向下游發(fā)送一條回撤消息。

以此來減小向下游發(fā)送回撤消息的頻率。

2.3.2 Sink 節(jié)點的優(yōu)化

針對 Sink 節(jié)點做了一些優(yōu)化，在 AGG 節(jié)點和 Sink 節(jié)點之間做了一個 Cache，以此減輕 Sink 節(jié)點的壓力。當回撤消息在 Cache 中再做聚合，當達到 Cache 的觸發(fā)條件時，統(tǒng)一將更新后的數(shù)據(jù)發(fā)送到 Sink 節(jié)點。以下圖中的 SQL 為例：

參考優(yōu)化前后的輸出結(jié)果可以看到，優(yōu)化后下游接收到的數(shù)據(jù)量是有減少的，例如用戶 Sam，當回撤消息嘗試發(fā)送到下游時，先做一層 Cache，下游接收到的數(shù)據(jù)量可以減少很多。

四、未來規(guī)劃

下面介紹一下我們團隊后續(xù)的工作規(guī)劃：

Cost-Based Optimization：現(xiàn)在 Flink SQL 的邏輯執(zhí)行計劃的優(yōu)化還是基于RBO（Rule Based Optimization）的方式。我們團隊想基于 CBO 所做一些事，主要的工作還是統(tǒng)計信息的收集。統(tǒng)計信息不僅僅來自 Flink SQL 本身，可能還會來自公司內(nèi)其他產(chǎn)品，例如元數(shù)據(jù)，不同 Key 所對應的數(shù)據(jù)分布，或者其他數(shù)據(jù)分析結(jié)果。通過跟公司內(nèi)其他產(chǎn)品打通，拿到最準的統(tǒng)計數(shù)據(jù)，產(chǎn)生最優(yōu)的執(zhí)行計劃。
More New Features（CEP Syntax etc.）：基于 Flink SQL 定義一些 CEP 的語法，以滿足用戶關于 CEP 的一些需求。
Continuous Performance Optimization（Join Operator etc.）：我們團隊在做的不僅僅是執(zhí)行計劃層的優(yōu)化，也在做 Join Operator 或者說數(shù)據(jù) Shuffle 的一些細粒度的優(yōu)化。
Easier To Debug：最后是關于 Flink SQL任務的調(diào)試和定位。目前 Flink SQL在這方面是比較欠缺的，特別是線上關于數(shù)據(jù)對不齊的問題，排查起來非常的棘手。我們目前的思路是通過配置的方式，讓 SQL 在執(zhí)行的過程中吐出一些 Trace 信息或者一些 Metrics 信息，然后發(fā)送到其他平臺。通過這些 Trace 信息和 Metric 信息，幫助用戶定位出問題的算子。

原文鏈接：https://developer.aliyun.com/article/781670?

版權聲明：本文內(nèi)容由阿里云實名注冊用戶自發(fā)貢獻，版權歸原作者所有，阿里云開發(fā)者社區(qū)不擁有其著作權，亦不承擔相應法律責任。具體規(guī)則請查看《阿里云開發(fā)者社區(qū)用戶服務協(xié)議》和《阿里云開發(fā)者社區(qū)知識產(chǎn)權保護指引》。如果您發(fā)現(xiàn)本社區(qū)中有涉嫌抄襲的內(nèi)容，填寫侵權投訴表單進行舉報，一經(jīng)查實，本社區(qū)將立刻刪除涉嫌侵權內(nèi)容。

總結(jié)

以上是生活随笔為你收集整理的腾讯基于 Flink SQL 的功能扩展与深度优化实践的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： ARMS为深绘智能系统保驾护航
下一篇：阿里云数据库2020技术年报新鲜出炉，全