日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > 数据库 >内容正文

数据库

机器学习从入门到精通50讲(九)-基于 ANTLR 自己实现一个 SQL 解析器

發(fā)布時間:2023/12/2 数据库 52 豆豆
生活随笔 收集整理的這篇文章主要介紹了 机器学习从入门到精通50讲(九)-基于 ANTLR 自己实现一个 SQL 解析器 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

一、背景

自2014年大數(shù)據(jù)首次寫入政府工作報告,大數(shù)據(jù)已經(jīng)發(fā)展7年。大數(shù)據(jù)的類型也從交易數(shù)據(jù)延伸到交互數(shù)據(jù)與傳感數(shù)據(jù)。數(shù)據(jù)規(guī)模也到達了PB級別。

大數(shù)據(jù)的規(guī)模大到對數(shù)據(jù)的獲取、存儲、管理、分析超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍。在這個背景下,各種大數(shù)據(jù)相關(guān)工具相繼出現(xiàn),用于應(yīng)對各種業(yè)務(wù)場景需求。從Hadoop生態(tài)的Hive, Spark, Presto, Kylin, Druid到非Hadoop生態(tài)的ClickHouse, Elasticsearch,不一而足...

這些大數(shù)據(jù)處理工具特性不同,應(yīng)用場景不同,但是對外提供的接口或者說操作語言都是相似的,即各個組件都是支持SQL語言。只是基于不同的應(yīng)用場景和特性,實現(xiàn)了各自的SQL方言。這就要求相關(guān)開源項目自行實現(xiàn)SQL解析。在這個背景下,誕生于1989年的語法解析器生成器ANTLR迎來了黃金時代。

二、簡介

ANTLR是開源的語法解析器生成器,距今已有30多年的歷史。是一個經(jīng)歷了時間考驗的開源項目。一個程序從源代碼到機器可執(zhí)行,基本需要3個階段:編寫、編譯、執(zhí)行。

在編譯階段,需要進行詞法和語法的分析。ANTLR聚焦的問題就是把源碼進行詞法和句法分析,產(chǎn)生一個樹狀的分析器。ANTLR幾乎支持對所有主流編程語言的解析。從antlr/grammars-v4可以看到,ANTLR支持Java,C, Python, SQL等數(shù)十種編程語言。通常我們沒有擴展編程語言的需求,所以大部分情況下這些語言編譯支持更多是供學習研究使用,或者用在各種開發(fā)工具(NetBeans、Intellij)中用于校驗語法正確性、和格式化代碼。

對于SQL語言,ANTLR的應(yīng)用廣度和深度會更大,這是由于Hive, Presto, SparkSQL等由于需

創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎勵來咯,堅持創(chuàng)作打卡瓜分現(xiàn)金大獎

總結(jié)

以上是生活随笔為你收集整理的机器学习从入门到精通50讲(九)-基于 ANTLR 自己实现一个 SQL 解析器的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。