日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

数据湖 VS 数据仓库之争?阿里提出大数据架构新概念:湖仓一体

發(fā)布時(shí)間:2024/8/23 编程问答 80 豆豆
生活随笔 收集整理的這篇文章主要介紹了 数据湖 VS 数据仓库之争?阿里提出大数据架构新概念:湖仓一体 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

作者 |關(guān)濤、李睿博、孫莉莉、張良模、賈揚(yáng)清(from 阿里云智能計(jì)算平臺(tái))

黃波、金玉梅、于茜、劉子正(from 新浪微博機(jī)器學(xué)習(xí)研發(fā)部)

編者按

隨著近幾年數(shù)據(jù)湖概念的興起,業(yè)界對于數(shù)據(jù)倉庫和數(shù)據(jù)湖的對比甚至爭論就一直不斷。有人說數(shù)據(jù)湖是下一代大數(shù)據(jù)平臺(tái),各大云廠商也在紛紛的提出自己的數(shù)據(jù)湖解決方案,一些云數(shù)倉產(chǎn)品也增加了和數(shù)據(jù)湖聯(lián)動(dòng)的特性。但是數(shù)據(jù)倉庫和數(shù)據(jù)湖的區(qū)別到底是什么,是技術(shù)路線之爭?是數(shù)據(jù)管理方式之爭?二者是水火不容還是其實(shí)可以和諧共存,甚至互為補(bǔ)充?本文作者來自阿里巴巴計(jì)算平臺(tái)部門,深度參與阿里巴巴大數(shù)據(jù)/數(shù)據(jù)中臺(tái)領(lǐng)域建設(shè),將從歷史的角度對數(shù)據(jù)湖和數(shù)據(jù)倉庫的來龍去脈進(jìn)行深入剖析,來闡述兩者融合演進(jìn)的新方向——湖倉一體,并就基于阿里云MaxCompute/EMR DataLake的湖倉一體方案做一介紹。

大數(shù)據(jù)領(lǐng)域發(fā)展20年的變與不變

1.1 概述

大數(shù)據(jù)領(lǐng)域從本世紀(jì)初發(fā)展到現(xiàn)在,已經(jīng)歷20年。從宏觀層面觀察其中的發(fā)展規(guī)律,可以高度概括成如下五個(gè)方面:

1、數(shù)據(jù)保持高速增長- 從5V核心要素看,大數(shù)據(jù)領(lǐng)域保持高速增長。阿里巴巴經(jīng)濟(jì)體,作為一個(gè)重度使用并著力發(fā)展大數(shù)據(jù)領(lǐng)域的公司,過去5年數(shù)據(jù)規(guī)模保持高速增長(年化60%-80%),增速在可見的未來繼續(xù)保持。對于新興企業(yè),大數(shù)據(jù)領(lǐng)域增長超過年200%。

2、?大數(shù)據(jù)作為新的生產(chǎn)要素,得到廣泛認(rèn)可- 大數(shù)據(jù)領(lǐng)域價(jià)值定位的遷移,從“探索”到“普惠”,成為各個(gè)企業(yè)/政府的核心部門,并承擔(dān)關(guān)鍵任務(wù)。還是以阿里巴巴為例,30%的員工直接提交大數(shù)據(jù)作業(yè)。隨大數(shù)據(jù)普惠進(jìn)入生產(chǎn)環(huán)境,可靠性、安全性、管控能力、易用性等企業(yè)級產(chǎn)品力增強(qiáng)。

3、數(shù)據(jù)管理能力成為新的關(guān)注點(diǎn)- 數(shù)倉(中臺(tái))能力流行起來,如何用好數(shù)據(jù)成為企業(yè)的核心競爭力。

4、引擎技術(shù)進(jìn)入收斂期?- 隨著Spark(通用計(jì)算)、Flink(流計(jì)算)、Hbase(KV)、Presto(交互分析)、ElasticSearch(搜索)、Kafka(數(shù)據(jù)總線)自從2010-2015年逐步占領(lǐng)開源生態(tài),最近5年新引擎開源越來越少,但各引擎技術(shù)開始向縱深發(fā)展(更好的性能、生產(chǎn)級別的穩(wěn)定性等)。

5、平臺(tái)技術(shù)演進(jìn)出兩個(gè)趨勢,數(shù)據(jù)湖 VS 數(shù)據(jù)倉庫- 兩者均關(guān)注數(shù)據(jù)存儲(chǔ)和管理(平臺(tái)技術(shù)),但方向不同。


圖1. 阿里巴巴雙十一單日處理數(shù)據(jù)量增長

1.2 從大數(shù)據(jù)技術(shù)發(fā)展看湖和倉

首先,數(shù)據(jù)倉庫的概念出現(xiàn)的要比數(shù)據(jù)湖早的多,可以追溯到數(shù)據(jù)庫為王的上世紀(jì) 90 年代。因此,我們有必要從歷史的脈絡(luò)來梳理這些名詞出現(xiàn)的大概時(shí)間、來由以及更重要的背后原因。大體上,計(jì)算機(jī)科學(xué)領(lǐng)域的數(shù)據(jù)處理技術(shù)的發(fā)展,主要分為四個(gè)階段:

1、階段一:數(shù)據(jù)庫時(shí)代。數(shù)據(jù)庫最早誕生于 20 世紀(jì)的 60 年代,今天人們所熟知的關(guān)系型數(shù)據(jù)庫則出現(xiàn)在 20 世紀(jì) 70 年代,并在后續(xù)的 30 年左右時(shí)間里大放異彩,誕生了很多優(yōu)秀的關(guān)系型數(shù)據(jù)庫,如 Oracle、SQL Server、MySQL、PostgresSQL 等,成為當(dāng)時(shí)主流計(jì)算機(jī)系統(tǒng)不可或缺的組成部分。到 20 世紀(jì) 90 年代,數(shù)據(jù)倉庫的概念誕生。此時(shí)的數(shù)據(jù)倉庫概念更多表達(dá)的是如何管理企業(yè)中多個(gè)數(shù)據(jù)庫實(shí)例的方法論,但受限于單機(jī)數(shù)據(jù)庫的處理能力以及多機(jī)數(shù)據(jù)庫(分庫分表)長期以來的高昂價(jià)格,此時(shí)的數(shù)據(jù)倉庫距離普通企業(yè)和用戶都還很遙遠(yuǎn)。人們甚至還在爭論數(shù)據(jù)倉庫(統(tǒng)一集中管理)和數(shù)據(jù)集市(按部門、領(lǐng)域的集中管理)哪個(gè)更具可行性。

2、階段二:大數(shù)據(jù)技術(shù)的「探索期」。時(shí)間進(jìn)入到 2000 年附近,隨著互聯(lián)網(wǎng)的爆發(fā),動(dòng)輒幾十億、上百億的頁面以及海量的用戶點(diǎn)擊行為,開啟了全球的數(shù)據(jù)量急劇增加的新時(shí)代。傳統(tǒng)的數(shù)據(jù)庫方案再也無力以可接受的成本提供計(jì)算力,巨大的數(shù)據(jù)處理需求開始尋找突破口,大數(shù)據(jù)時(shí)代開始萌芽。2003、2004、2006 年 Google 先后 3 篇經(jīng)典論文(GFS、MapReduce、BigTable)奠基了這個(gè)大數(shù)據(jù)時(shí)代的基本技術(shù)框架,即分布式存儲(chǔ)、分布式調(diào)度以及分布式計(jì)算模型。隨后,幾乎是在同一時(shí)期,誕生了包括 Google,微軟 Cosmos 以及開源 Hadoop 為代表的優(yōu)秀分布式技術(shù)體系,當(dāng)然,這其中也包括阿里巴巴的飛天系統(tǒng)。此時(shí)人們興奮于追求數(shù)據(jù)的處理規(guī)模,即『大』數(shù)據(jù),沒有閑暇爭論是數(shù)據(jù)倉庫還是數(shù)據(jù)湖。

3、階段三:大數(shù)據(jù)技術(shù)的「發(fā)展期」。來到 21 世紀(jì)的第二個(gè) 10 年,隨著越來越多的資源投入到大數(shù)據(jù)計(jì)算領(lǐng)域,大數(shù)據(jù)技術(shù)進(jìn)入一個(gè)蓬勃發(fā)展的階段,整體開始從能用轉(zhuǎn)向好用。代替昂貴的手寫 MapReduce 作業(yè)的,則是如雨后春筍般出現(xiàn)的各種以 SQL 為表達(dá)的計(jì)算引擎。這些計(jì)算引擎針對不同的場景進(jìn)行針對性優(yōu)化,但都采用門檻極低的 SQL 語言,極大降低了大數(shù)據(jù)技術(shù)的使用成本,數(shù)據(jù)庫時(shí)代人們夢想的大一統(tǒng)的數(shù)據(jù)倉庫終于成為現(xiàn)實(shí),各種數(shù)據(jù)庫時(shí)代的方法論開始抬頭。這個(gè)時(shí)期技術(shù)路線開始出現(xiàn)細(xì)分。云廠商主推的如 AWS Redshift、Google BigQuery、Snowflake,包括 MaxCompute 這樣的集成系統(tǒng)稱為大數(shù)據(jù)時(shí)代的數(shù)據(jù)倉庫。而以開源 Hadoop 體系為代表的的開放式 HDFS 存儲(chǔ)、開放的文件格式、開放的元數(shù)據(jù)服務(wù)以及多種引擎(Hive、Presto、Spark、Flink 等)協(xié)同工作的模式,則形成了數(shù)據(jù)湖的雛形。

4、階段四:大數(shù)據(jù)技術(shù)「普及期」。當(dāng)前,大數(shù)據(jù)技術(shù)早已不是什么火箭科技,而已經(jīng)滲透到各行各業(yè),大數(shù)據(jù)的普及期已經(jīng)到來。市場對大數(shù)據(jù)產(chǎn)品的要求,除了規(guī)模、性能、簡單易用,提出了成本、安全、穩(wěn)定性等更加全面的企業(yè)級生產(chǎn)的要求。

· 開源 Hadoop 線,引擎、元數(shù)據(jù)、存儲(chǔ)等基礎(chǔ)部件的迭代更替進(jìn)入相對穩(wěn)態(tài),大眾對開源大數(shù)據(jù)技術(shù)的認(rèn)知達(dá)到空前的水平。一方面,開放架構(gòu)的便利帶來了不錯(cuò)的市場份額,另一方面開放架構(gòu)的松散則使開源方案在企業(yè)級能力構(gòu)建上遇到瓶頸,尤其是數(shù)據(jù)安全、身份權(quán)限強(qiáng)管控、數(shù)據(jù)治理等方面,協(xié)同效率較差(如 Ranger 作為權(quán)限管控組件、Atlas 作為數(shù)據(jù)治理組件,跟今天的主流引擎竟然還無法做到全覆蓋)。同時(shí)引擎自身的發(fā)展也對已有的開放架構(gòu)提出了更多挑戰(zhàn),Delta Lake、Hudi 這樣自閉環(huán)設(shè)計(jì)的出現(xiàn)使得一套存儲(chǔ)、一套元數(shù)據(jù)、多種引擎協(xié)作的基礎(chǔ)出現(xiàn)了某種程度的裂痕。

· 真正將數(shù)據(jù)湖概念推而廣之的是AWS。AWS 構(gòu)筑了一套以 S3 為中心化存儲(chǔ)、Glue 為元數(shù)據(jù)服務(wù),E-MapReduce、Athena 為引擎的開放協(xié)作式的產(chǎn)品解決方案。它的開放性和和開源體系類似,并在2019年推出Lake Formation 解決產(chǎn)品間的安全授信問題。雖然這套架構(gòu)在企業(yè)級能力上和相對成熟的云數(shù)據(jù)倉庫產(chǎn)品相去甚遠(yuǎn),但對于開源技術(shù)體系的用戶來說,架構(gòu)相近理解容易,還是很有吸引力。AWS 之后,各個(gè)云廠商也紛紛跟進(jìn)數(shù)據(jù)湖的概念,并在自己的云服務(wù)上提供類似的產(chǎn)品解決方案。

· 云廠商主推的數(shù)據(jù)倉庫類產(chǎn)品則發(fā)展良好,數(shù)倉核心能力方面持續(xù)增強(qiáng)。性能、成本方面極大提升(MaxCompute 完成了核心引擎的全面升級和性能跳躍式發(fā)展,連續(xù)三年刷新 TPCx-BigBench 世界記錄),數(shù)據(jù)管理能力空前增強(qiáng)(數(shù)據(jù)中臺(tái)建模理論、智能數(shù)倉),企業(yè)級安全能力大為繁榮(同時(shí)支持基于 ACL 和基于規(guī)則等多種授權(quán)模型,列級別細(xì)粒度授權(quán),可信計(jì)算,存儲(chǔ)加密,數(shù)據(jù)脫敏等),在聯(lián)邦計(jì)算方面也普遍做了增強(qiáng),一定程度上開始將非數(shù)倉自身存儲(chǔ)的數(shù)據(jù)納入管理,和數(shù)據(jù)湖的邊界日益模糊。

綜上所述,數(shù)據(jù)倉庫是個(gè)誕生于數(shù)據(jù)庫時(shí)代的概念,在大數(shù)據(jù)時(shí)代隨云廠商的各種數(shù)倉服務(wù)落地開花,目前通常指代云廠商提供的基于大數(shù)據(jù)技術(shù)的一體化服務(wù)。而數(shù)據(jù)湖則脫胎于大數(shù)據(jù)時(shí)代開源技術(shù)體系的開放設(shè)計(jì),經(jīng)過 AWS 整合宣傳,通常是由一系列云產(chǎn)品或開源組件共同構(gòu)成大數(shù)據(jù)解決方案。


圖2. 20年大數(shù)據(jù)發(fā)展之路
?

什么是數(shù)據(jù)湖

近幾年數(shù)據(jù)湖的概念非常火熱,但是數(shù)據(jù)湖的定義并不統(tǒng)一,我們先看下數(shù)據(jù)湖的相關(guān)定義。

Wikipedia對數(shù)據(jù)湖的定義:

A data lake is a system or repository of datastored in its natural/raw format,usually object blobsor files. A data lake is usually a single store of all enterprise data including raw copies of source system data and transformed data used for tasks such as reporting, visualization, advanced analyticsand machine learning. A data lake can include structured datafrom relational databases(rows and columns), semi-structured data (CSV, logs, XML, JSON), unstructured data(emails, documents, PDFs) and binary data(images, audio, video). A data lake can be established "on premises" (within an organization's data centers) or "in the cloud" (using cloud services from vendors such as Amazon, Google and Microsoft).A data swamp is a deteriorated and unmanaged data lake that is either inaccessible to its intended users or is providing little value.

數(shù)據(jù)湖是指使用大型二進(jìn)制對象或文件這樣的自然格式儲(chǔ)存數(shù)據(jù)的系統(tǒng)。它通常把所有的企業(yè)數(shù)據(jù)統(tǒng)一存儲(chǔ),既包括源系統(tǒng)中的原始副本,也包括轉(zhuǎn)換后的數(shù)據(jù),比如那些用于報(bào)表, 可視化, 數(shù)據(jù)分析和機(jī)器學(xué)習(xí)的數(shù)據(jù)。數(shù)據(jù)湖可以包括關(guān)系數(shù)據(jù)庫的結(jié)構(gòu)化數(shù)據(jù)(行與列)、半結(jié)構(gòu)化的數(shù)據(jù)(CSV,日志,XML, JSON),非結(jié)構(gòu)化數(shù)據(jù) (電子郵件、文件、PDF)和 二進(jìn)制數(shù)據(jù)(圖像、音頻、視頻)。儲(chǔ)存數(shù)據(jù)湖的方式包括 Apache Hadoop分布式文件系統(tǒng), Azure 數(shù)據(jù)湖或亞馬遜云 Lake Formation云存儲(chǔ)服務(wù),以及諸如 Alluxio 虛擬數(shù)據(jù)湖之類的解決方案。數(shù)據(jù)沼澤是一個(gè)劣化的數(shù)據(jù)湖,用戶無法訪問,或是沒什么價(jià)值。

AWS的定義相對簡潔:

A data lake is a centralized repository that allows you to store all your structured and unstructured data at any scale. You can store your data as-is, without having to first structure the data, and run different types of analytics—from dashboards and visualizations to big data processing, real-time analytics, and machine learning to guide better decisions.

數(shù)據(jù)湖是一個(gè)集中式存儲(chǔ)庫,允許您以任意規(guī)模存儲(chǔ)所有結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。您可以按原樣存儲(chǔ)數(shù)據(jù)(無需先對數(shù)據(jù)進(jìn)行結(jié)構(gòu)化處理),并運(yùn)行不同類型的分析 – 從控制面板和可視化到大數(shù)據(jù)處理、實(shí)時(shí)分析和機(jī)器學(xué)習(xí),以指導(dǎo)做出更好的決策。

Azure等其他云廠商也有各自的定義,本文不再贅述。

但無論數(shù)據(jù)湖的定義如何不同,數(shù)據(jù)湖的本質(zhì)其實(shí)都包含如下四部分:

1、統(tǒng)一的存儲(chǔ)系統(tǒng)

2、存儲(chǔ)原始數(shù)據(jù)

3、豐富的計(jì)算模型/范式

4、數(shù)據(jù)湖與上云無關(guān)

從上述四個(gè)標(biāo)準(zhǔn)判斷,開源大數(shù)據(jù)的Hadoop HDFS存儲(chǔ)系統(tǒng)就是一個(gè)標(biāo)準(zhǔn)的數(shù)據(jù)湖架構(gòu),具備統(tǒng)一的原始數(shù)據(jù)存儲(chǔ)架構(gòu)。而近期被廣泛談到的數(shù)據(jù)湖,其實(shí)是一個(gè)狹義的概念,特指“基于云上托管存儲(chǔ)系統(tǒng)的數(shù)據(jù)湖系統(tǒng),架構(gòu)上采用存儲(chǔ)計(jì)算分離的體系”。例如基于AWS S3系統(tǒng)或者阿里云OSS系統(tǒng)構(gòu)建的數(shù)據(jù)湖。

下圖是數(shù)據(jù)湖技術(shù)架構(gòu)的演進(jìn)過程,整體上可分為三個(gè)階段:


圖3. 數(shù)據(jù)湖技術(shù)架構(gòu)演進(jìn)

1、階段一:自建開源Hadoop數(shù)據(jù)湖架構(gòu),原始數(shù)據(jù)統(tǒng)一存放在HDFS系統(tǒng)上,引擎以Hadoop和Spark開源生態(tài)為主,存儲(chǔ)和計(jì)算一體。缺點(diǎn)是需要企業(yè)自己運(yùn)維和管理整套集群,成本高且集群穩(wěn)定性差。

2、階段二:云上托管Hadoop數(shù)據(jù)湖架構(gòu)(即EMR開源數(shù)據(jù)湖),底層物理服務(wù)器和開源軟件版本由云廠商提供和管理,數(shù)據(jù)仍統(tǒng)一存放在HDFS系統(tǒng)上,引擎以Hadoop和Spark開源生態(tài)為主。這個(gè)架構(gòu)通過云上 IaaS 層提升了機(jī)器層面的彈性和穩(wěn)定性,使企業(yè)的整體運(yùn)維成本有所下降,但企業(yè)仍然需要對HDFS系統(tǒng)以及服務(wù)運(yùn)行狀態(tài)進(jìn)行管理和治理,即應(yīng)用層的運(yùn)維工作。同時(shí)因?yàn)榇鎯?chǔ)和計(jì)算耦合在一起,穩(wěn)定性不是最優(yōu),兩種資源無法獨(dú)立擴(kuò)展,使用成本也不是最優(yōu)。

3、階段三:云上數(shù)據(jù)湖架構(gòu),即云上純托管的存儲(chǔ)系統(tǒng)逐步取代HDFS,成為數(shù)據(jù)湖的存儲(chǔ)基礎(chǔ)設(shè)施,并且引擎豐富度也不斷擴(kuò)展。除了Hadoop和Spark的生態(tài)引擎之外,各云廠商還發(fā)展出面向數(shù)據(jù)湖的引擎產(chǎn)品。如分析類的數(shù)據(jù)湖引擎有AWS Athena和華為DLI,AI類的有AWS Sagemaker。這個(gè)架構(gòu)仍然保持了一個(gè)存儲(chǔ)和多個(gè)引擎的特性,所以統(tǒng)一元數(shù)據(jù)服務(wù)至關(guān)重要,如AWS推出了Glue,阿里云EMR近期也即將發(fā)布數(shù)據(jù)湖統(tǒng)一元數(shù)據(jù)服務(wù)。該架構(gòu)相對于原生HDFS的數(shù)據(jù)湖架構(gòu)的優(yōu)勢在于:

· 幫助用戶擺脫原生HDFS系統(tǒng)運(yùn)維困難的問題。HDFS系統(tǒng)運(yùn)維有兩個(gè)困難:1)存儲(chǔ)系統(tǒng)相比計(jì)算引擎更高的穩(wěn)定性要求和更高的運(yùn)維風(fēng)險(xiǎn) 2)與計(jì)算混布在一起,帶來的擴(kuò)展彈性問題。存儲(chǔ)計(jì)算分離架構(gòu)幫助用戶解耦存儲(chǔ),并交由云廠商統(tǒng)一運(yùn)維管理,解決了穩(wěn)定性和運(yùn)維問題。

· 分離后的存儲(chǔ)系統(tǒng)可以獨(dú)立擴(kuò)展,不再需要與計(jì)算耦合,可降低整體成本

· 當(dāng)用戶采用數(shù)據(jù)湖架構(gòu)之后,客觀上也幫助客戶完成了存儲(chǔ)統(tǒng)一化(解決多個(gè)HDFS數(shù)據(jù)孤島的問題)

下圖是阿里云EMR數(shù)據(jù)湖架構(gòu)圖,它是基于開源生態(tài)的大數(shù)據(jù)平臺(tái),既支持HDFS的開源數(shù)據(jù)湖,也支持OSS的云上數(shù)據(jù)湖。

圖4. 阿里云EMR數(shù)據(jù)湖架構(gòu)

企業(yè)使用數(shù)據(jù)湖技術(shù)構(gòu)建大數(shù)據(jù)平臺(tái),主要包括數(shù)據(jù)接入、數(shù)據(jù)存儲(chǔ)、計(jì)算和分析、數(shù)據(jù)管理、權(quán)限控制等,下圖是Gartner定義的一個(gè)參考架構(gòu)。當(dāng)前數(shù)據(jù)湖的技術(shù)因其架構(gòu)的靈活性和開放性,在性能效率、安全控制以及數(shù)據(jù)治理上并不十分成熟,在面向企業(yè)級生產(chǎn)要求時(shí)還存在很大挑戰(zhàn)(在第四章會(huì)有詳細(xì)的闡述)。

圖5. 數(shù)據(jù)湖架構(gòu)圖(來自網(wǎng)絡(luò))

數(shù)據(jù)倉庫的誕生,以及和數(shù)據(jù)中臺(tái)的關(guān)系

數(shù)據(jù)倉庫的概念最早來源于數(shù)據(jù)庫領(lǐng)域,主要處理面向數(shù)據(jù)的復(fù)雜查詢和分析場景。隨大數(shù)據(jù)技術(shù)發(fā)展,大量借鑒數(shù)據(jù)庫的技術(shù),例如SQL語言、查詢優(yōu)化器等,形成了大數(shù)據(jù)的數(shù)據(jù)倉庫,因其強(qiáng)大的分析能力,成為主流。近幾年,數(shù)據(jù)倉庫和云原生技術(shù)相結(jié)合,又演生出了云數(shù)據(jù)倉庫,解決了企業(yè)部署數(shù)據(jù)倉庫的資源供給問題。云數(shù)據(jù)倉庫作為大數(shù)據(jù)的高階(企業(yè)級)平臺(tái)能力,因其開箱即用、無限擴(kuò)展、簡易運(yùn)維等能力,越來越受到人們的矚目。

Wikipedia對數(shù)據(jù)倉庫的定義:

In computing, a data warehouse (DW or DWH), also known as an enterprise data warehouse (EDW), is a system used for reportingand data analysis, and is considered a core component of business intelligence.DWs are central repositories of integrated data from one or more disparate sources. Extract, transform, load(ETL) and extract, load, transform(E-LT) are the two main approaches used to build a data warehouse system.

在計(jì)算機(jī)領(lǐng)域,數(shù)據(jù)倉庫(英語:data warehouse,也稱為企業(yè)數(shù)據(jù)倉庫)是用于報(bào)告和數(shù)據(jù)分析的系統(tǒng),被認(rèn)為是商業(yè)智能的核心組件。數(shù)據(jù)倉庫是來自一個(gè)或多個(gè)不同源的集成數(shù)據(jù)的中央存儲(chǔ)庫。數(shù)據(jù)倉庫將當(dāng)前和歷史數(shù)據(jù)存儲(chǔ)在一起,用于為整個(gè)企業(yè)的員工創(chuàng)建分析報(bào)告。比較學(xué)術(shù)的解釋是,數(shù)據(jù)倉庫由數(shù)據(jù)倉庫之父W.H.Inmon于1990年提出,主要功能乃是將組織透過信息系統(tǒng)之在線交易處理(OLTP)經(jīng)年累月所累積的大量數(shù)據(jù),透過數(shù)據(jù)倉庫理論所特有的數(shù)據(jù)存儲(chǔ)架構(gòu),作一有系統(tǒng)的分析整理,以利各種分析方法如在線分析處理(OLAP)、數(shù)據(jù)挖掘(Data Mining)之進(jìn)行,并進(jìn)而支持如決策支持系統(tǒng)(DSS)、主管信息系統(tǒng)(EIS)之創(chuàng)建,幫助決策者能快速有效的自大量數(shù)據(jù)中,分析出有價(jià)值的信息,以利決策擬定及快速回應(yīng)外在環(huán)境變動(dòng),幫助建構(gòu)商業(yè)智能(BI)。

數(shù)據(jù)倉庫的本質(zhì)包含如下三部分:

1、內(nèi)置的存儲(chǔ)系統(tǒng),數(shù)據(jù)通過抽象的方式提供(例如采用Table或者View),不暴露文件系統(tǒng)。

2、數(shù)據(jù)需要清洗和轉(zhuǎn)化,通常采用ETL/ELT方式

3、強(qiáng)調(diào)建模和數(shù)據(jù)管理,供商業(yè)智能決策

從上述的標(biāo)準(zhǔn)判斷,無論傳統(tǒng)數(shù)據(jù)倉庫(如Teradata)還是新興的云數(shù)據(jù)倉庫系統(tǒng)(AWS Redshift、Google BigQuery、阿里云MaxCompute)均體現(xiàn)了數(shù)倉的設(shè)計(jì)本質(zhì),它們均沒有對外暴露文件系統(tǒng),而是提供了數(shù)據(jù)進(jìn)出的服務(wù)接口。比如,Teradata提供了CLI數(shù)據(jù)導(dǎo)入工具,Redshift提供Copy命令從S3或者EMR上導(dǎo)入數(shù)據(jù),BigQuery提供Data Transfer服務(wù),MaxCompute提供Tunnel服務(wù)以及MMA搬站工具供數(shù)據(jù)上傳和下載。這個(gè)設(shè)計(jì)可以帶來多個(gè)優(yōu)勢:

1、引擎深度理解數(shù)據(jù),存儲(chǔ)和計(jì)算可做深度優(yōu)化

2、 數(shù)據(jù)全生命周期管理,完善的血緣體系

3、細(xì)粒度的數(shù)據(jù)管理和治理

4、完善的元數(shù)據(jù)管理能力,易于構(gòu)建企業(yè)級數(shù)據(jù)中臺(tái)

正因?yàn)槿绱?#xff0c;阿里巴巴飛天大數(shù)據(jù)平臺(tái)建設(shè)之初,在選型的時(shí)候就采用了數(shù)據(jù)倉庫的架構(gòu),即MaxCompute大數(shù)據(jù)平臺(tái)。MaxCompute(原ODPS),既是阿里巴巴經(jīng)濟(jì)體的大數(shù)據(jù)平臺(tái),又是阿里云上的一種安全可靠、高效能、低成本、從GB到EB級別按需彈性伸縮的在線大數(shù)據(jù)計(jì)算服務(wù)(圖6.是MaxCompute產(chǎn)品架構(gòu),具體詳情請點(diǎn)擊阿里云MaxCompute官網(wǎng)地址)。作為SaaS模式的企業(yè)級云數(shù)倉,MaxCompute廣泛應(yīng)用在阿里巴巴經(jīng)濟(jì)體、以及阿里云上互聯(lián)網(wǎng)、新金融、新零售、數(shù)字政府等數(shù)千家客戶。

圖6. MaxCompute云數(shù)倉產(chǎn)品架構(gòu)

得益于MaxCompute數(shù)據(jù)倉庫的架構(gòu),阿里巴巴上層逐步構(gòu)建了“數(shù)據(jù)安全體系”、“數(shù)據(jù)質(zhì)量”、“數(shù)據(jù)治理”、“數(shù)據(jù)標(biāo)簽”等管理能力,并最終形成了阿里巴巴的大數(shù)據(jù)中臺(tái)。可以說,作為最早數(shù)據(jù)中臺(tái)概念的提出者,阿里巴巴的數(shù)據(jù)中臺(tái)得益于數(shù)據(jù)倉庫的架構(gòu)。

圖7. 阿里巴巴數(shù)據(jù)中臺(tái)架構(gòu)
?

數(shù)據(jù)湖 VS 數(shù)據(jù)倉庫

綜上,數(shù)據(jù)倉庫和數(shù)據(jù)湖,是大數(shù)據(jù)架構(gòu)的兩種設(shè)計(jì)取向。兩者在設(shè)計(jì)的根本分歧點(diǎn)是對包括存儲(chǔ)系統(tǒng)訪問、權(quán)限管理、建模要求等方面的把控。

數(shù)據(jù)湖優(yōu)先的設(shè)計(jì),通過開放底層文件存儲(chǔ),給數(shù)據(jù)入湖帶來了最大的靈活性。進(jìn)入數(shù)據(jù)湖的數(shù)據(jù)可以是結(jié)構(gòu)化的,也可以是半結(jié)構(gòu)化的,甚至可以是完全非結(jié)構(gòu)化的原始日志。另外,開放存儲(chǔ)給上層的引擎也帶來了更多的靈活度,各種引擎可以根據(jù)自己針對的場景隨意讀寫數(shù)據(jù)湖中存儲(chǔ)的數(shù)據(jù),而只需要遵循相當(dāng)寬松的兼容性約定(這樣的松散約定當(dāng)然會(huì)有隱患,后文會(huì)提到)。但同時(shí),文件系統(tǒng)直接訪問使得很多更高階的功能很難實(shí)現(xiàn),例如,細(xì)粒度(小于文件粒度)的權(quán)限管理、統(tǒng)一化的文件管理和讀寫接口升級也十分困難(需要完成每一個(gè)訪問文件的引擎升級,才算升級完畢)。

而數(shù)據(jù)倉庫優(yōu)先的設(shè)計(jì),更加關(guān)注的是數(shù)據(jù)使用效率、大規(guī)模下的數(shù)據(jù)管理、安全/合規(guī)這樣的企業(yè)級成長性需求。數(shù)據(jù)經(jīng)過統(tǒng)一但開放的服務(wù)接口進(jìn)入數(shù)據(jù)倉庫,數(shù)據(jù)通常預(yù)先定義 schema,用戶通過數(shù)據(jù)服務(wù)接口或者計(jì)算引擎訪問分布式存儲(chǔ)系統(tǒng)中的文件。數(shù)據(jù)倉庫優(yōu)先的設(shè)計(jì)通過抽象數(shù)據(jù)訪問接口/權(quán)限管理/數(shù)據(jù)本身,來換取更高的性能(無論是存儲(chǔ)還是計(jì)算)、閉環(huán)的安全體系、數(shù)據(jù)治理的能力等,這些能力對于企業(yè)長遠(yuǎn)的大數(shù)據(jù)使用都至關(guān)重要,我們稱之為成長性。

下圖是針對大數(shù)據(jù)技術(shù)棧,分別比較數(shù)據(jù)湖和數(shù)據(jù)倉庫各自的取舍。

圖8. 數(shù)據(jù)湖和數(shù)據(jù)倉庫在技術(shù)棧上的對比

靈活性和成長性,對于處于不同時(shí)期的企業(yè)來說,重要性不同。

1、當(dāng)企業(yè)處于初創(chuàng)階段,數(shù)據(jù)從產(chǎn)生到消費(fèi)還需要一個(gè)創(chuàng)新探索的階段才能逐漸沉淀下來,那么用于支撐這類業(yè)務(wù)的大數(shù)據(jù)系統(tǒng),靈活性就更加重要,數(shù)據(jù)湖的架構(gòu)更適用。

2、當(dāng)企業(yè)逐漸成熟起來,已經(jīng)沉淀為一系列數(shù)據(jù)處理流程,問題開始轉(zhuǎn)化為數(shù)據(jù)規(guī)模不斷增長,處理數(shù)據(jù)的成本不斷增加,參與數(shù)據(jù)流程的人員、部門不斷增多,那么用于支撐這類業(yè)務(wù)的大數(shù)據(jù)系統(tǒng),成長性的好壞就決定了業(yè)務(wù)能夠發(fā)展多遠(yuǎn)。數(shù)據(jù)倉庫的架構(gòu)更適用。

本文有觀察到,相當(dāng)一部分企業(yè)(尤其是新興的互聯(lián)網(wǎng)行業(yè))從零開始架構(gòu)的大數(shù)據(jù)技術(shù)棧,正是伴隨開源 Hadoop 體系的流行,經(jīng)歷了這樣一個(gè)從探索創(chuàng)新到成熟建模的過程。在這個(gè)過程中,因?yàn)閿?shù)據(jù)湖架構(gòu)太過靈活而缺少對數(shù)據(jù)監(jiān)管、控制和必要的治理手段,導(dǎo)致運(yùn)維成本不斷增加、數(shù)據(jù)治理效率降低,企業(yè)落入了『數(shù)據(jù)沼澤』的境地,即數(shù)據(jù)湖中匯聚了太多的數(shù)據(jù),反而很難高效率的提煉真正有價(jià)值的那部分。最后只有遷移到數(shù)據(jù)倉庫優(yōu)先設(shè)計(jì)的大數(shù)據(jù)平臺(tái),才解決了業(yè)務(wù)成長到一定規(guī)模后所出現(xiàn)的運(yùn)維、成本、數(shù)據(jù)治理等問題。還是舉阿里巴巴的例子,阿里巴巴成功的數(shù)據(jù)中臺(tái)戰(zhàn)略,正是在 2015 年前后阿里巴巴全集團(tuán)完成 MaxCompute(數(shù)據(jù)倉庫) 對多個(gè) Hadoop( 數(shù)據(jù)湖)的完全替換(登月項(xiàng)目)才逐步形成的。

圖9. 數(shù)據(jù)湖的靈活性 VS 數(shù)據(jù)倉庫的成長性的示意圖
?

下一代演進(jìn)方向:湖倉一體

經(jīng)過對數(shù)據(jù)湖和數(shù)據(jù)倉庫的深入闡述和比較,本文認(rèn)為數(shù)據(jù)湖和數(shù)據(jù)倉庫作為大數(shù)據(jù)系統(tǒng)的兩條不同演進(jìn)路線,有各自特有的優(yōu)勢和局限性。數(shù)據(jù)湖和數(shù)據(jù)倉庫一個(gè)面向初創(chuàng)用戶友好,一個(gè)成長性更佳。對企業(yè)來說,數(shù)據(jù)湖和數(shù)據(jù)倉庫是否必須是一個(gè)二選一的選擇題?是否能有一種方案同時(shí)兼顧數(shù)據(jù)湖的靈活性和云數(shù)據(jù)倉庫的成長性,將二者有效結(jié)合起來為用戶實(shí)現(xiàn)更低的總體擁有成本?

將數(shù)倉和數(shù)據(jù)湖融合在一起也是業(yè)界近年的趨勢,多個(gè)產(chǎn)品和項(xiàng)目都做過對應(yīng)的嘗試:

1、數(shù)倉支持?jǐn)?shù)據(jù)湖訪問

· 2017年Redshift推出Redshift Spectrum,支持Redsift數(shù)倉用戶訪問S3數(shù)據(jù)湖的數(shù)據(jù)。

· 2018年阿里云MaxCompute推出外表能力,支持訪問包括OSS/OTS/RDS數(shù)據(jù)庫在內(nèi)的多種外部存儲(chǔ)。

但是無論是 Redshift Spectrum 還是 MaxCompute 的外部表,仍舊需要用戶在數(shù)倉中通過創(chuàng)建外部表來將數(shù)據(jù)湖的開放存儲(chǔ)路徑納入數(shù)倉的概念體系——由于一個(gè)單純的開放式存儲(chǔ)并不能自描述其數(shù)據(jù)本身的變化,因此為這些數(shù)據(jù)創(chuàng)建外部表、添加分區(qū)(本質(zhì)上是為數(shù)據(jù)湖中的數(shù)據(jù)建立 schema)無法完全自動(dòng)化(需要人工或者定期觸發(fā) Alter table add partition 或 msck)。這對于低頻臨時(shí)查詢尚能接受,對于生產(chǎn)使用來說,未免有些復(fù)雜。

2、數(shù)據(jù)湖支持?jǐn)?shù)倉能力

· 2011年,Hadoop開源體系公司Hortonworks開始了Apache Atlas和Ranger兩個(gè)開源項(xiàng)目的開發(fā),分別對應(yīng)數(shù)據(jù)血緣追蹤和數(shù)據(jù)權(quán)限安全兩個(gè)數(shù)倉核心能力。但兩個(gè)項(xiàng)目發(fā)展并不算順利,直到 2017 年才完成孵化,時(shí)至今日,在社區(qū)和工業(yè)界的部署都還遠(yuǎn)遠(yuǎn)不夠活躍。核心原因數(shù)據(jù)湖與生俱來的靈活性。例如Ranger作為數(shù)據(jù)權(quán)限安全統(tǒng)一管理的組件,天然要求所有引擎均適配它才能保證沒有安全漏洞,但對于數(shù)據(jù)湖中強(qiáng)調(diào)靈活的引擎,尤其是新引擎來說,會(huì)優(yōu)先實(shí)現(xiàn)功能、場景,而不是把對接Ranger作為第一優(yōu)先級的目標(biāo),使得Ranger在數(shù)據(jù)湖上的位置一直很尷尬。

· 2018年,Nexflix開源了內(nèi)部增強(qiáng)版本的元數(shù)據(jù)服務(wù)系統(tǒng)Iceberg,提供包括MVCC(多版本并發(fā)控制)在內(nèi)的增強(qiáng)數(shù)倉能力,但因?yàn)殚_源HMS已經(jīng)成為事實(shí)標(biāo)準(zhǔn),開源版本的Iceberg作為插件方式兼容并配合HMS,數(shù)倉管理能力大打折扣。

· 2018-2019年,Uber和Databricks相繼推出了Apache Hudi和DeltaLake,推出增量文件格式用以支持Update/Insert、事務(wù)等數(shù)據(jù)倉庫功能。新功能帶來文件格式以及組織形式的改變,打破了數(shù)據(jù)湖原有多套引擎之間關(guān)于共用存儲(chǔ)的簡單約定。為此,Hudi為了維持兼容性,不得不發(fā)明了諸如 Copy-On-Write、Merge-On-Read 兩種表,Snapshot Query、Incremental Query、Read Optimized Query 三種查詢類型,并給出了一個(gè)支持矩陣(如圖10),極大提升了使用的復(fù)雜度。

圖10. Hudi Support Matrix(來自網(wǎng)絡(luò))

而DeltaLake則選擇了保證以Spark為主要支持引擎的體驗(yàn),相對犧牲對其他主流引擎的兼容性。這對其他引擎訪問數(shù)據(jù)湖中的Delta數(shù)據(jù)造成了諸多的限制和使用不便。例如Presto要使用DeltaLake表,需要先用Spark創(chuàng)建manifest文件,再根據(jù)manifest創(chuàng)建外部表,同時(shí)還要注意manifest文件的更新問題;而Hive要使用DeltaLake表限制更多,不僅會(huì)造成元數(shù)據(jù)層面的混亂,甚至不能寫表。

上述在數(shù)據(jù)湖架構(gòu)上建立數(shù)倉的若干嘗試并不成功,這表明數(shù)倉和數(shù)據(jù)湖有本質(zhì)的區(qū)別,在數(shù)據(jù)湖體系上很難建成完善的數(shù)倉。數(shù)據(jù)湖與數(shù)據(jù)倉庫兩者很難直接合并成一套系統(tǒng),因此作者團(tuán)隊(duì),開始基于融合兩者的思路進(jìn)行探索。所以我們提出下一代的大數(shù)據(jù)技術(shù)演進(jìn)方向:湖倉一體,即打通數(shù)據(jù)倉庫和數(shù)據(jù)湖兩套體系,讓數(shù)據(jù)和計(jì)算在湖和倉之間自由流動(dòng),從而構(gòu)建一個(gè)完整的有機(jī)的大數(shù)據(jù)技術(shù)生態(tài)體系。

我們認(rèn)為,構(gòu)建湖倉一體需要解決三個(gè)關(guān)鍵問題:

1、湖和倉的數(shù)據(jù)/元數(shù)據(jù)無縫打通,且不需要用戶人工干預(yù)

2、湖和倉有統(tǒng)一的開發(fā)體驗(yàn),存儲(chǔ)在不同系統(tǒng)的數(shù)據(jù),可以通過一個(gè)統(tǒng)一的開發(fā)/管理平臺(tái)操作

3、數(shù)據(jù)湖與數(shù)據(jù)倉庫的數(shù)據(jù),系統(tǒng)負(fù)責(zé)自動(dòng)caching/moving,系統(tǒng)可以根據(jù)自動(dòng)的規(guī)則決定哪些數(shù)據(jù)放在數(shù)倉,哪些保留在數(shù)據(jù)湖,進(jìn)而形成一體化

我們將在下一章詳細(xì)介紹阿里云湖倉一體方案如何解決這三個(gè)問題。
?

阿里云湖倉一體方案

6.1 整體架構(gòu)

阿里云MaxCompute在原有的數(shù)據(jù)倉庫架構(gòu)上,融合了開源數(shù)據(jù)湖和云上數(shù)據(jù)湖,最終實(shí)現(xiàn)了湖倉一體化的整體架構(gòu)(圖11)。在該架構(gòu)中,盡管底層多套存儲(chǔ)系統(tǒng)并存,但通過統(tǒng)一的存儲(chǔ)訪問層和統(tǒng)一的元數(shù)據(jù)管理,向上層引擎提供一體的封裝接口,用戶可以聯(lián)合查詢數(shù)據(jù)倉庫和數(shù)據(jù)湖中的表。整體架構(gòu)還具備統(tǒng)一的數(shù)據(jù)安全、管理和治理等中臺(tái)能力。

圖11. 阿里云湖倉一體整體架構(gòu)

針對第五章提出的湖倉一體的三個(gè)關(guān)鍵問題,MaxCompute實(shí)現(xiàn)了以下4個(gè)關(guān)鍵技術(shù)點(diǎn)。

1、快速接入

· MaxCompute全新自創(chuàng)PrivateAccess網(wǎng)絡(luò)連通技術(shù),在遵循云虛擬網(wǎng)絡(luò)安全標(biāo)準(zhǔn)的前提下,實(shí)現(xiàn)多租戶模式下特定用戶作業(yè)定向與IDC/ECS/EMR Hadoop集群網(wǎng)絡(luò)整體打通能力,具有低延遲、高獨(dú)享帶寬的特點(diǎn)。

· 經(jīng)過快速簡單的開通、安全配置步驟即可將數(shù)據(jù)湖和購買的 MaxCompute數(shù)倉相連通。

2、統(tǒng)一數(shù)據(jù)/元數(shù)據(jù)管理

· MaxCompute實(shí)現(xiàn)湖倉一體化的元數(shù)據(jù)管理,通過DB元數(shù)據(jù)一鍵映射技術(shù),實(shí)現(xiàn)數(shù)據(jù)湖和MaxCompute數(shù)倉的元數(shù)據(jù)無縫打通。MaxCompute通過向用戶開放創(chuàng)建external project的形式,將數(shù)據(jù)湖HiveMetaStore中的整個(gè)database直接映射為MaxCompute的project,對Hive Database的改動(dòng)會(huì)實(shí)時(shí)反應(yīng)在這個(gè)project中,并可以在MaxCompute側(cè)隨時(shí)通過這個(gè)project進(jìn)行訪問、計(jì)算其中的數(shù)據(jù)。與此同時(shí),阿里云EMR數(shù)據(jù)湖解決方案也將推出Data Lake Formation,MaxCompute湖倉一體方案也會(huì)支持對該數(shù)據(jù)湖中的統(tǒng)一元數(shù)據(jù)服務(wù)的一鍵映射能力。MaxCompute側(cè)對external project的各種操作,也會(huì)實(shí)時(shí)反應(yīng)在Hive側(cè),真正實(shí)現(xiàn)數(shù)據(jù)倉庫和數(shù)據(jù)湖之間的無縫聯(lián)動(dòng),完全不需要類似聯(lián)邦查詢方案里的元數(shù)據(jù)人工干預(yù)步驟。

· MaxCompute實(shí)現(xiàn)湖倉一體化的存儲(chǔ)訪問層,不僅支持內(nèi)置優(yōu)化的存儲(chǔ)系統(tǒng),也無縫的支持外部存儲(chǔ)系統(tǒng)。既支持HDFS數(shù)據(jù)湖,也支持OSS云存儲(chǔ)數(shù)據(jù)湖,可讀寫各種開源文件格式。

3、統(tǒng)一開發(fā)體驗(yàn)

· 數(shù)據(jù)湖里的Hive DataBase映射為MaxCompute external project,和普通project別無二致,同樣享受MaxCompute數(shù)倉里的數(shù)據(jù)開發(fā)、追蹤和管理功能。基于DataWorks強(qiáng)大的數(shù)據(jù)開發(fā)/管理/治理能力,提供統(tǒng)一的湖倉開發(fā)體驗(yàn),降低兩套系統(tǒng)的管理成本。

· MaxCompute高度兼容Hive/Spark,支持一套任務(wù)可以在湖倉兩套體系中靈活無縫的運(yùn)行。

· 同時(shí),MaxCompute也提供高效的數(shù)據(jù)通道接口,可以讓數(shù)據(jù)湖中的Hadoop生態(tài)引擎直接訪問,提升了數(shù)倉的開放性。

4、自動(dòng)數(shù)倉

· 湖倉一體需要用戶根據(jù)自身資產(chǎn)使用情況將數(shù)據(jù)在湖和倉之間進(jìn)行合理的分層和存儲(chǔ),以最大化湖和倉的優(yōu)勢。MaxCompute開發(fā)了一套智能cache技術(shù),根據(jù)對歷史任務(wù)的分析來識別數(shù)據(jù)冷熱度,從而自動(dòng)利用閑時(shí)帶寬將數(shù)據(jù)湖中的熱數(shù)據(jù)以高效文件格式cache在數(shù)據(jù)倉庫中,進(jìn)一步加速數(shù)據(jù)倉庫的后續(xù)數(shù)據(jù)加工流程。不僅解決了湖倉之間的帶寬瓶頸問題,也達(dá)到了無須用戶參與即可實(shí)現(xiàn)數(shù)據(jù)分層管理/治理以及性能加速的目的。

6.2 構(gòu)建湖倉一體化的數(shù)據(jù)中臺(tái)

基于MaxCompute湖倉一體技術(shù),DataWorks可以進(jìn)一步對湖倉兩套系統(tǒng)進(jìn)行封裝,屏蔽湖和倉異構(gòu)集群信息,構(gòu)建一體化的大數(shù)據(jù)中臺(tái),實(shí)現(xiàn)一套數(shù)據(jù)、一套任務(wù)在湖和倉之上無縫調(diào)度和管理。企業(yè)可以使用湖倉一體化的數(shù)據(jù)中臺(tái)能力,優(yōu)化數(shù)據(jù)管理架構(gòu),充分融合數(shù)據(jù)湖和數(shù)據(jù)倉庫各自優(yōu)勢。使用數(shù)據(jù)湖做集中式的原始數(shù)據(jù)存儲(chǔ),發(fā)揮數(shù)據(jù)湖的靈活和開放優(yōu)勢。又通過湖倉一體技術(shù)將面向生產(chǎn)的高頻數(shù)據(jù)和任務(wù),無縫調(diào)度到數(shù)據(jù)倉庫中,以得到更好的性能和成本,以及后續(xù)一系列面向生產(chǎn)的數(shù)據(jù)治理和優(yōu)化,最終讓企業(yè)在成本和效率之間找到最佳平衡。

總體來說,MaxCompute湖倉一體為企業(yè)提供了一種更靈活更高效更經(jīng)濟(jì)的數(shù)據(jù)平臺(tái)解決方案,既適用于全新構(gòu)建大數(shù)據(jù)平臺(tái)的企業(yè),也適合已有大數(shù)據(jù)平臺(tái)的企業(yè)進(jìn)行架構(gòu)升級,可以保護(hù)現(xiàn)有投資和實(shí)現(xiàn)資產(chǎn)利舊。

圖12. DataWorks湖倉一體化數(shù)據(jù)中臺(tái)

6.3 典型客戶案例:新浪微博應(yīng)用「湖倉一體」構(gòu)建混合云AI計(jì)算中臺(tái)

· 案例背景

微博機(jī)器學(xué)習(xí)平臺(tái)團(tuán)隊(duì),主要做社交媒體領(lǐng)域里的推薦主要做社交媒體領(lǐng)域里的推薦/排序、文本/圖像分類、反垃圾/反作弊等技術(shù)。技術(shù)架構(gòu)上主要圍繞開源Hadoop數(shù)據(jù)湖解決方案,一份HDFS存儲(chǔ)+多種計(jì)算引擎(hive、spark、flink),以滿足以AI為主的多計(jì)算場景需求。但微博作為國內(nèi)Top的社交媒體應(yīng)用,當(dāng)前的業(yè)務(wù)體量和復(fù)雜性已然進(jìn)入到開源“無人區(qū)”,開源數(shù)據(jù)湖方案在性能和成本方面都無法滿足微博的要求。微博借助阿里巴巴強(qiáng)大的飛天大數(shù)據(jù)和AI平臺(tái)能力(MaxC+PAI+DW ),解決了超大規(guī)模下的特征工程、模型訓(xùn)練以及矩陣計(jì)算的性能瓶頸問題,進(jìn)而形成了阿里巴巴MaxCompute平臺(tái)(數(shù)倉)+ 開源平臺(tái)(數(shù)據(jù)湖)共存的格局。

· 核心痛點(diǎn)

微博希望借助這兩套異構(gòu)的大數(shù)據(jù)平臺(tái),既保持面向AI的各類數(shù)據(jù)和計(jì)算的靈活性,又解決超大規(guī)模下的計(jì)算和算法的性能/成本問題。但因?yàn)檫@兩套大數(shù)據(jù)平臺(tái)在集群層面完全是割裂的,數(shù)據(jù)和計(jì)算無法在兩個(gè)平臺(tái)里自由流動(dòng),無形之中增加了大量的數(shù)據(jù)移動(dòng)和計(jì)算開發(fā)等成本,進(jìn)而制約了業(yè)務(wù)的發(fā)展。主要的痛點(diǎn)是:1)安排專人專項(xiàng)負(fù)責(zé)訓(xùn)練數(shù)據(jù)同步,工作量巨大 2) 訓(xùn)練數(shù)據(jù)體量大,導(dǎo)致耗時(shí)多,無法滿足實(shí)時(shí)訓(xùn)練的要求 3) 新寫SQL數(shù)據(jù)處理query,無法復(fù)用Hive SQL原有query。

圖13. 新浪微博業(yè)務(wù)痛點(diǎn)示意

· 解決方案

為了解決上述的痛點(diǎn)問題,阿里云產(chǎn)品團(tuán)隊(duì)和微博機(jī)器學(xué)習(xí)平臺(tái)團(tuán)隊(duì)聯(lián)合共建湖倉一體新技術(shù),打通了阿里巴巴MaxCompute云數(shù)倉和EMR Hadoop數(shù)據(jù)湖,構(gòu)建了一個(gè)跨湖和倉的AI計(jì)算中臺(tái)。MaxCompute產(chǎn)品全面升級網(wǎng)絡(luò)基礎(chǔ)設(shè)施,打通用戶VPC私域,且依托Hive數(shù)據(jù)庫一鍵映射和強(qiáng)大完善的SQL/PAI引擎能力,將MaxCompute云數(shù)倉和EMR Hadoop數(shù)據(jù)湖技術(shù)體系無縫對接,實(shí)現(xiàn)湖和的倉統(tǒng)一且智能化管理和調(diào)度。

圖14. 微博湖倉一體架構(gòu)圖

· 案例價(jià)值

1)不僅融合了數(shù)據(jù)湖和數(shù)據(jù)倉庫的優(yōu)勢,在靈活性和效率上找到最佳平衡,還快速構(gòu)建了一套統(tǒng)一的AI計(jì)算中臺(tái),極大提升該機(jī)器學(xué)習(xí)平臺(tái)團(tuán)隊(duì)的業(yè)務(wù)支撐能力。無須進(jìn)行數(shù)據(jù)搬遷和作業(yè)遷移,即可將一套作業(yè)無縫靈活調(diào)度在MaxCompute集群和EMR集群中。

2)SQL數(shù)據(jù)處理任務(wù)被廣泛運(yùn)行到MaxCompute集群,性能有明顯提升。基于阿里巴巴PAI豐富且強(qiáng)大的算法能力,封裝出多種貼近業(yè)務(wù)場景的算法服務(wù),滿足更多的業(yè)務(wù)需求。

3)MaxCompute云原生的彈性資源和EMR集群資源形成互補(bǔ),兩套體系之間進(jìn)行資源的削峰填谷,不僅減少作業(yè)排隊(duì),且降低整體成本。
?

總結(jié)

數(shù)據(jù)湖和數(shù)據(jù)倉庫,是在今天大數(shù)據(jù)技術(shù)條件下構(gòu)建分布式系統(tǒng)的兩種數(shù)據(jù)架構(gòu)設(shè)計(jì)取向,要看平衡的方向是更偏向靈活性還是成本、性能、安全、治理等企業(yè)級特性。但是數(shù)據(jù)湖和數(shù)據(jù)倉庫的邊界正在慢慢模糊,數(shù)據(jù)湖自身的治理能力、數(shù)據(jù)倉庫延伸到外部存儲(chǔ)的能力都在加強(qiáng)。在這樣的背景之下,MaxCompute 率先提出湖倉一體,為業(yè)界和用戶展現(xiàn)了一種數(shù)據(jù)湖和數(shù)據(jù)倉湖互相補(bǔ)充,協(xié)同工作的架構(gòu)。這樣的架構(gòu)同時(shí)為用戶提供了數(shù)據(jù)湖的靈活性和數(shù)據(jù)倉庫的諸多企業(yè)級特性,將用戶使用大數(shù)據(jù)的總體擁有成本進(jìn)一步降低,我們認(rèn)為是下一代大數(shù)據(jù)平臺(tái)的演進(jìn)方向。

?

?

原文鏈接
本文為阿里云原創(chuàng)內(nèi)容,未經(jīng)允許不得轉(zhuǎn)載。

創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎(jiǎng)勵(lì)來咯,堅(jiān)持創(chuàng)作打卡瓜分現(xiàn)金大獎(jiǎng)

總結(jié)

以上是生活随笔為你收集整理的数据湖 VS 数据仓库之争?阿里提出大数据架构新概念:湖仓一体的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。

久久国产欧美日韩精品 | 成人免费在线电影 | 免费在线精品视频 | 国产美腿白丝袜足在线av | 日韩精品一区二区免费视频 | 国产男女爽爽爽免费视频 | 中文字幕在线视频精品 | 精品国产一区二区三区av性色 | 五月婷婷综合在线 | 粉嫩av一区二区三区四区五区 | 久久久久欧美精品999 | www.日本色 | 激情五月六月婷婷 | av片免费播放 | 成人久久18免费网站图片 | 毛片无卡免费无播放器 | 国产在线色站 | 一区免费视频 | 粉嫩aⅴ一区二区三区 | 激情综合网五月激情 | 日本在线视频一区二区三区 | 蜜臀av免费一区二区三区 | 中文成人字幕 | 天天操夜夜做 | 久久精品首页 | 亚洲另类人人澡 | 国产黄色成人av | 色噜噜狠狠色综合中国 | 日本中文字幕在线一区 | 国产精品嫩草影院9 | 特级毛片网站 | 久久久视频在线 | 深夜免费福利在线 | 亚洲国产精品成人va在线观看 | 国产香蕉视频在线播放 | 91入口在线观看 | 在线精品视频免费播放 | 久久久久久久久久久久久久av | 亚洲专区一二三 | 中文字幕精品视频 | 探花视频在线观看免费版 | 成年人在线电影 | 亚洲一区日韩 | 91精品国产综合久久福利 | 一区二区视频播放 | 日日夜夜精品免费 | 91欧美视频网站 | 国产精彩视频一区二区 | 91丨九色丨高潮 | 97色婷婷 | 久久免费视频在线观看6 | 久久免费99精品久久久久久 | 国产免费又爽又刺激在线观看 | 在线三级播放 | 精品你懂的 | 亚洲动漫在线观看 | 青青草国产成人99久久 | 美国三级黄色大片 | 九九亚洲视频 | 91在线中文字幕 | 免费观看91视频大全 | 婷婷丁香花 | 人人擦| 久久精品电影 | 国产精品久久久久久久久久99 | 亚洲国产欧美一区二区三区丁香婷 | 在线免费亚洲 | 国产成人精品福利 | 夜色成人av | 九九国产视频 | 免费色视频在线 | 最近高清中文在线字幕在线观看 | 成人av久久 | 欧美性受极品xxxx喷水 | 九九九在线 | 在线电影a | 99久久精品久久久久久动态片 | 在线亚洲午夜片av大片 | 91夫妻视频| 日韩久久精品一区二区三区 | 91av手机在线观看 | 国产福利一区二区在线 | 成人app在线免费观看 | 国产资源网 | 人人澡视频 | 国产伦理一区二区 | 日韩在线观看免费 | 午夜视频一区二区 | 天天射夜夜爽 | 天天操网址 | 99九九热只有国产精品 | 黄色成品视频 | 日本激情视频中文字幕 | 中国精品少妇 | 免费观看日韩 | 国产精品久久久久一区二区国产 | 国产一级淫片免费看 | 麻豆免费观看视频 | 中文字幕欧美三区 | 久久久久久综合 | 99爱在线观看 | 色www. | 国产精品久久久久久影院 | 东方av在线免费观看 | 国产人成在线观看 | 91日韩精品视频 | 四虎在线免费视频 | 黄色大全在线观看 | 一区二区视频免费在线观看 | 一区二区精品久久 | 波多野结衣最新 | 日韩欧美视频免费在线观看 | 亚洲国产中文在线观看 | 91大神在线看 | 中文av日韩 | 久久国内免费视频 | 久久草在线免费 | 香蕉影视 | 婷婷久久久 | 亚洲欧美婷婷六月色综合 | 欧美日韩不卡一区二区 | 婷婷深爱 | 在线免费观看麻豆视频 | 国产一区二区在线影院 | 色国产在线 | 91丨九色丨蝌蚪丰满 | 久久婷婷丁香 | 久久免费视频网站 | 黄色大全免费观看 | 久久久影院一区二区三区 | 91成品人影院 | 精品国产诱惑 | .精品久久久麻豆国产精品 亚洲va欧美 | 欧日韩在线视频 | 丁香婷婷基地 | 91看片一区二区三区 | 久草视频免费播放 | 在线你懂的视频 | 婷婷爱五月天 | 国内一级片在线观看 | 99久久久国产免费 | 伊人久久精品久久亚洲一区 | 精品久久久久久久久中文字幕 | 亚洲免费精品一区二区 | 中文字幕一区在线观看视频 | 亚洲视频99 | 人人爽久久久噜噜噜电影 | 91久久久国产精品 | 丁香婷婷综合激情五月色 | 亚洲精品在线资源 | 韩日av在线 | 又黄又爽又湿又无遮挡的在线视频 | 亚洲 成人 一区 | 国产系列在线观看 | 99九九99九九九视频精品 | 伊人永久在线 | 日日爱影视 | 三级av在线免费观看 | 丁香婷婷在线 | 国产精品视频免费 | 97超碰在线资源 | 亚洲91视频 | 久久电影日韩 | 日本在线中文在线 | 免费看高清毛片 | 欧美最猛性xxxx | 国产精品久免费的黄网站 | www.亚洲| 一色av | a黄色影院 | 在线观看亚洲精品 | 欧美色图东方 | 二区视频在线观看 | www.久久视频 | www.色午夜.com | 欧美一级爽 | 黄色高清视频在线观看 | www.成人精品| a级片网站| 97色婷婷人人爽人人 | 婷婷丁香激情 | 国产91在线免费视频 | 日韩免费专区 | 四虎在线观看视频 | 最近中文字幕在线播放 | 日韩av免费一区 | 久久久精品 一区二区三区 国产99视频在线观看 | 91福利试看 | 热久久视久久精品18亚洲精品 | 国内三级在线观看 | 国产精品99久久久精品免费观看 | 国产99免费 | 国产精品免费在线观看视频 | 精品美女国产在线 | 狠狠色丁香婷婷综合久小说久 | 国内精品小视频 | 伊甸园永久入口www 99热 精品在线 | 天天干天天拍天天操天天拍 | 精品一区二区免费 | 777视频在线观看 | 亚洲精品麻豆视频 | 不卡视频国产 | 国产视频久久 | 日韩精品久久一区二区 | 国产一级精品绿帽视频 | 亚洲国产成人久久综合 | 久久久av免费 | 亚洲精品一区二区三区四区高清 | av电影中文字幕在线观看 | 国内精品视频一区二区三区八戒 | 日本久久电影 | 久久精品综合网 | 91精品视频观看 | 视频一区二区三区视频 | 亚洲成人家庭影院 | 奇米影视777四色米奇影院 | 91精品国产综合久久婷婷香蕉 | www激情网 | 久久99精品国产麻豆宅宅 | 亚洲免费在线看 | 中文字幕欧美三区 | 黄色资源在线 | 精品国产一区二区三区在线观看 | 91在线小视频| 欧美资源在线观看 | 深爱激情五月婷婷 | 国产精品欧美激情在线观看 | 国产999免费视频 | 欧美一级片在线观看视频 | 在线观看视频亚洲 | 在线看成人 | 国产成年免费视频 | www中文在线 | 狠狠的干狠狠的操 | 中文字幕在线播放一区 | 免费看一及片 | 国产视频在线观看一区二区 | 日本黄色免费看 | 久久艹免费 | 日韩伦理一区二区三区av在线 | 干狠狠 | 456免费视频 | 97日日 | 精品99久久| 国产中文字幕国产 | 国产精品婷婷午夜在线观看 | 国产色在线视频 | 久久久麻豆视频 | 字幕网在线观看 | 欧美激情第八页 | 在线免费高清一区二区三区 | 欧美性大胆 | 欧美在线一 | 97香蕉久久国产在线观看 | 免费观看完整版无人区 | 五月激情丁香婷婷 | 亚洲精品男人天堂 | 日韩精品视频在线观看网址 | 午夜在线免费观看 | 国产在线精品一区二区 | 97理论片 | 日韩精品久久中文字幕 | 精品国产精品国产偷麻豆 | 日本中文字幕系列 | 国产精品成人国产乱 | 综合色天天 | 成人欧美一区二区三区在线观看 | av片子在线观看 | 国产一区二区免费看 | 欧美日韩一区二区视频在线观看 | 欧美日在线观看 | 国产精品黑丝在线观看 | 激情av在线资源 | 中文字幕日韩有码 | 黄色特级片| 免费av小说 | 久久久久久久久久久久国产精品 | 国产精品资源在线观看 | 操操操干干干 | 97色狠狠| 二区三区av | 特级毛片爽www免费版 | 亚洲成人av一区二区 | 久久久久久久久久免费视频 | 在线成人av | 国产精品视频全国免费观看 | 色网av| 欧美一级片免费在线观看 | 国产亚洲欧洲 | 色天天综合久久久久综合片 | 免费观看一级视频 | 一区二区三区四区五区在线 | 97超碰人人爱 | 免费v片| 久久成人视屏 | 四虎成人精品在永久免费 | 亚洲性xxxx | 国产免费人成xvideos视频 | 五月婷婷丁香 | 97超碰福利久久精品 | 激情综合国产 | 亚洲一区二区三区精品在线观看 | 91精品视频免费看 | 激情www | 国产色啪 | 色a4yy| 超碰人人国产 | 一区二区视频在线观看免费 | av动态图片 | 国产精品视频最多的网站 | 超碰在线94 | 亚洲天堂网站视频 | 黄色av大片 | 免费黄色在线 | 日本精品午夜 | 国产日韩中文字幕 | 久久久久久久久久亚洲精品 | 色多多视频在线观看 | 午夜视频色 | 91chinesexxx | 深爱激情亚洲 | 91视频免费视频 | 99re中文字幕 | 99久久精品免费看国产四区 | 日韩欧美视频在线观看免费 | 国产视频在线观看一区 | 激情小说网站亚洲综合网 | 91粉色视频| 五月婷婷香蕉 | 精品视频123区在线观看 | 亚a在线| 欧美日韩在线网站 | 一级特黄aaa大片在线观看 | 亚洲va欧美va国产va黑人 | 最新动作电影 | 久久福利影视 | 玖草在线观看 | 亚洲精品在线一区二区三区 | 久久久久久久久久久网 | 国产福利一区二区在线 | 天天草夜夜 | 在线a人片免费观看视频 | 91福利区一区二区三区 | 国产精品毛片久久蜜 | 中文av网 | 99久久婷婷国产综合亚洲 | 99久久99久久精品国产片果冰 | 99视屏| 99欧美| 免费国产视频 | 天天综合网 天天 | 伊人午夜| 成年人免费在线观看网站 | 国内成人精品视频 | 国产尤物在线 | 日本一区二区三区视频在线播放 | 色美女在线 | 91黄色免费网站 | 欧美 日韩 国产 成人 在线 | 成人高清在线观看 | 精品国产乱码一区二 | 久久免费观看视频 | 久久国产精品久久久久 | 日日夜夜国产 | 伊人久久影视 | 小草av在线播放 | 国产精品99久久久久的智能播放 | 国产黄色片久久 | 中文字幕在线成人 | 久草综合在线观看 | 日韩网站免费观看 | 香蕉精品在线观看 | 国产精品第 | 久草在线视频网站 | 蜜臀av性久久久久蜜臀aⅴ四虎 | 久久国产香蕉视频 | 国产在线日本 | 精品免费99久久 | 欧美在线视频一区二区三区 | 99久久激情视频 | 久久久久久久久亚洲精品 | 视频1区2区| 91精品办公室少妇高潮对白 | 日韩欧美电影 | 黄色av影视| 精品国产免费人成在线观看 | 精品国产一区二区三区日日嗨 | 中文字幕在线观看免费 | 在线日韩av | 亚洲一区视频免费观看 | a久久久久 | 久久国产热 | 黄色av一区二区 | 最新免费中文字幕 | 香蕉视频一级 | 欧美日韩高清在线观看 | 日本午夜在线观看 | 日韩视频中文字幕 | 国产91av视频在线观看 | 日韩精品一区二区免费 | 日韩精品免费一区二区三区 | 国产精品视频区 | 午夜精品婷婷 | 国产精品久久久久久久av大片 | 9999精品| 欧美 日韩精品 | 久久婷婷一区二区三区 | 亚洲精品视频在线观看网站 | 国产精品嫩草影视久久久 | 最近高清中文在线字幕在线观看 | 日韩在线电影 | 国产亚洲综合在线 | 91麻豆精品一区二区三区 | 中文字幕丝袜一区二区 | 国产精品久久伊人 | 久久免费视频这里只有精品 | av7777777| 日日色综合 | 久久黄色免费观看 | 丝袜+亚洲+另类+欧美+变态 | 久久激情视频免费观看 | va视频在线观看 | 四虎www| 丁香婷婷激情网 | 日韩aa视频 | av三级在线免费观看 | 日韩色视频在线观看 | 婷婷丁香花 | 91av短视频 | 成人国产精品免费 | 久久观看最新视频 | 免费日韩精品 | www.香蕉| 在线亚洲欧美日韩 | 97人人澡人人添人人爽超碰 | 在线免费视频 你懂得 | 91在线中文字幕 | 欧美精品免费在线 | 伊人天天操 | 国产一卡在线 | 免费在线观看日韩 | 97超碰中文| 国产一级黄 | 天天色视频 | 婷婷午夜天 | 亚洲色影爱久久精品 | 日韩在线观看电影 | 成人av电影网址 | 日韩中文在线视频 | 久久婷婷一区二区三区 | 色综合久久中文字幕综合网 | 久久免费99 | 精品久久久久久亚洲综合网 | 欧美天天综合 | 亚洲精品tv久久久久久久久久 | 免费视频91 | 久久精品国产99 | 久久国产精品99国产精 | 久草久热 | 草樱av | 五月婷婷,六月丁香 | 五月婷婷狠狠 | 成人av免费在线观看 | 99综合久久 | av三级在线免费观看 | 91成人免费电影 | 久久这里只精品 | 99精品视频免费看 | 91亚洲精品在线观看 | 久久国内免费视频 | 女女av在线 | av亚洲产国偷v产偷v自拍小说 | 综合久久2023 | 九九视频免费观看视频精品 | 日韩av一区二区三区在线观看 | 美女在线国产 | 亚洲精品在线观看网站 | 亚洲黄色激情小说 | 亚洲国产精品久久 | 久久成人久久 | 五月天综合在线 | 日韩在线观看小视频 | 久久国产一二区 | 在线成人av| 在线视频 精品 | 极品嫩模被强到高潮呻吟91 | 国产三级精品三级在线观看 | 日韩两性视频 | 午夜精品久久久 | 中文字幕 国产专区 | 激情综合亚洲 | 日韩黄在线观看 | 国产精品porn | 韩日电影在线观看 | 91干干干 | 日韩欧美视频在线 | 久久久久久久久久久久国产精品 | 国模精品在线 | 久久人人艹 | av网站在线观看播放 | 亚洲国产精品日韩 | 国产成人精品午夜在线播放 | 免费特级黄毛片 | 男女拍拍免费视频 | 日韩欧美精品一区二区三区经典 | 最近中文国产在线视频 | www在线观看视频 | 国产探花视频在线播放 | 成年人免费在线观看网站 | 亚洲国产精品传媒在线观看 | 日日综合网 | 99色在线 | 精品国产乱码久久久久久久 | 日本aaa在线观看 | 中文字幕在线观看一区二区 | www.成人久久 | 91在线免费观看网站 | 国产麻豆电影在线观看 | 00av视频| 亚洲天天摸日日摸天天欢 | 伊人影院得得 | 日韩午夜精品 | 最新免费中文字幕 | 在线观看日韩视频 | 最新av电影网站 | 五月婷影院 | 婷婷精品进入 | 黄色大片免费播放 | 日韩理论电影在线观看 | 奇米影视8888在线观看大全免费 | 免费的国产精品 | 探花视频在线观看 | 色婷婷综合久久久中文字幕 | 国产精品va在线 | 亚洲欧美日韩一区二区三区在线观看 | 精品久久久久一区二区国产 | 欧美一区二区日韩一区二区 | 在线免费国产视频 | 99久久日韩精品视频免费在线观看 | 亚洲最新精品 | 色夜视频 | 欧美另类69 | 久久字幕精品一区 | 色综合久久88色综合天天 | 日韩欧美91| 视色网站 | 欧美夫妻生活视频 | 久久久国产网站 | 久久夜色网 | 久久理论片 | 免费进去里的视频 | 国产精品视频你懂的 | a级片网站 | 国内外激情视频 | 久久免费电影 | 激情黄色一级片 | 国产精品久久久久一区二区三区共 | 日韩视频一区二区三区 | 国产视频高清 | 成av人电影 | 久久er99热精品一区二区 | 美国人与动物xxxx | 手机成人在线 | 免费av在线网站 | 国产小视频你懂的在线 | 免费黄色在线网站 | 亚洲人成影院在线 | 国产精品久久伊人 | 国产香蕉久久精品综合网 | 日本女人在线观看 | 国产一级一片免费播放放 | 国产麻豆果冻传媒在线观看 | a在线免费 | 免费男女羞羞的视频网站中文字幕 | 久久99九九99精品 | 欧美少妇影院 | 蜜臀av性久久久久蜜臀aⅴ流畅 | 国产亚洲激情视频在线 | 国产一二区视频 | 国产综合精品久久 | 国产精品久久久久久久午夜片 | 欧美另类重口 | 久久香蕉影视 | 亚洲久草网| 99久视频 | 色综合久久综合中文综合网 | 超级碰视频 | 婷婷 中文字幕 | 狠狠夜夜 | 国产欧美精品一区aⅴ影院 99视频国产精品免费观看 | 欧美综合色在线图区 | 欧美日韩首页 | 成年人在线看视频 | 日本三级吹潮在线 | 超碰精品在线 | 97精品国产一二三产区 | 国产精品人人做人人爽人人添 | 亚洲成人一二三 | 亚洲成av片人久久久 | 久久歪歪| 欧美精品久久久久久久久老牛影院 | 中文字幕丝袜美腿 | 国产精品免费视频一区二区 | 国产一级性生活 | 久久精品一区八戒影视 | 亚洲精品www. | 69xx视频 | 日韩精品一区电影 | 日韩一区在线免费观看 | 香蕉影视 | 97日日碰人人模人人澡分享吧 | 久久视频 | 亚洲干| 狠狠五月婷婷 | 久久精品超碰 | 91精品爽啪蜜夜国产在线播放 | bayu135国产精品视频 | 中日韩男男gay无套 日韩精品一区二区三区高清免费 | 国产亚洲小视频 | 韩国av免费观看 | 欧美一区二区三区在线视频观看 | 成人av片免费看 | 国产午夜精品一区二区三区 | 人人网人人爽 | 91在线小视频| 日本精品一区二区在线观看 | 91一区在线观看 | 亚洲国产精品久久久久婷婷884 | 国产区第一页 | 日日爽天天| 欧美精品免费在线 | 亚洲精品在线免费观看视频 | 欧美日韩免费一区二区三区 | 久久久久久久久久久久影院 | 97国产精品免费 | 久久在线免费观看 | 在线免费观看成人 | 亚洲免费在线 | 在线观看资源 | 黄色免费网站下载 | 婷婷 中文字幕 | 久久久免费 | 九色91av| 久久久亚洲电影 | 日韩精品亚洲专区在线观看 | 中文字幕在线看视频 | 日韩中文字幕在线观看 | 免费视频99 | 国产精品初高中精品久久 | 五月天综合网站 | 国产高清视频免费最新在线 | www色,com| 久久综合久久88 | 亚洲黄色激情小说 | 国产999在线| 精品视频在线播放 | 久久不射影院 | 日韩区视频 | 五月激情姐姐 | 日韩精品一区二区三区高清免费 | 亚洲四虎在线 | 中文一二区| 中文字幕精品一区二区精品 | 成人小视频在线观看免费 | 91精品一区二区在线观看 | 激情视频网页 | 国产视频二区三区 | 国产一区二区三区 在线 | 国产97在线播放 | 日韩最新理论电影 | 字幕网av| www黄在线| 国产精品久久久久久久久久三级 | 精品综合久久 | 亚洲精品国偷拍自产在线观看蜜桃 | 亚洲午夜精 | 亚洲狠狠婷婷综合久久久 | 午夜av不卡| 国产97色| 亚洲va欧美| 国产福利午夜 | 黄色精品在线看 | 久久久久久久网站 | 91九色蝌蚪视频网站 | 成人av播放| www.com操| 国产美女网站在线观看 | 欧美在线观看视频一区二区三区 | 国产精品扒开做爽爽的视频 | 一区二区三区免费看 | 亚欧洲精品视频在线观看 | 成人免费在线播放视频 | 日韩精品久久久免费观看夜色 | 久久综合射| 精品九九九 | 91喷水 | 一区二区欧美在线观看 | 四虎国产精 | 狠狠干成人综合网 | 中文字幕av一区二区三区四区 | 国产精品系列在线播放 | 免费在线播放视频 | 精品亚洲午夜久久久久91 | 国产成人一区二区三区免费看 | 欧美日韩高清一区二区 国产亚洲免费看 | 日日干日日色 | 在线精品亚洲一区二区 | av高清在线观看 | 四虎www | 97在线视频免费看 | 日韩精品在线看 | 在线观看的av | 久久成人在线视频 | 亚洲精品在线观 | 国产999精品久久久 免费a网站 | 免费看的黄色片 | 久草精品在线观看 | 97电影在线看视频 | 美女黄频在线观看 | 欧美日韩久久久 | 久久 一区 | 日日精品| 99精品系列 | 婷婷综合五月天 | 国产淫片免费看 | 日韩精品中文字幕在线播放 | 黄色免费网站 | 国产成人久久久77777 | 国产一区在线视频 | 狠狠狠色丁香婷婷综合久久五月 | 日韩欧美国产精品 | 欧美日韩视频免费看 | 最近最新中文字幕 | 天天舔天天射天天操 | 在线国产小视频 | 亚洲va欧洲va国产va不卡 | 国产一级视频在线 | 成人免费视频a | 久久久99国产精品免费 | 91亚洲精品国偷拍 | 国产精品欧美久久久久天天影视 | 日韩av一区二区在线影视 | 天天插天天干天天操 | 97色免费视频 | 2022国产精品视频 | 久久色在线观看 | 日韩特黄av | 亚洲视频在线免费看 | 国产成人一级 | 国产精品视频地址 | 日韩激情视频在线 | 黄色小视频在线观看免费 | 九色porny真实丨国产18 | 综合网五月天 | 97碰碰精品嫩模在线播放 | 性色av香蕉一区二区 | 五月在线视频 | 国产黄色一级大片 | 久久人人插 | 久久69精品久久久久久久电影好 | 国产精品igao视频网网址 | 亚洲天天摸日日摸天天欢 | 在线亚洲观看 | 日本在线观看中文字幕无线观看 | 激情六月婷婷久久 | 免费观看版 | 国产综合福利在线 | 亚洲视频999 | 久久久久国产精品午夜一区 | 青青久视频 | 亚洲电影影音先锋 | 国产不卡av在线播放 | 五月天婷婷综合 | 色就是色综合 | 国产不卡在线看 | 丁香六月婷婷开心 | 五月天激情婷婷 | 精品专区一区二区 | 黄色一级免费 | 天天色天天艹 | 国产成人在线免费观看 | 成人免费看电影 | 欧美极度另类性三渗透 | 91在线免费观看网站 | 久热免费在线观看 | 高潮毛片无遮挡高清免费 | 黄色a视频 | 狠狠躁18三区二区一区ai明星 | 国产精品av在线 | 国产精品高清免费在线观看 | 久久不卡电影 | 青青草国产免费 | 国模精品一区二区三区 | 一级片免费观看 | 久久久久免费 | 五月婷在线 | 日日噜噜噜噜夜夜爽亚洲精品 | 在线免费观看黄色av | 亚洲精品在线免费观看视频 | 在线观看免费一区 | 欧美在线视频一区二区三区 | 99久久99久久精品国产片果冰 | 国产91对白在线 | www免费网站在线观看 | 园产精品久久久久久久7电影 | 深爱激情婷婷网 | 久久婷婷国产 | 深爱激情五月综合 | avwww在线观看 | 日本久久综合网 | 午夜久久福利视频 | 国产综合在线观看视频 | 精品国产视频一区 | 福利电影一区二区 | 免费看wwwwwwwwwww的视频 久久久久久99精品 91中文字幕视频 | 在线看国产一区 | 日韩欧美69| 99热超碰 | 免费成人在线网站 | 一本一本久久a久久精品牛牛影视 | 日本超碰在线 | 黄污在线看 | 日日日操操 | 91传媒免费观看 | 久久精品99久久 | 国产一区二区高清 | 久久婷婷综合激情 | 久久伊人爱 | 久久久精品国产免费观看同学 | 精品国精品自拍自在线 | 日日夜夜操av | 丁香电影小说免费视频观看 | 日韩欧美精品一区二区 | 欧美日韩久久不卡 | 97香蕉超级碰碰久久免费软件 | 国产视频观看 | 亚洲黄色成人网 | 国产黄色播放 | 午夜美女福利直播 | 99热超碰| www.久草视频 | 久久国产热 | 婷婷av在线| 亚洲女在线 | 99色视频| 黄色激情网址 | 国产中文a| av免费高清观看 | 精品视频123区在线观看 | 中文字幕日韩免费视频 | 免费看国产精品 | 国产精品二区三区 | 亚洲在线高清 | 69久久99精品久久久久婷婷 | 特级毛片在线免费观看 | 久草精品视频在线播放 | 亚洲天堂网视频 | 久久精品国产一区二区 | 精品国产一区二区三区四 | 国产免费观看高清完整版 | 国产精品自产拍在线观看桃花 | 中文字幕在线字幕中文 | 色com| 97精品在线视频 | 欧美一级艳片视频免费观看 | 超碰最新网址 | 免费看一及片 | 在线观看黄色的网站 | 久久精品国产免费看久久精品 | 玖玖精品在线 | 欧美精品免费一区二区 | 美女视频黄免费的久久 | 国产精品高清在线 | 成人蜜桃视频 | 人人干在线 | 亚洲国产剧情av | 亚洲精品视频一二三 | 亚洲乱亚洲乱亚洲 | 91在线区 | 精品一区电影国产 | 久久久久久久久久电影 | 91在线免费观看网站 | 亚洲成色777777在线观看影院 | 日日摸日日添夜夜爽97 | 亚洲视频 一区 | 色五月激情五月 | 一区二区av| 不卡在线一区 | 国产亚洲免费观看 | 久久亚洲私人国产精品va | 天天摸天天干天天操天天射 | 欧美久久久久久久久 | 亚洲精品视频在线播放 | 97天天综合网 | 日日干天天插 | 一区二区三区国产精品 | 在线中文字幕播放 | 免费在线观看中文字幕 | 狠狠狠色丁香综合久久天下网 | 久青草视频在线观看 | 亚洲激情在线视频 | 国产五十路毛片 | 一区二区三区四区五区在线视频 | 日韩经典一区二区三区 | 久久免费视频99 | 免费看色视频 | 亚洲激情视频 | www.天天射.com | 97色综合| 婷婷av在线 | 国产成人一区二区啪在线观看 | 青青久草在线视频 | 久久久久久久久久久久久国产精品 | 国内久久久久 | 黄色毛片在线观看 | 日韩欧美精品在线观看 | 亚洲经典视频 | 亚洲在线视频免费观看 | 久久综合九色九九 | 国产在线观看免费 | 黄色高清视频在线观看 | 激情综合五月婷婷 | 不卡av在线 | 中文字幕a∨在线乱码免费看 | 亚洲资源在线 | 日日夜夜精品视频 | av一级免费 | 国产精品久久久久久99 | 免费在线观看国产黄 | 亚洲黄色大片 | 国产精品欧美久久久久三级 | 黄色成人免费电影 | 欧美精品一级视频 | 美女视频网站久久 | 人人澡人人爽 | 国产麻豆剧果冻传媒视频播放量 | 99热精品视 | 91毛片视频| 免费亚洲精品 | 丁香五婷 | 伊人五月婷 | 92av视频| 伊人手机在线 | 欧美大码xxxx | 五月天天av | 国产 欧美 日产久久 | 性色av一区二区三区在线观看 | 中文字幕在线观看一区 | 久久精品资源 | 成人免费大片黄在线播放 | 国产激情免费 | 精品一二三四视频 | 天天曰天天射 | 高清久久久| 精品国产区 | 国产精品成人a免费观看 | 成人a大片| 日韩av不卡在线观看 | 欧美成人精品三级在线观看播放 | 三级黄色免费片 | 一区视频在线 | 中文av字幕在线观看 | 欧美久久久一区二区三区 | 免费福利在线 | 国产精品久久二区 | 国产91精品久久久久久 | 国内精品视频在线播放 | 亚洲男人天堂2018 | 色吊丝av中文字幕 | 久久国产色 | 精品国产一区二区三区四 | 在线看国产日韩 | 性色大片在线观看 | 成人av资源在线 | 日韩精品免费一区二区三区 | 一区二区三区在线免费观看视频 | 国产中文欧美日韩在线 | 99久久超碰中文字幕伊人 | 成人一级视频在线观看 | 免费看在线看www777 | 丁香六月在线 | 亚洲天堂视频在线 | 免费观看mv大片高清 | 国产精品专区h在线观看 | 高清免费在线视频 | 很污的网站 | 欧美激情亚洲综合 | av一级久久 | 久久国产精品一二三区 | 蜜臀av性久久久久av蜜臀妖精 | 在线亚洲欧美日韩 | 国产欧美精品xxxx另类 | 视频成人免费 | 日本性视频 | 国产一区二区三区免费在线观看 | 国产永久免费观看 | 丝袜+亚洲+另类+欧美+变态 | 日狠狠|