當(dāng)前位置：首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

Neo4j【有与无】【N3】使用图进行数据建模

發(fā)布時(shí)間：2024/1/1 编程问答 27 豆豆

生活随笔收集整理的這篇文章主要介紹了 Neo4j【有与无】【N3】使用图进行数据建模小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

1.模式與目標(biāo)(Models and Goals)

2.標(biāo)記的屬性圖模型

3.查詢(xún)圖：Cypher簡(jiǎn)介

3.1.Cypher Philosophy

3.2.MATCH

3.3.RETURN

3.4.其他Cypher語(yǔ)法

4.關(guān)系和圖建模的比較

4.1.系統(tǒng)管理領(lǐng)域中的關(guān)系建模

4.2.系統(tǒng)管理域中的圖形建模

4.3.測(cè)試模型

5.跨域模型

5.1.創(chuàng)建莎士比亞圖

5.2.開(kāi)始查詢(xún)

5.3.聲明要查找的信息模式

5.4.約束匹配

5.5.處理結(jié)果

5.6.查詢(xún)鏈接

5.7.常見(jiàn)的建模陷阱

5.7.1.電子郵件出處問(wèn)題域

5.7.2.明智的第一次迭代？

5.7.3.第二次的魅力

5.7.4.不斷發(fā)展的領(lǐng)域

6.識(shí)別節(jié)點(diǎn)和關(guān)系

7.避免反模式

8.摘要

在前面的章節(jié)中，我們描述了圖數(shù)據(jù)庫(kù)與其他NOSQL存儲(chǔ)和傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)相比的巨大優(yōu)勢(shì)。但是選擇采用圖形數(shù)據(jù)庫(kù)后，出現(xiàn)了一個(gè)問(wèn)題：如何在圖形中建模？

本章重點(diǎn)介紹圖建模。首先從標(biāo)簽化的屬性圖模型（最廣泛使用的圖數(shù)據(jù)模型）的概述開(kāi)始，然后概述本書(shū)中大多數(shù)代碼示例所使用的圖查詢(xún)語(yǔ)言：Cypher。盡管存在幾種圖形查詢(xún)語(yǔ)言，但是Cypher部署最廣泛，使其成為事實(shí)上的標(biāo)準(zhǔn)。它也很容易學(xué)習(xí)和理解，特別是對(duì)于那些來(lái)自SQL背景的人。有了這些基礎(chǔ)知識(shí)之后，我們將直接研究一些圖形建模的示例。在基于系統(tǒng)管理域的第一個(gè)示例中，我們比較了關(guān)系和圖形建模技術(shù)。在第二個(gè)例子（莎士比亞文學(xué)的生產(chǎn)和消費(fèi)）中，我們使用圖來(lái)連接和查詢(xún)幾個(gè)不同的領(lǐng)域。在本章的結(jié)尾，我們介紹了使用圖形建模時(shí)的一些常見(jiàn)陷阱，并重點(diǎn)介紹了一些好的做法。

1.模式與目標(biāo)(Models and Goals)

在深入研究圖形建模之前，請(qǐng)先對(duì)模型進(jìn)行概括。 建模是受特定需求或目標(biāo)推動(dòng)的抽象活動(dòng)。 我們進(jìn)行建模是為了將不守法域的特定方面帶入可以對(duì)其進(jìn)行結(jié)構(gòu)化和處理的空間。世界沒(méi)有“really is,”的自然表現(xiàn)，只有許多有目的的選擇，抽象和簡(jiǎn)化，其中一些在滿足特定目標(biāo)方面比其他更為有用。

在這方面，圖形表示形式?jīng)]有什么不同。但是，它們與許多其他數(shù)據(jù)建模技術(shù)的不同之處可能在于邏輯模型與物理模型之間的緊密聯(lián)系。關(guān)系數(shù)據(jù)管理技術(shù)要求我們偏離域的自然語(yǔ)言表示形式：首先通過(guò)將表示形式組合成邏輯模型，然后將其強(qiáng)制為物理模型。這些轉(zhuǎn)換在我們對(duì)世界的概念化與該模型的數(shù)據(jù)庫(kù)實(shí)例化之間引入了語(yǔ)義上的矛盾。使用圖形數(shù)據(jù)庫(kù)，這個(gè)差距大大縮小了。

我們已經(jīng)在圖形中進(jìn)行交流

圖形建模自然符合我們傾向于使用圓和框從域中提取細(xì)節(jié)，然后通過(guò)用箭頭和線將它們連接起來(lái)來(lái)描述這些事物之間的聯(lián)系的方式。當(dāng)今的圖形數(shù)據(jù)庫(kù)比其他任何數(shù)據(jù)庫(kù)技術(shù)都更“whiteboard friendly”。問(wèn)題的典型白板視圖是圖形。我們?cè)趧?chuàng)意和分析模式下繪制的內(nèi)容與我們?cè)跀?shù)據(jù)庫(kù)內(nèi)部實(shí)現(xiàn)的數(shù)據(jù)模型緊密對(duì)應(yīng)。

在表達(dá)性方面，圖形數(shù)據(jù)庫(kù)減少了困擾關(guān)系數(shù)據(jù)庫(kù)實(shí)現(xiàn)多年的分析和實(shí)現(xiàn)之間的阻抗失配。這種圖模型特別有趣的是，它們不僅傳達(dá)了我們認(rèn)為事物之間的關(guān)系，而且還清楚地傳達(dá)了我們想問(wèn)的領(lǐng)域內(nèi)的各種問(wèn)題。

我們將在本章中看到，圖模型和圖查詢(xún)實(shí)際上只是同一枚硬幣的兩個(gè)方面。

2.標(biāo)記的屬性圖模型

我們?cè)诘?章中介紹了標(biāo)記的屬性圖模型。總而言之，這些是其顯著的特征：

帶標(biāo)簽的屬性圖由節(jié)點(diǎn)，關(guān)系，屬性和標(biāo)簽組成。
節(jié)點(diǎn)包含屬性。將節(jié)點(diǎn)視為以任意鍵值對(duì)形式存儲(chǔ)屬性的文檔。在Neo4j中，鍵是字符串，值是Java字符串和原始數(shù)據(jù)類(lèi)型，以及這些類(lèi)型的數(shù)組。
節(jié)點(diǎn)可以用一個(gè)或多個(gè)標(biāo)簽標(biāo)記。標(biāo)簽將節(jié)點(diǎn)分組在一起，并指示它們?cè)跀?shù)據(jù)集中扮演的角色。
關(guān)系連接節(jié)點(diǎn)并構(gòu)造圖。關(guān)系始終具有一個(gè)方向，一個(gè)名稱(chēng)以及一個(gè)開(kāi)始節(jié)點(diǎn)和一個(gè)結(jié)束節(jié)點(diǎn)，沒(méi)有懸空的關(guān)系。關(guān)系的方向和名稱(chēng)共同為節(jié)點(diǎn)的結(jié)構(gòu)增加了語(yǔ)義的清晰度。
像節(jié)點(diǎn)一樣，關(guān)系也可以具有屬性。向關(guān)系添加屬性的功能對(duì)于為圖形算法提供其他元數(shù)據(jù)，為關(guān)系添加其他語(yǔ)義（包括質(zhì)量和權(quán)重）以及在運(yùn)行時(shí)約束查詢(xún)特別有用。

這些簡(jiǎn)單的原語(yǔ)是我們創(chuàng)建復(fù)雜且語(yǔ)義豐富的模型所需要的。到目前為止，我們所有的模型都是以圖表的形式。圖表非常適合在任何技術(shù)環(huán)境之外描述圖表，但是在使用數(shù)據(jù)庫(kù)時(shí)，我們需要其他一些機(jī)制來(lái)創(chuàng)建，處理和查詢(xún)數(shù)據(jù)。我們需要一種查詢(xún)語(yǔ)言。

3.查詢(xún)圖：Cypher簡(jiǎn)介

Cypher是一種表現(xiàn)力強(qiáng)（但很緊湊）的圖形數(shù)據(jù)庫(kù)查詢(xún)語(yǔ)言。盡管當(dāng)前特定于Neo4j，但它與我們將圖形表示為圖形的習(xí)慣緊密相關(guān)，這使其非常適合以編程方式描述圖形。因此，在本書(shū)的其余部分中，我們將使用Cypher來(lái)說(shuō)明圖形查詢(xún)和圖形構(gòu)造。 Cypher可以說(shuō)是最容易學(xué)習(xí)的圖形查詢(xún)語(yǔ)言，并且是學(xué)習(xí)圖形的重要基礎(chǔ)。一旦了解了Cypher，就可以很容易地進(jìn)行分支和學(xué)習(xí)其他圖形查詢(xún)語(yǔ)言。

在以下各節(jié)中，我們將簡(jiǎn)要介紹Cypher。但是，這不是Cypher的參考文檔，它只是一個(gè)友好的介紹，因此以后我們可以探索更有趣的圖形查詢(xún)方案。

其他查詢(xún)語(yǔ)言

其他圖形數(shù)據(jù)庫(kù)具有其他查詢(xún)數(shù)據(jù)的方式。許多人，包括的Neo4j，支持RDF查詢(xún)語(yǔ)言SPARQL和勢(shì)在必行，基于路徑的查詢(xún)語(yǔ)言?Gremlin。但是，我們的興趣在于將屬性圖的表達(dá)能力與聲明性查詢(xún)語(yǔ)言結(jié)合使用，因此在本書(shū)中，我們幾乎只關(guān)注Cypher。

3.1.Cypher Philosophy

Cypher旨在使開(kāi)發(fā)人員，數(shù)據(jù)庫(kù)專(zhuān)業(yè)人員和業(yè)務(wù)利益相關(guān)者易于閱讀和理解。它更容易從一個(gè)事實(shí)，即它是在與雅閣的方式導(dǎo)出使用我們直觀地描述使用圖圖表。

Cypher使用戶（或代表用戶運(yùn)行的應(yīng)用程序）能夠要求數(shù)據(jù)庫(kù)查找與特定模式匹配的數(shù)據(jù)。通俗地說(shuō)，我們要求數(shù)據(jù)庫(kù)“查找類(lèi)似的東西”。我們描述“類(lèi)似的東西”外觀的方式是使用ASCII藝術(shù)畫(huà)它們。圖3-1顯示了一個(gè)簡(jiǎn)單模式的示例。

此模式描述了三個(gè)共同的朋友。這是Cypher中等效的ASCII藝術(shù)作品表示形式：

(emil)<-[:KNOWS]-(jim)-[:KNOWS]->(ian)-[:KNOWS]->(emil)

此模式描述了一條路徑，該路徑將一個(gè)稱(chēng)為jim的節(jié)點(diǎn)連接到兩個(gè)稱(chēng)為ian和emil的節(jié)點(diǎn)，還將ian節(jié)點(diǎn)連接到emil節(jié)點(diǎn)。 ian，jim和emil是標(biāo)識(shí)符。標(biāo)識(shí)符使我們?cè)诿枋瞿Ｊ綍r(shí)可以多次引用同一個(gè)節(jié)點(diǎn)—一種技巧，可以幫助我們繞過(guò)以下事實(shí)：查詢(xún)語(yǔ)言只有一個(gè)維度（文本從左到右），而可以放置圖形圖二維化。盡管偶爾需要以這種方式重復(fù)標(biāo)識(shí)符，但意圖仍然很明確。 Cypher?模式非常自然地遵循我們?cè)诎装迳侠L制圖形的方式。

先前的Cypher模式描述了一種簡(jiǎn)單的圖形結(jié)構(gòu)，但尚未引用數(shù)據(jù)庫(kù)中的任何特定數(shù)據(jù)。要將模式綁定到現(xiàn)有數(shù)據(jù)集中的特定節(jié)點(diǎn)和關(guān)系，我們必須指定一些屬性值和節(jié)點(diǎn)標(biāo)簽，以幫助在數(shù)據(jù)集中定位相關(guān)元素。例如：

(emil:Person {name:'Emil'}) <-[:KNOWS]-(jim:Person {name:'Jim'})-[:KNOWS]->(ian:Person {name:'Ian'})-[:KNOWS]->(emil)

在這里，我們使用其name屬性和Person標(biāo)簽將每個(gè)節(jié)點(diǎn)綁定到其標(biāo)識(shí)符。例如，emil identifer綁定到數(shù)據(jù)集中的一個(gè)節(jié)點(diǎn)，該節(jié)點(diǎn)的標(biāo)簽為Person，名稱(chēng)屬性為Emil。以這種方式將模式的某些部分固定到實(shí)際數(shù)據(jù)是Cypher的常規(guī)做法，我們將在以下各節(jié)中看到。

舉例說(shuō)明

關(guān)于圖的有趣之處在于，它們傾向于包含節(jié)點(diǎn)和關(guān)系的特定實(shí)例，而不是類(lèi)或原型。通常甚至?xí)褂糜蓪?shí)節(jié)點(diǎn)和關(guān)系構(gòu)成的較小子圖來(lái)說(shuō)明甚至非常大的圖。換句話說(shuō)，我們傾向于通過(guò)示例來(lái)描述圖形。

ASCII藝術(shù)圖形模式是Cypher的基礎(chǔ)。 Cypher查詢(xún)使用謂詞將模式的一個(gè)或多個(gè)部分錨定到圖形中的特定位置，然后彎曲未錨定的部分以查找局部匹配項(xiàng)。

Cypher根據(jù)查詢(xún)中的標(biāo)簽和屬性謂詞確定實(shí)際圖形中與模式的某些部分綁定到的錨點(diǎn)。在大多數(shù)情況下，Cypher使用有關(guān)現(xiàn)有索引，約束和謂詞的元信息來(lái)自動(dòng)找出問(wèn)題。但是，有時(shí)它有助于指定一些其他提示。

像大多數(shù)查詢(xún)語(yǔ)言一樣，Cypher由子句組成。最簡(jiǎn)單的查詢(xún)由一個(gè)MATCH子句和一個(gè)RETURN子句組成（我們將在本章稍后介紹在Cypher查詢(xún)中可以使用的其他子句）。這是一個(gè)使用以下三個(gè)子句來(lái)查找名為Jim的用戶的共同朋友的Cypher查詢(xún)示例:

MATCH (a:Person {name:'Jim'})-[:KNOWS]->(b)-[:KNOWS]->(c), (a)-[:KNOWS]->(c) RETURN b, c

讓我們更詳細(xì)地查看每個(gè)子句。

3.2.MATCH

MATCH子句是大多數(shù)Cypher查詢(xún)的核心。這是示例說(shuō)明部分。使用ASCII字符表示節(jié)點(diǎn)和關(guān)系，我們繪制感興趣的數(shù)據(jù)。我們用括號(hào)繪制節(jié)點(diǎn)，并使用帶有大于或小于號(hào)（->和<-）的破折號(hào)對(duì)繪制關(guān)系。 <和>符號(hào)指示關(guān)系方向。在短劃線之間，用方括號(hào)括起來(lái)，并用冒號(hào)作為前綴，我們放置了關(guān)系名稱(chēng)。節(jié)點(diǎn)標(biāo)簽類(lèi)似地以冒號(hào)作為前綴。然后，在花括號(hào)（非常像Javascript對(duì)象）中指定節(jié)點(diǎn)（和關(guān)系）屬性鍵值對(duì)。

在示例查詢(xún)中，我們正在尋找一個(gè)名為Person的節(jié)點(diǎn)，其名稱(chēng)屬性為Jim。該查詢(xún)的返回值綁定到標(biāo)識(shí)符a。該標(biāo)識(shí)符使我們可以在整個(gè)查詢(xún)的其余部分中引用表示Jim的節(jié)點(diǎn)。

此起始節(jié)點(diǎn)是簡(jiǎn)單模式?(a)-[:KNOWS]->(b)-[:KNOWS]->(c), (a)-[:KNOWS]->(c)?描述了一個(gè)包含三個(gè)節(jié)點(diǎn)的路徑，其中一個(gè)是
綁定到標(biāo)識(shí)符a，其他綁定到b和c。這些節(jié)點(diǎn)通過(guò)以下方式連接多個(gè)KNOWS關(guān)系，如圖3-1所示。

從理論上講，這種模式可能會(huì)在整個(gè)圖形數(shù)據(jù)中多次出現(xiàn)。對(duì)于較大的用戶集，可能存在許多與此模式相對(duì)應(yīng)的相互關(guān)系。要本地化查詢(xún)，我們需要它的某些部分錨定到圖中的一個(gè)或多個(gè)地點(diǎn)。在指定我們要尋找一個(gè)標(biāo)記為Person且名稱(chēng)屬性值為Jim的節(jié)點(diǎn)時(shí)，我們已將模式綁定到圖中的特定節(jié)點(diǎn)，即代表Jim的節(jié)點(diǎn)。然后，Cypher將模式的其余部分與緊靠該錨點(diǎn)的圖形進(jìn)行匹配。這樣，它將發(fā)現(xiàn)要綁定到其他標(biāo)識(shí)符的節(jié)點(diǎn)。盡管a將始終固定在Jim上，但是b和c將在查詢(xún)執(zhí)行時(shí)綁定到一系列節(jié)點(diǎn)上。

另外，我們可以在WHERE子句中將錨表示為謂詞。

MATCH (a:Person)-[:KNOWS]->(b)-[:KNOWS]->(c), (a)-[:KNOWS]->(c) WHERE a.name = 'Jim' RETURN b, c

在這里，我們已將屬性查找從MATCH子句移到WHERE子句。結(jié)果與之前的查詢(xún)相同。

3.3.RETURN

此子句指定應(yīng)將匹配數(shù)據(jù)中的哪些節(jié)點(diǎn)，關(guān)系和屬性返回給客戶端。在示例查詢(xún)中，我們有興趣返回綁定到b和c標(biāo)識(shí)符的節(jié)點(diǎn)。當(dāng)客戶端迭代結(jié)果時(shí)，每個(gè)匹配節(jié)點(diǎn)都被延遲綁定到其標(biāo)識(shí)符。

3.4.其他Cypher語(yǔ)法

我們可以在Cypher查詢(xún)中使用的其他子句包括：

WHERE?
- 提供用于過(guò)濾模式匹配結(jié)果的條件。
CREATE and ?CREATE UNIQUE
- 創(chuàng)建節(jié)點(diǎn)和關(guān)系。
MERGE
- 通過(guò)重用與提供的謂詞匹配的現(xiàn)有節(jié)點(diǎn)和關(guān)系，或通過(guò)創(chuàng)建新的節(jié)點(diǎn)和關(guān)系，確保圖中存在提供的模式。
DELETE
- 刪除節(jié)點(diǎn)，關(guān)系和屬性。
SET
- 設(shè)置屬性值。
FOREACH
- 對(duì)列表中的每個(gè)元素執(zhí)行更新操作。
UNION
- 合并兩個(gè)或多個(gè)查詢(xún)的結(jié)果。
WITH
- 鏈接后續(xù)查詢(xún)部分并將結(jié)果從一個(gè)查詢(xún)轉(zhuǎn)發(fā)到下一個(gè)查詢(xún)。類(lèi)似于Unix中的管道命令。
START
- 在圖中指定一個(gè)或多個(gè)明確的起點(diǎn)-節(jié)點(diǎn)或關(guān)系。（不建議使用START，而應(yīng)在MATCH子句中指定錨點(diǎn)。）

如果這些條款看起來(lái)很熟悉（尤其是您是SQL開(kāi)發(fā)人員），那就太好了！ Cypher旨在使您足夠熟悉，以幫助您沿著學(xué)習(xí)曲線快速移動(dòng)。同時(shí)，它的區(qū)別足以強(qiáng)調(diào)我們是在處理圖形，而不是關(guān)系集。

我們將在本章后面看到這些條款的一些示例。在它們發(fā)生的地方，我們將更詳細(xì)地描述它們?nèi)绾喂ぷ鳌?/p>

現(xiàn)在，我們已經(jīng)了解了如何使用Cypher來(lái)描述和查詢(xún)圖形，下面我們來(lái)看一些圖形建模的示例。

4.關(guān)系和圖建模的比較

為了介紹圖形建模，我們將研究如何使用基于關(guān)系和基于圖形的技術(shù)對(duì)域進(jìn)行建模。大多數(shù)開(kāi)發(fā)人員和數(shù)據(jù)專(zhuān)業(yè)人員都熟悉RDBMS（關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)）和相關(guān)的數(shù)據(jù)建模技術(shù)。結(jié)果，比較將突出一些相似之處和許多差異。特別是，我們將看到從概念圖模型轉(zhuǎn)換為物理圖模型有多么容易，并且相對(duì)于關(guān)系模型，圖模型扭曲了我們要表示的內(nèi)容。

為了便于進(jìn)行比較，我們將研究一個(gè)簡(jiǎn)單的數(shù)據(jù)中心管理域。在此領(lǐng)域中，數(shù)個(gè)數(shù)據(jù)中心代表使用不同基礎(chǔ)架構(gòu)（從虛擬機(jī)到物理負(fù)載平衡器）的許多客戶，支持許多應(yīng)用程序。此域的示例如圖3-2所示。

在圖3-2中，我們看到了一些應(yīng)用程序以及支持它們的必要數(shù)據(jù)中心基礎(chǔ)結(jié)構(gòu)的簡(jiǎn)化視圖。由節(jié)點(diǎn)App 1，App 2和App 3表示的應(yīng)用程序依賴(lài)于標(biāo)記為Database Server 1、2、3的數(shù)據(jù)庫(kù)集群。盡管用戶在邏輯上取決于應(yīng)用程序及其數(shù)據(jù)的可用性，但用戶與應(yīng)用程序之間存在其他物理基礎(chǔ)架構(gòu)；此基礎(chǔ)結(jié)構(gòu)包括虛擬客戶端（VM10、11、20、30、31），真實(shí)服務(wù)器（Service1、2、3），服務(wù)器機(jī)架（Rack1、2）和負(fù)載均衡器（Balance 1、2）），位于應(yīng)用程序的前面。當(dāng)然，在每個(gè)組件之間都有許多網(wǎng)絡(luò)元素：電纜，交換機(jī)，配線架，NIC（網(wǎng)絡(luò)接口控制器），電源，空調(diào)等，所有這些元素在不方便的時(shí)候都會(huì)發(fā)生故障。為了完成圖片，我們有一個(gè)應(yīng)用程序3的單一用戶，由用戶3表示。

作為此類(lèi)系統(tǒng)的運(yùn)營(yíng)商，我們有兩個(gè)主要關(guān)注點(diǎn)：

持續(xù)提供滿足（或超過(guò)）服務(wù)水平協(xié)議的功能，包括執(zhí)行前瞻性分析以確定單點(diǎn)故障的能力以及追溯分析以快速確定引起客戶對(duì)服務(wù)可用性投訴的原因的能力。
為消耗的資源開(kāi)賬單，包括硬件，虛擬化，網(wǎng)絡(luò)配置的成本，甚至軟件開(kāi)發(fā)和運(yùn)營(yíng)的成本（因?yàn)檫@些只是我們?cè)诖颂幙吹降南到y(tǒng)的邏輯擴(kuò)展）。

如果我們要構(gòu)建數(shù)據(jù)中心管理解決方案，則需要確保基礎(chǔ)數(shù)據(jù)模型允許我們以有效解決這些主要問(wèn)題的方式來(lái)存儲(chǔ)和查詢(xún)數(shù)據(jù)。我們還將希望能夠隨著應(yīng)用程序產(chǎn)品組合的變化，數(shù)據(jù)中心的物理布局的發(fā)展以及虛擬機(jī)實(shí)例的遷移而更新基礎(chǔ)模型。考慮到這些需求和約束，讓我們看看關(guān)系模型和圖形模型的比較。

4.1.系統(tǒng)管理領(lǐng)域中的關(guān)系建模

關(guān)系世界中建模的初始階段與許多其他數(shù)據(jù)建模技術(shù)的初始階段相似：也就是說(shuō)，我們?cè)噲D理解并同意域中的實(shí)體，它們之間的相互關(guān)系以及控制其狀態(tài)轉(zhuǎn)換的規(guī)則。其中大多數(shù)傾向于非正式地完成，通常是通過(guò)白板草圖以及主題專(zhuān)家，系統(tǒng)與數(shù)據(jù)架構(gòu)師之間的討論來(lái)完成。為了表達(dá)我們的共同理解和共識(shí)，我們通常創(chuàng)建一個(gè)如圖3-2所示的圖表。

下一階段以更嚴(yán)格的形式捕獲此協(xié)議，例如實(shí)體關(guān)系（E-R）圖-另一個(gè)圖。使用更嚴(yán)格的表示法將概念模型轉(zhuǎn)換為邏輯模型，為我們提供了第二次機(jī)會(huì)來(lái)完善我們的領(lǐng)域詞匯，以便可以與關(guān)系數(shù)據(jù)庫(kù)專(zhuān)家共享。（這種方法并非總是必要的：熟練的關(guān)系用戶經(jīng)常直接進(jìn)行表設(shè)計(jì)和規(guī)范化操作，而無(wú)需先描述中間的E-R圖。）在我們的示例中，我們已在圖3-3所示的E-R圖中捕獲了域。

盡管是圖，但ER圖立即證明了關(guān)系模型捕獲富域的缺點(diǎn)。盡管它們?cè)试S命名關(guān)系（圖數(shù)據(jù)庫(kù)完全包含了某種東西，但關(guān)系存儲(chǔ)卻沒(méi)有），但ER圖僅允許單個(gè)，無(wú)向，實(shí)體之間的命名關(guān)系。在這方面，關(guān)系模型不適用于實(shí)體域之間的關(guān)系既豐富又語(yǔ)義豐富多樣的現(xiàn)實(shí)世界域。

找到合適的邏輯模型后，我們將其映射到表和關(guān)系中，對(duì)它們進(jìn)行規(guī)范化以消除數(shù)據(jù)冗余。在許多情況下，此步驟很簡(jiǎn)單，例如將E-R圖轉(zhuǎn)錄為表格形式，然后通過(guò)SQL命令將這些表加載到數(shù)據(jù)庫(kù)中。但是，即使是最簡(jiǎn)單的情況也可以用來(lái)突出關(guān)系模型的特質(zhì)。例如，在圖3-4中，我們看到大量意外復(fù)雜性以外鍵約束（所有帶注釋[FK]）的形式進(jìn)入了模型，該約束支持一對(duì)多關(guān)系以及聯(lián)接表（例如AppDatabase），它支持多對(duì)多關(guān)系-在添加一行實(shí)際用戶數(shù)據(jù)之前，所有這些都需要支持。這些約束是簡(jiǎn)單存在的模型級(jí)元數(shù)據(jù)，因此我們可以在查詢(xún)時(shí)具體化表之間的關(guān)系。但是，人們還是敏銳地感覺(jué)到這種結(jié)構(gòu)性數(shù)據(jù)的存在，因?yàn)樗鼤?huì)使服務(wù)于數(shù)據(jù)庫(kù)而不是用戶的數(shù)據(jù)變得混亂和模糊。

現(xiàn)在，我們有了一個(gè)相對(duì)于該領(lǐng)域相對(duì)忠誠(chéng)的規(guī)范化模型。盡管該模型以外鍵和聯(lián)接表的形式帶來(lái)了相當(dāng)大的意外復(fù)雜性，但其中沒(méi)有重復(fù)的數(shù)據(jù)。但是我們的設(shè)計(jì)工作尚未完成。關(guān)系范式的挑戰(zhàn)之一是規(guī)范化模型通常不夠快，無(wú)法滿足實(shí)際需求。對(duì)于許多生產(chǎn)系統(tǒng)，規(guī)范化的模式在理論上適合于回答我們可能希望對(duì)域提出的任何特殊問(wèn)題，在實(shí)踐中必須對(duì)其進(jìn)行進(jìn)一步調(diào)整并使其專(zhuān)門(mén)用于特定的訪問(wèn)模式。換句話說(shuō)，為了使關(guān)系存儲(chǔ)能夠很好地滿足常規(guī)應(yīng)用程序的需求，我們必須放棄任何具有真實(shí)域親和力的痕跡，并接受必須更改用戶的數(shù)據(jù)模型以適合數(shù)據(jù)庫(kù)引擎（而不是用戶）的觀點(diǎn)。這種技術(shù)稱(chēng)為非規(guī)范化。

為了獲得查詢(xún)性能，非規(guī)范化涉及復(fù)制數(shù)據(jù)（在某些情況下，實(shí)質(zhì)上是重復(fù)的）。以用戶及其聯(lián)系方式為例。典型的用戶通常有幾個(gè)電子郵件地址，在完全規(guī)范化的模型中，我們會(huì)將其存儲(chǔ)在單獨(dú)的EMAIL表中。但是，為了減少聯(lián)接和兩個(gè)表之間的聯(lián)接帶來(lái)的性能損失，在USER表中內(nèi)聯(lián)此數(shù)據(jù)，添加一個(gè)或多個(gè)列來(lái)存儲(chǔ)用戶最重要的電子郵件地址是很常見(jiàn)的。

盡管進(jìn)行非規(guī)范化可能是安全的事情（假設(shè)開(kāi)發(fā)人員了解非規(guī)范化模型及其如何映射到以域?yàn)橹行牡拇a，并從數(shù)據(jù)庫(kù)獲得強(qiáng)大的事務(wù)支持），但這通常不是一項(xiàng)瑣碎的任務(wù)。為了獲得最佳結(jié)果，我們通常會(huì)請(qǐng)一位真正的RDBMS專(zhuān)家來(lái)將我們的規(guī)范化模型改成與基礎(chǔ)RDBMS和物理存儲(chǔ)層的特征一致的非規(guī)范化模型。為此，我們接受可能存在大量的數(shù)據(jù)冗余。

我們可能會(huì)認(rèn)為所有這些設(shè)計(jì)規(guī)范化非規(guī)范化工作都是可以接受的，因?yàn)檫@是一項(xiàng)一次性的任務(wù)。這種學(xué)派認(rèn)為，工作成本在系統(tǒng)的整個(gè)生命周期（包括開(kāi)發(fā)和生產(chǎn)）中攤銷(xiāo)，因此與項(xiàng)目的總成本相比，生成高效的關(guān)系模型的工作量相對(duì)較小。這是一個(gè)吸引人的概念，但是在許多情況下，它與現(xiàn)實(shí)不符，因?yàn)橄到y(tǒng)不僅在開(kāi)發(fā)過(guò)程中會(huì)發(fā)生變化，而且在產(chǎn)品生命周期中也會(huì)發(fā)生變化。

數(shù)據(jù)模型更改的攤銷(xiāo)視圖（在模型中，開(kāi)發(fā)過(guò)程中代價(jià)高昂的更改被生產(chǎn)中穩(wěn)定模型的長(zhǎng)期利益所掩蓋）假定系統(tǒng)在生產(chǎn)環(huán)境中花費(fèi)了大部分時(shí)間，并且這些生產(chǎn)環(huán)境是穩(wěn)定的。盡管大多數(shù)系統(tǒng)可能會(huì)在生產(chǎn)環(huán)境中花費(fèi)大部分時(shí)間，但這些環(huán)境很少穩(wěn)定。隨著業(yè)務(wù)需求的變化或法規(guī)要求的發(fā)展，我們的系統(tǒng)和基于它們的數(shù)據(jù)結(jié)構(gòu)也必須隨之變化。

在項(xiàng)目的設(shè)計(jì)和開(kāi)發(fā)階段，數(shù)據(jù)模型總是會(huì)經(jīng)過(guò)實(shí)質(zhì)性的修訂，并且在幾乎每種情況下，這些修訂都旨在滿足模型的需求，以適應(yīng)將要在生產(chǎn)中使用它的應(yīng)用程序的需求。這些最初的設(shè)計(jì)影響力如此之大，以至于在生產(chǎn)后就無(wú)法修改應(yīng)用程序和模型以適應(yīng)最初設(shè)計(jì)時(shí)無(wú)法做的事情。

我們將結(jié)構(gòu)更改引入數(shù)據(jù)庫(kù)的技術(shù)機(jī)制稱(chēng)為遷移(Migrations)，這種遷移已被Rails等應(yīng)用程序開(kāi)發(fā)框架所普及。遷移提供了一種結(jié)構(gòu)化的，逐步的方法，可以將一組數(shù)據(jù)庫(kù)重構(gòu)應(yīng)用到數(shù)據(jù)庫(kù)，以便可以負(fù)責(zé)任地發(fā)展它以滿足使用它的應(yīng)用程序不斷變化的需求。但是，與我們通常在幾秒鐘或幾分鐘內(nèi)完成的代碼重構(gòu)不同，數(shù)據(jù)庫(kù)重構(gòu)可能需要數(shù)周或數(shù)月的時(shí)間才能完成，而架構(gòu)更改則需要停機(jī)時(shí)間。數(shù)據(jù)庫(kù)重構(gòu)速度慢，風(fēng)險(xiǎn)大且昂貴。

因此，非規(guī)范化模型的問(wèn)題在于其對(duì)系統(tǒng)業(yè)務(wù)需求的快速發(fā)展的抵制。正如我們?cè)跀?shù)據(jù)中心示例中看到的那樣，在實(shí)施關(guān)系解決方案的過(guò)程中對(duì)白板模型施加的更改，在概念世界和數(shù)據(jù)物理布局方式之間產(chǎn)生了鴻溝。這種概念上的關(guān)系失調(diào)幾乎阻止了業(yè)務(wù)利益相關(guān)者在系統(tǒng)的進(jìn)一步發(fā)展中進(jìn)行積極的協(xié)作。利益相關(guān)者的參與停止在關(guān)系大廈的門(mén)檻上。在開(kāi)發(fā)方面，將已更改的業(yè)務(wù)需求轉(zhuǎn)換為基礎(chǔ)和根深蒂固的關(guān)系結(jié)構(gòu)的困難使系統(tǒng)的發(fā)展滯后于業(yè)務(wù)的發(fā)展。沒(méi)有專(zhuān)家的幫助和嚴(yán)格的計(jì)劃，遷移非規(guī)范化的數(shù)據(jù)庫(kù)會(huì)帶來(lái)很多風(fēng)險(xiǎn)。如果遷移無(wú)法維持存儲(chǔ)親和性，則性能可能會(huì)受到影響。同樣嚴(yán)重的是，如果在遷移后將故意重復(fù)的數(shù)據(jù)留為孤立，我們有可能危及整個(gè)數(shù)據(jù)的完整性。

4.2.系統(tǒng)管理域中的圖形建模

我們已經(jīng)看到了關(guān)系建模及其伴隨的實(shí)現(xiàn)活動(dòng)，如何使我們沿著將應(yīng)用程序的基礎(chǔ)存儲(chǔ)模型與利益相關(guān)者的概念世界觀分離開(kāi)來(lái)的道路。具有剛性模式和復(fù)雜建模特性的關(guān)系數(shù)據(jù)庫(kù)并不是支持快速變化的特別好的工具。我們需要一個(gè)與領(lǐng)域緊密相關(guān)的模型，但它不會(huì)犧牲性能，并且在數(shù)據(jù)進(jìn)行快速更改和增長(zhǎng)時(shí)，既支持演化又保持?jǐn)?shù)據(jù)的完整性。該模型是圖模型。那么，使用圖形數(shù)據(jù)模型實(shí)現(xiàn)時(shí)，此過(guò)程有何不同？

在分析的早期階段，我們所需的工作類(lèi)似于關(guān)系方法：使用lo-fi方法（例如白板草圖），我們描述并同意了該領(lǐng)域。但是，此后方法有所不同。我們沒(méi)有豐富領(lǐng)域模型的圖形表示形式，而是將其豐富化，目的是對(duì)領(lǐng)域中與我們的應(yīng)用目標(biāo)相關(guān)的部分進(jìn)行準(zhǔn)確的表示。也就是說(shuō)，對(duì)于我們域中的每個(gè)實(shí)體，我們都確保已捕獲其相關(guān)角色（作為標(biāo)簽），其屬性（作為屬性）以及與相鄰實(shí)體的關(guān)系（作為關(guān)系）。

記住，領(lǐng)域模型不是通向現(xiàn)實(shí)的透明，無(wú)上下文的窗口：相反，它是對(duì)領(lǐng)域中與我們的應(yīng)用程序目標(biāo)有關(guān)的那些方面的有目的抽象。建立模型總是有動(dòng)力。通過(guò)使用其他屬性和關(guān)聯(lián)性來(lái)豐富我們的第一手域圖，我們可以有效地生成與應(yīng)用程序的數(shù)據(jù)需求相匹配的圖模型。也就是說(shuō)，我們提供了回答我們的應(yīng)用程序?qū)⒃?xún)問(wèn)其數(shù)據(jù)的各種問(wèn)題。

有用的是，領(lǐng)域建模與圖建模完全同構(gòu)。通過(guò)確保域模型的正確性，我們隱式改進(jìn)了圖形模型，因?yàn)樵趫D形數(shù)據(jù)庫(kù)中，您在白板上繪制的內(nèi)容通常是您在數(shù)據(jù)庫(kù)中存儲(chǔ)的內(nèi)容。

用圖形表示，我們正在做的是確保每個(gè)節(jié)點(diǎn)具有適當(dāng)?shù)慕巧囟ǖ臉?biāo)簽和屬性，以便其能夠履行其以數(shù)據(jù)為中心的專(zhuān)用域職責(zé)。但是，我們還要確保每個(gè)節(jié)點(diǎn)都位于正確的語(yǔ)義上下文中；為此，我們通過(guò)在節(jié)點(diǎn)之間創(chuàng)建命名和定向（通常是屬性）關(guān)系來(lái)捕獲域的結(jié)構(gòu)方面。對(duì)于我們的數(shù)據(jù)中心場(chǎng)景，生成的圖形模型如圖3-5所示。

從邏輯上講，這就是我們需要做的。沒(méi)有表，沒(méi)有規(guī)范化，沒(méi)有非規(guī)范化。一旦我們有了域模型的準(zhǔn)確表示，將其移到數(shù)據(jù)庫(kù)中就變得微不足道了，我們很快就會(huì)看到。

請(qǐng)注意，這里的大多數(shù)節(jié)點(diǎn)都有兩個(gè)標(biāo)簽：特定類(lèi)型的標(biāo)簽（例如Database，App或Server）和更通用的Asset標(biāo)簽。這使我們能夠通過(guò)某些查詢(xún)來(lái)定位特定類(lèi)型的資產(chǎn)，并通過(guò)其他查詢(xún)來(lái)定位所有資產(chǎn)，而不論類(lèi)型如何。

4.3.測(cè)試模型

完善域模型后，下一步就是測(cè)試它是否適合回答實(shí)際查詢(xún)。盡管圖形非常適合于支持不斷發(fā)展的結(jié)構(gòu)（因此可以糾正任何錯(cuò)誤的早期設(shè)計(jì)決策），但是有許多設(shè)計(jì)決策一旦被應(yīng)用到我們的應(yīng)用程序中，便會(huì)進(jìn)一步阻礙我們前進(jìn)。通過(guò)在此早期階段回顧域模型和結(jié)果圖模型，我們可以避免這些陷阱。圖結(jié)構(gòu)的后續(xù)更改將僅由業(yè)務(wù)更改驅(qū)動(dòng)，而不是由減輕不良設(shè)計(jì)決策的需求驅(qū)動(dòng)。

實(shí)際上，我們可以在此處應(yīng)用兩種技術(shù)。第一個(gè)，也是最簡(jiǎn)單的，只是檢查圖是否讀得好。我們選擇一個(gè)開(kāi)始節(jié)點(diǎn)，然后關(guān)注與其他節(jié)點(diǎn)的關(guān)系，并在進(jìn)行過(guò)程中讀取每個(gè)節(jié)點(diǎn)的標(biāo)簽和每個(gè)關(guān)系的名稱(chēng)。這樣做應(yīng)該創(chuàng)造出明智的句子。對(duì)于我們的數(shù)據(jù)中心示例，我們可以讀取如下語(yǔ)句：“由應(yīng)用程序?qū)嵗?、2和3組成的應(yīng)用程序使用駐留在數(shù)據(jù)庫(kù)服務(wù)器1、2和3上的數(shù)據(jù)庫(kù)，”和“服務(wù)器3運(yùn)行承載應(yīng)用程序?qū)嵗?的VM31。”如果以這種方式讀取圖形是有意義的，那么我們可以合理地確信它對(duì)域是忠實(shí)的。

為了進(jìn)一步提高信心，我們還需要考慮將在圖（graph）上運(yùn)行的查詢(xún)。在這里，我們采用可查詢(xún)性思維方式的設(shè)計(jì)。為了驗(yàn)證圖是否支持我們期望在其上運(yùn)行的查詢(xún)，我們必須描述這些查詢(xún)。這要求我們了解最終用戶的目標(biāo)；也就是說(shuō)，將要應(yīng)用圖形的用例。例如，在我們的數(shù)據(jù)中心場(chǎng)景中，我們的一個(gè)使用案例涉及最終用戶報(bào)告應(yīng)用程序或服務(wù)無(wú)響應(yīng)。為了幫助這些用戶，我們必須找出無(wú)響應(yīng)的原因，然后加以解決。為了確定可能出了什么問(wèn)題，我們需要確定用戶與應(yīng)用程序之間路徑上的內(nèi)容，以及應(yīng)用程序向用戶交付功能所依賴(lài)的內(nèi)容。給定數(shù)據(jù)中心域的特定圖形表示形式，如果我們可以設(shè)計(jì)一個(gè)解決該用例的Cypher查詢(xún)，則我們甚至可以確定該圖形滿足我們域的需求。

繼續(xù)我們的示例用例，假設(shè)我們可以從常規(guī)的網(wǎng)絡(luò)監(jiān)控工具中更新圖表，從而為我們提供網(wǎng)絡(luò)狀態(tài)的近實(shí)時(shí)視圖。對(duì)于大型物理網(wǎng)絡(luò)，我們可能會(huì)使用復(fù)雜事件處理（CEP）處理低級(jí)網(wǎng)絡(luò)事件流，僅在CEP解決方案引發(fā)重大領(lǐng)域事件時(shí)才更新圖形。當(dāng)用戶報(bào)告問(wèn)題時(shí)，我們可以將物理故障查找限制在用戶與應(yīng)用程序之間以及應(yīng)用程序及其依存關(guān)系之間的有問(wèn)題的網(wǎng)絡(luò)元素上。在我們的圖形中，可以通過(guò)以下查詢(xún)找到有故障的設(shè)備：

MATCH (user:User)-[*1..5]-(asset:Asset) WHERE user.name = 'User 3' AND asset.status = 'down' RETURN DISTINCT asset

這里的MATCH子句描述了一個(gè)長(zhǎng)度介于一到五個(gè)關(guān)系之間的可變長(zhǎng)度路徑。關(guān)系是未命名和無(wú)方向的（方括號(hào)之間沒(méi)有冒號(hào)或關(guān)系名稱(chēng)，也沒(méi)有箭頭指示方向）。這使我們可以匹配以下路徑：

(user)-[:USER_OF]->(app) (user)-[:USER_OF]->(app)-[:USES]->(database) (user)-[:USER_OF]->(app)-[:USES]->(database)-[:SLAVE_OF]->(another-database) (user)-[:USER_OF]->(app)-[:RUNS_ON]->(vm) (user)-[:USER_OF]->(app)-[:RUNS_ON]->(vm)-[:HOSTED_BY]->(server) (user)-[:USER_OF]->(app)-[:RUNS_ON]->(vm)-[:HOSTED_BY]->(server)-[:IN]->(rack) (user)-[:USER_OF]->(app)-[:RUNS_ON]->(vm)-[:HOSTED_BY]->(server)-[:IN]->(rack) <-[:IN]-(load-balancer)

就是說(shuō)，從報(bào)告問(wèn)題的用戶開(kāi)始，我們沿著長(zhǎng)度為1到5的無(wú)向路徑匹配圖中的所有資產(chǎn)。我們添加了資產(chǎn)節(jié)點(diǎn)，這些資產(chǎn)節(jié)點(diǎn)的status屬性的值小于我們的結(jié)果。如果節(jié)點(diǎn)沒(méi)有狀態(tài)屬性，則該節(jié)點(diǎn)不會(huì)包含在結(jié)果中。 RETURN DISTINCT資產(chǎn)可確保無(wú)論匹配多少次，結(jié)果中都將返回唯一有價(jià)值的事物。

鑒于我們的圖形很容易支持這樣的查詢(xún)，因此我們可以確信該設(shè)計(jì)適合目標(biāo)。

5.跨域模型

業(yè)務(wù)洞察力通常取決于我們了解復(fù)雜價(jià)值鏈中隱藏的網(wǎng)絡(luò)效應(yīng)。為了產(chǎn)生這種理解，我們需要將域合并在一起，而不會(huì)扭曲或犧牲每個(gè)域特有的細(xì)節(jié)。屬性圖在此處提供了解決方案。使用屬性圖，我們可以將價(jià)值鏈建模為圖的圖，其中特定的關(guān)系連接并區(qū)分組成子域。

在圖3-6中，我們看到了圍繞莎士比亞文學(xué)的生產(chǎn)和消費(fèi)的價(jià)值鏈的圖形表示。在這里，我們可以獲得有關(guān)莎士比亞和他的一些戲劇的高質(zhì)量信息，以及最近進(jìn)行過(guò)戲劇表演的公司之一的詳細(xì)信息，以及劇院場(chǎng)地和一些地理空間數(shù)據(jù)。我們甚至添加了評(píng)論。總之，該圖描述并連接了三個(gè)不同的域。在圖表中，我們區(qū)分了這三種具有不同格式關(guān)系的域：點(diǎn)號(hào)代表文學(xué)領(lǐng)域，實(shí)線代表戲劇領(lǐng)域，點(diǎn)劃線代表地理空間領(lǐng)域。

首先看一下文學(xué)領(lǐng)域，我們有一個(gè)代表莎士比亞本人的節(jié)點(diǎn)，帶有一個(gè)標(biāo)簽Author和屬性firstname:'William'和?lastname:'Shakespeare'。該節(jié)點(diǎn)通過(guò)名為WROTE_PLAY的關(guān)系連接到一對(duì)節(jié)點(diǎn)，每個(gè)節(jié)點(diǎn)都標(biāo)記為Play，分別代表戲劇Julius Caesar（?title:'Julius Caesar'）和The Tempest（?title:'The Tempest'）。

按照關(guān)系箭頭的方向從左到右閱讀該子圖，告訴我們作家威廉·莎士比亞（William Shakespeare）創(chuàng)作了戲劇《凱撒大帝》和《暴風(fēng)雨》。如果我們對(duì)出處感興趣，那么每個(gè)WROTE_PLAY關(guān)系都有一個(gè)date屬性，它告訴我們Julius Caesar于1599年編寫(xiě)，而Tempest于1610年編寫(xiě)。了解如何添加莎士比亞的其他作品（戲劇）是一件微不足道的事情。只需添加更多代表每個(gè)作品的節(jié)點(diǎn)，然后通過(guò)WROTE_PLAY和WROTE_POEM關(guān)系將它們加入莎士比亞節(jié)點(diǎn)，就可以將詩(shī)和詩(shī)歌插入圖表中。

通過(guò)用手指跟蹤WROTE_PLAY關(guān)系箭頭，我們可以有效地完成圖形數(shù)據(jù)庫(kù)執(zhí)行的工作，盡管是以人的速度而不是計(jì)算機(jī)的速度進(jìn)行的。稍后我們將看到，此簡(jiǎn)單的遍歷操作是任意復(fù)雜的圖形查詢(xún)的基礎(chǔ)。

接下來(lái)轉(zhuǎn)到戲劇領(lǐng)域，我們添加了有關(guān)皇家莎士比亞劇團(tuán)（通常簡(jiǎn)稱(chēng)為RSC）的一些信息，其形式為帶有標(biāo)簽Company和屬性鍵名稱(chēng)（其值為RSC）的節(jié)點(diǎn)。毫無(wú)疑問(wèn)，戲劇領(lǐng)域與文學(xué)領(lǐng)域息息相關(guān)。在我們的圖表中，RSC具有Julius Caesar和The Tempest的PRODUCED版本。反過(guò)來(lái)，這些戲劇作品通過(guò)PRODUCTION_OF關(guān)系與文學(xué)領(lǐng)域的戲劇聯(lián)系起來(lái)。

該圖還捕獲了特定性能的詳細(xì)信息。例如，作為RSC夏季巡回演出的一部分，RSC在2012年7月29日進(jìn)行了Julius Caesar的制作。如果我們對(duì)表演場(chǎng)地感興趣，我們只需遵循表演節(jié)點(diǎn)的傳出VENUE關(guān)系，即可發(fā)現(xiàn)該表演是在皇家劇院進(jìn)行的，由一個(gè)標(biāo)有Venue的節(jié)點(diǎn)表示。

該圖還允許我們捕獲對(duì)特定性能的評(píng)論。在我們的示例圖中，我們僅包含了用戶Billy撰寫(xiě)的7月29日效果的評(píng)論。我們可以在性能，評(píng)級(jí)和用戶節(jié)點(diǎn)的相互作用中看到這一點(diǎn)。在這種情況下，我們有一個(gè)標(biāo)記為User的節(jié)點(diǎn)，表示Billy（屬性name:'Billy'），其傳出的WROTE_REVIEW關(guān)系連接到表示其評(píng)論的節(jié)點(diǎn)。 “Review”節(jié)點(diǎn)包含一個(gè)數(shù)字評(píng)級(jí)屬性和一個(gè)自由文本審閱屬性。該評(píng)論通過(guò)傳出的REVIEW_OF關(guān)系鏈接到特定的效果。為了將其擴(kuò)展到許多用戶，許多評(píng)論和許多性能，我們只需向圖添加更多帶有適當(dāng)標(biāo)簽和更同名關(guān)系的節(jié)點(diǎn)。

第三個(gè)域是地理空間數(shù)據(jù)域，它包含一個(gè)簡(jiǎn)單的位置層次樹(shù)。該地理空間域在圖中的幾個(gè)點(diǎn)連接到其他兩個(gè)域。雅芳的斯特拉特福市（財(cái)產(chǎn)名稱(chēng)：“雅芳河畔的斯特拉福德福特”）由于是莎士比亞的發(fā)源地而與文學(xué)領(lǐng)域息息相關(guān)（莎士比亞的名字是BORN_IN斯特拉特福德）。只要它是RSC的所在地（RSC是BASED_IN Stratford），它就連接到戲劇域。要根據(jù)雅芳的地理?xiàng)l件進(jìn)一步了解斯特拉特福，我們可以通過(guò)與COUNTRY的往來(lái)COUNTRY關(guān)系來(lái)了解它是否位于名為England的國(guó)家/地區(qū)。

注意圖如何減少跨域重復(fù)數(shù)據(jù)的實(shí)例。例如，埃文河畔的斯特拉特福就參與了這三個(gè)領(lǐng)域。

該圖可以捕獲更復(fù)雜的地理空間數(shù)據(jù)。例如，查看與Theatre Royal相連的節(jié)點(diǎn)上的標(biāo)簽，我們發(fā)現(xiàn)它位于Gray Street上，該大街位于Newcastle市中，該市位于Tyne and Wear縣，而該市最終位于英格蘭國(guó)家-就像埃文河畔的斯特拉特福一樣。

關(guān)系和標(biāo)簽

我們?cè)谶@里使用關(guān)系名稱(chēng)和節(jié)點(diǎn)標(biāo)簽來(lái)構(gòu)造圖并為每個(gè)節(jié)點(diǎn)建立語(yǔ)義上下文。

關(guān)系的名稱(chēng)和方向通過(guò)以有意義的方式連接兩個(gè)節(jié)點(diǎn)來(lái)幫助建立語(yǔ)義上下文。例如，通過(guò)遵循傳出的WROTE_REVIEW關(guān)系，我們了解到該關(guān)系末尾的節(jié)點(diǎn)表示評(píng)論。

關(guān)系有助于將圖形劃分到單獨(dú)的域中并連接這些域。從莎士比亞的例子中可以看出，通過(guò)屬性圖模型，可以輕松組合不同的域（每個(gè)域都具有自己的特定實(shí)體，標(biāo)簽，屬性和關(guān)系），這種方式不僅使每個(gè)域都可以訪問(wèn)，而且可以產(chǎn)生洞察力從域之間的連接。

標(biāo)簽代表每個(gè)節(jié)點(diǎn)在我們的域中扮演的角色。因?yàn)橐粋€(gè)節(jié)點(diǎn)可以連接到許多其他節(jié)點(diǎn)，其中一些節(jié)點(diǎn)可能來(lái)自非常不同的域，所以一個(gè)節(jié)點(diǎn)可以潛在地履行幾個(gè)不同的角色。

標(biāo)簽是屬性圖模型的一等公民。標(biāo)簽除了表明不同節(jié)點(diǎn)在我們的域中扮演的角色外，還允許我們將元數(shù)據(jù)與那些標(biāo)簽所附加的節(jié)點(diǎn)相關(guān)聯(lián)。例如，我們可以為所有帶有用戶標(biāo)簽的節(jié)點(diǎn)建立索引，或者要求所有帶有客戶標(biāo)簽的節(jié)點(diǎn)具有唯一的電子郵件屬性值。

5.1.創(chuàng)建莎士比亞圖

要?jiǎng)?chuàng)建如圖3-6所示的莎士比亞圖，我們使用CREATE來(lái)構(gòu)建整體結(jié)構(gòu)。該語(yǔ)句由Cypher運(yùn)行時(shí)在單個(gè)事務(wù)中執(zhí)行，因此一旦執(zhí)行了該語(yǔ)句，我們就可以確信該圖完整地存在于數(shù)據(jù)庫(kù)中。如果事務(wù)失敗，則數(shù)據(jù)庫(kù)中將不包含任何圖形。如我們所料，Cypher具有人性化和可視化的圖形生成方式：

CREATE (shakespeare:Author {firstname:'William', lastname:'Shakespeare'}), (juliusCaesar:Play {title:'Julius Caesar'}), (shakespeare)-[:WROTE_PLAY {year:1599}]->(juliusCaesar), (theTempest:Play {title:'The Tempest'}), (shakespeare)-[:WROTE_PLAY {year:1610}]->(theTempest), (rsc:Company {name:'RSC'}), (production1:Production {name:'Julius Caesar'}), (rsc)-[:PRODUCED]->(production1), (production1)-[:PRODUCTION_OF]->(juliusCaesar), (performance1:Performance {date:20120729}), (performance1)-[:PERFORMANCE_OF]->(production1), (production2:Production {name:'The Tempest'}), (rsc)-[:PRODUCED]->(production2), (production2)-[:PRODUCTION_OF]->(theTempest), (performance2:Performance {date:20061121}), (performance2)-[:PERFORMANCE_OF]->(production2), (performance3:Performance {date:20120730}), (performance3)-[:PERFORMANCE_OF]->(production1), (billy:User {name:'Billy'}), (review:Review {rating:5, review:'This was awesome!'}), (billy)-[:WROTE_REVIEW]->(review), (review)-[:RATED]->(performance1), (theatreRoyal:Venue {name:'Theatre Royal'}), (performance1)-[:VENUE]->(theatreRoyal), (performance2)-[:VENUE]->(theatreRoyal), (performance3)-[:VENUE]->(theatreRoyal), (greyStreet:Street {name:'Grey Street'}), (theatreRoyal)-[:STREET]->(greyStreet), (newcastle:City {name:'Newcastle'}), (greyStreet)-[:CITY]->(newcastle), (tyneAndWear:County {name:'Tyne and Wear'}), (newcastle)-[:COUNTY]->(tyneAndWear), (england:Country {name:'England'}), (tyneAndWear)-[:COUNTRY]->(england), (stratford:City {name:'Stratford upon Avon'}), (stratford)-[:COUNTRY]->(england), (rsc)-[:BASED_IN]->(stratford), (shakespeare)-[:BORN_IN]->stratford

前面的Cypher代碼有兩個(gè)不同的作用。它創(chuàng)建帶標(biāo)簽的節(jié)點(diǎn)（及其屬性），然后將它們與關(guān)系（必要時(shí)及其關(guān)系屬性）連接起來(lái)。

例如，?CREATE (shakespeare:Author {firstname:'William', lastname:'Shakespeare'})??創(chuàng)建一個(gè)Author節(jié)點(diǎn)，表示威廉·莎士比亞。

新創(chuàng)建的節(jié)點(diǎn)被分配給標(biāo)識(shí)符shakespeare。該shakespeare標(biāo)識(shí)符稍后在代碼中用于將關(guān)系附加到基礎(chǔ)節(jié)點(diǎn)。

例如，(shakespeare)-[:WROTE_PLAY {year:1599}]->(juliusCaesar)?創(chuàng)建了從莎士比亞到劇本Julius Caesar的WROTE關(guān)系。

該關(guān)系的?year屬性值為1599。

標(biāo)識(shí)符在當(dāng)前查詢(xún)范圍內(nèi)一直可用，但不再可用。如果我們希望為節(jié)點(diǎn)提供長(zhǎng)久的名稱(chēng)，我們只需為特定標(biāo)簽和鍵屬性組合創(chuàng)建索引。我們?cè)凇?strong>索引和約束”中討論索引。

與關(guān)系模型不同，這些命令不會(huì)在圖表中引入任何意外的復(fù)雜性。信息元模型（即通過(guò)標(biāo)簽和關(guān)系建立節(jié)點(diǎn)的結(jié)構(gòu)）與業(yè)務(wù)數(shù)據(jù)保持分離，業(yè)務(wù)數(shù)據(jù)僅作為屬性存在。我們?cè)僖膊槐負(fù)?dān)心外鍵和基數(shù)約束會(huì)污染我們的真實(shí)數(shù)據(jù)，因?yàn)樵趫D模型中，這兩者都是節(jié)點(diǎn)形式以及將它們互連的語(yǔ)義豐富的關(guān)系，是顯式的。

我們可以在以后的某個(gè)時(shí)間以?xún)煞N不同的方式修改圖形。當(dāng)然，我們可以繼續(xù)使用CREATE語(yǔ)句簡(jiǎn)單地添加到圖形中。但是我們也可以使用MERGE，它的語(yǔ)義是確保一旦執(zhí)行命令，節(jié)點(diǎn)和關(guān)系的特定子圖結(jié)構(gòu)（其中一些可能已經(jīng)存在，其中一些可能會(huì)丟失）已經(jīng)存在。在實(shí)踐中，當(dāng)我們添加到圖表中時(shí)，我們傾向于使用CREATE，并且不介意重復(fù)；而在域中不允許重復(fù)時(shí)，我們傾向于使用MERGE。

5.2.開(kāi)始查詢(xún)

現(xiàn)在我們有了一個(gè)圖，我們可以開(kāi)始查詢(xún)它了。在Cypher中，我們總是從圖中一個(gè)或多個(gè)眾所周知的起點(diǎn)（稱(chēng)為綁定節(jié)點(diǎn)）開(kāi)始查詢(xún)。 Cypher使用MATCH和WHERE子句中提供的任何標(biāo)簽和屬性謂詞，以及索引和約束提供的元數(shù)據(jù)，來(lái)找到錨定我們的圖形模式的起點(diǎn)。

例如，如果我們想了解有關(guān)皇家劇院表演的更多信息，我們將從皇家劇院節(jié)點(diǎn)開(kāi)始查詢(xún)，我們可以通過(guò)指定其Venue標(biāo)簽和name屬性來(lái)查找。但是，如果我們對(duì)某個(gè)人的評(píng)論更感興趣，則可以使用該人的節(jié)點(diǎn)作為查詢(xún)的起點(diǎn)，并在“User”標(biāo)簽和名稱(chēng)屬性組合上進(jìn)行匹配。

假設(shè)我們想了解在紐卡斯?fàn)柣始覄≡喊l(fā)生的所有莎士比亞活動(dòng)。這三件事—名為莎士比亞的作者，名為皇家劇院的場(chǎng)所和名為紐卡斯?fàn)柕某鞘小獮槲覀兊男虏樵?xún)提供了起點(diǎn)：

MATCH (theater:Venue {name:'Theatre Royal'}), (newcastle:City {name:'Newcastle'}), (bard:Author {lastname:'Shakespeare'})

該MATCH子句使用屬性key名稱(chēng)和屬性值Theatre Royal標(biāo)識(shí)所有Venue節(jié)點(diǎn)，并將它們綁定到標(biāo)識(shí)符Theater。（如果該圖中有許多Theatre Royal節(jié)點(diǎn)，該怎么辦？我們將盡快處理。）下一步，我們找到代表紐卡斯?fàn)柺械墓?jié)點(diǎn)；我們將此節(jié)點(diǎn)綁定到標(biāo)識(shí)符newcastle。最后，與先前的莎士比亞查詢(xún)一樣，要查找莎士比亞節(jié)點(diǎn)本身，我們將查找標(biāo)簽為Author且姓氏屬性為Shakespeare的節(jié)點(diǎn)。我們將此查詢(xún)的結(jié)果綁定到bard。

從現(xiàn)在開(kāi)始，在我們的查詢(xún)中，無(wú)論我們?cè)谀Ｊ街惺褂脴?biāo)識(shí)符Theater，Newcastle和Bard的哪個(gè)位置，該模式都將錨定到與這三個(gè)標(biāo)識(shí)符關(guān)聯(lián)的實(shí)際節(jié)點(diǎn)上。實(shí)際上，此信息將查詢(xún)綁定到圖形的特定部分，從而為我們提供了起點(diǎn)，以匹配緊鄰的節(jié)點(diǎn)和關(guān)系中的模式。

索引與約束

索引有助于優(yōu)化查找特定節(jié)點(diǎn)的過(guò)程。

在大多數(shù)情況下，查詢(xún)圖表時(shí)，我們很樂(lè)意讓遍歷過(guò)程發(fā)現(xiàn)滿足我們信息目標(biāo)的節(jié)點(diǎn)和關(guān)系。通過(guò)遵循與特定圖形模式匹配的關(guān)系，我們會(huì)遇到有助于查詢(xún)結(jié)果的元素。但是，在某些情況下，我們需要選擇特定的節(jié)點(diǎn)，而不是遍歷整個(gè)過(guò)程發(fā)現(xiàn)它們。例如，確定遍歷的起始節(jié)點(diǎn)需要我們根據(jù)標(biāo)簽和屬性值的某種組合來(lái)找到一個(gè)或多個(gè)特定節(jié)點(diǎn)。

為了支持有效的節(jié)點(diǎn)查找，Cypher允許我們?yōu)槊總€(gè)標(biāo)簽和屬性組合創(chuàng)建索引。對(duì)于唯一屬性值，我們還可以指定確保唯一性的約束。在我們需要直接查找場(chǎng)所的莎士比亞圖表中，我們可以選擇基于標(biāo)記為Venue的所有節(jié)點(diǎn)的名稱(chēng)屬性值來(lái)為其編制索引。為此的命令是：

CREATE INDEX ON :Venue(name)

為了確保所有國(guó)家/地區(qū)名稱(chēng)都是唯一的，我們可以添加唯一性約束：

CREATE CONSTRAINT ON (c:Country) ASSERT c.name IS UNIQUE

在現(xiàn)有數(shù)據(jù)庫(kù)上，索引將在后臺(tái)填充，并且在建立索引后即可使用。

查找不需要索引，但是可以通過(guò)添加索引來(lái)提高其性能。??MATCH (theater:Venue {name:'Theatre Royal'})無(wú)論有沒(méi)有索引都可以使用。但是在擁有數(shù)千個(gè)場(chǎng)所的大型數(shù)據(jù)集中，索引將有助于提高性能。如果沒(méi)有索引，則選擇Theatre Royal作為查詢(xún)的起點(diǎn)，將使Neo4j掃描并過(guò)濾所有標(biāo)記為Venue的節(jié)點(diǎn)。

5.3.聲明要查找的信息模式

Cypher中的MATCH子句是神奇的地方。由于CREATE子句試圖使用ASCII藝術(shù)來(lái)傳達(dá)意圖以描述圖的所需狀態(tài)，因此MATCH子句使用相同的語(yǔ)法來(lái)描述要在數(shù)據(jù)庫(kù)中發(fā)現(xiàn)的模式。我們已經(jīng)研究了一個(gè)非常簡(jiǎn)單的MATCH子句；現(xiàn)在我們來(lái)看一個(gè)更復(fù)雜的模式，它可以找到紐卡斯?fàn)柣始覄≡核猩勘葋喌谋硌?#xff1a;

MATCH (theater:Venue {name:'Theatre Royal'}),(newcastle:City {name:'Newcastle'}),(bard:Author {lastname:'Shakespeare'}),(newcastle)<-[:STREET|CITY*1..2]-(theater)<-[:VENUE]-()-[:PERFORMANCE_OF]->()-[:PRODUCTION_OF]->(play)<-[:WROTE_PLAY]-(bard) RETURN DISTINCT play.title AS play

這種MATCH模式使用了一些我們尚未遇到的語(yǔ)法元素。除了我們前面討論的錨定節(jié)點(diǎn)之外，它還使用模式節(jié)點(diǎn)，任意深度路徑和匿名節(jié)點(diǎn)。讓我們依次看一下其中的每個(gè)：

根據(jù)指定的標(biāo)簽和屬性值，將標(biāo)識(shí)符newcastle，Theater和bard錨定到圖中的實(shí)際節(jié)點(diǎn)。
如果我們的數(shù)據(jù)庫(kù)中有幾個(gè)皇家劇院(Theatre Royal)（例如，英國(guó)的普利茅斯，巴斯，溫徹斯特和諾里奇等城市都擁有皇家劇院），那么劇院將綁定到所有這些節(jié)點(diǎn)。為了將我們的模式限制為紐卡斯?fàn)柕幕始覄≡?Theatre Royal)，我們使用語(yǔ)法?<-[:STREET|CITY*1..2]-，這意味著劇院節(jié)點(diǎn)最多只能有兩個(gè)傳出的STREET and/or CITY關(guān)系從代表泰恩河畔紐卡斯?fàn)柺?#xff08;Newcastle-upon-Tyne）的節(jié)點(diǎn)出發(fā)。通過(guò)提供可變的深度路徑，我們?cè)试S使用相對(duì)較細(xì)粒度的地址層次結(jié)構(gòu)（例如，包括街道，地區(qū)或自治市鎮(zhèn)和城市）。
語(yǔ)法??(theater)<-[:VENUE]-() 使用匿名節(jié)點(diǎn)，因此括號(hào)為空。在了解數(shù)據(jù)的同時(shí)，我們希望匿名節(jié)點(diǎn)與性能匹配，但是由于我們對(duì)查詢(xún)或結(jié)果中其他位置的各個(gè)性能的詳細(xì)信息不感興趣，因此我們不會(huì)命名該節(jié)點(diǎn)或?qū)⑵浣壎ǖ?標(biāo)識(shí)符。
我們?cè)俅问褂媚涿?jié)點(diǎn)將性能鏈接到生產(chǎn) ( ()-[:PERFORMANCE_OF]->() ) 。如果我們有興趣返回表演和作品的詳細(xì)信息，則可以將這些出現(xiàn)的匿名節(jié)點(diǎn)替換為標(biāo)識(shí)符：(performance)-[:PERFORMANCE_OF]->(production)
MATCH的其余部分是簡(jiǎn)單的 (play)<-[:WROTE_PLAY]-(bard)? 節(jié)點(diǎn)到關(guān)系到節(jié)點(diǎn)模式匹配。這種模式確保我們只返回莎士比亞寫(xiě)的戲劇。由于（play）已加入到匿名制作節(jié)點(diǎn)，并且通過(guò)該節(jié)點(diǎn)又加入了表演節(jié)點(diǎn)，因此我們可以安全地推斷它已經(jīng)在紐卡斯?fàn)柕幕始覄≡哼M(jìn)行了表演。在命名播放節(jié)點(diǎn)時(shí)，我們將其帶入范圍，以便稍后在查詢(xún)中使用它。

運(yùn)行此查詢(xún)將返回在紐卡斯?fàn)柣始覄≡哼M(jìn)行的所有莎士比亞戲劇：

如果我們對(duì)莎士比亞在皇家劇院的整個(gè)歷史感興趣，那很好，但是如果我們僅對(duì)特定的戲劇，作品或表演感興趣，我們就需要以某種方式來(lái)限制結(jié)果。

5.4.約束匹配

我們使用WHERE子句約束圖匹配。通過(guò)指定以下一項(xiàng)或多項(xiàng)，WHERE允許我們從結(jié)果中消除匹配的子圖：

在匹配的子圖中必須存在（或不存在）某些路徑。
該節(jié)點(diǎn)必須具有某些標(biāo)簽或與某些名稱(chēng)的關(guān)系。
無(wú)論值如何，匹配節(jié)點(diǎn)和關(guān)系上的特定屬性都必須存在（或不存在）。
匹配的節(jié)點(diǎn)和關(guān)系上的某些屬性必須具有特定的值。
必須滿足其他謂詞的要求（例如，表演必須在特定日期或之前進(jìn)行）。

與描述結(jié)構(gòu)關(guān)系并為模式的各個(gè)部分分配標(biāo)識(shí)符的MATCH子句相比，WHERE約束了當(dāng)前的模式匹配。例如，讓我們想象一下，我們希望將結(jié)果的播放范圍限制在莎士比亞最后一個(gè)時(shí)期（通常被認(rèn)為始于1608年）。我們通過(guò)過(guò)濾匹配的WROTE_PLAY關(guān)系的year屬性來(lái)做到這一點(diǎn)。為了啟用此過(guò)濾，我們調(diào)整了MATCH子句，將WROTE_PLAY關(guān)系綁定到一個(gè)標(biāo)識(shí)符，我們將其稱(chēng)為w（關(guān)系標(biāo)識(shí)符在冒號(hào)之前加一個(gè)關(guān)系名稱(chēng)）。然后，我們添加WHERE子句，以對(duì)該關(guān)系的year屬性進(jìn)行過(guò)濾：

MATCH (theater:Venue {name:'Theatre Royal'}),(newcastle:City {name:'Newcastle'}),(bard:Author {lastname:'Shakespeare'}),(newcastle)<-[:STREET|CITY*1..2]-(theater)<-[:VENUE]-()-[:PERFORMANCE_OF]->()-[:PRODUCTION_OF]->(play)<-[w:WROTE_PLAY]-(bard) WHERE w.year > 1608 RETURN DISTINCT play.title AS play

添加此WHERE子句意味著，對(duì)于每個(gè)成功的匹配，數(shù)據(jù)庫(kù)都會(huì)檢查莎士比亞節(jié)點(diǎn)和匹配的劇本之間的WROTE_PLAY關(guān)系是否具有Year屬性，其年份值大于1608。與WROTE_PLAY關(guān)系的匹配如果年份值大于1608，則將通過(guò)測(cè)試; 這些戲劇將被包括在結(jié)果中。未通過(guò)測(cè)試的比賽將不包括在結(jié)果中。通過(guò)添加此子句，我們確保僅返回莎士比亞后期的演出：

+---------------+ | play | +---------------+ | "The Tempest" | +---------------+ 1 row

5.5.處理結(jié)果

借助Cypher的RETURN子句，我們可以對(duì)匹配的圖形數(shù)據(jù)執(zhí)行一些處理，然后再將其返回給執(zhí)行查詢(xún)的用戶（或應(yīng)用程序）。

正如我們?cè)谥暗牟樵?xún)中所看到的，我們最簡(jiǎn)單的方法就是返回找到的劇本：

RETURN DISTINCT play.title AS play

DISTINCT確保我們返回獨(dú)特的結(jié)果。由于每個(gè)劇本可以在同一個(gè)劇院中多次執(zhí)行，有時(shí)甚至在不同的作品中進(jìn)行，因此我們可以得到重復(fù)的劇本標(biāo)題。 DISTINCT過(guò)濾掉這些。

我們可以通過(guò)幾種方式來(lái)豐富此結(jié)果，包括聚合，排序，過(guò)濾和限制返回的數(shù)據(jù)。例如，如果我們只對(duì)符合條件的打法數(shù)量感興趣，則可以應(yīng)用count函數(shù)：

RETURN count(play)

如果要按演出次數(shù)對(duì)戲劇進(jìn)行排名，首先需要將MATCH子句中的PERFORMANCE_OF關(guān)系綁定到一個(gè)名為p的標(biāo)識(shí)符，然后我們可以對(duì)其進(jìn)行計(jì)數(shù)和排序：

MATCH (theater:Venue {name:'Theatre Royal'}),(newcastle:City {name:'Newcastle'}),(bard:Author {lastname:'Shakespeare'}),(newcastle)<-[:STREET|CITY*1..2]-(theater)<-[:VENUE]-()-[p:PERFORMANCE_OF]->()-[:PRODUCTION_OF]->(play)<-[:WROTE_PLAY]-(bard) RETURN play.title AS play, count(p) AS performance_count ORDER BY performance_count DESC

這里的RETURN子句使用標(biāo)識(shí)符p（綁定到MATCH子句中的PERFORMANCE_OF關(guān)系）對(duì)PERFORMANCE_OF關(guān)系的數(shù)量進(jìn)行計(jì)數(shù)，并將結(jié)果別名為performance_count。然后，它根據(jù)performance_count排序結(jié)果，并首先列出執(zhí)行最頻繁的播放：

+-------------------------------------+ | play | performance_count | +-------------------------------------+ | "Julius Caesar" | 2 | | "The Tempest" | 1 | +-------------------------------------+ 2 rows

5.6.查詢(xún)鏈接

在結(jié)束對(duì)Cypher的簡(jiǎn)要介紹之前，需要了解另外一個(gè)有用的功能-WITH子句。有時(shí)候，一次MATCH做所有您想做的事是不切實(shí)際（或不可能）的。 WITH子句允許我們將多個(gè)匹配項(xiàng)鏈接在一起，并將上一個(gè)查詢(xún)部分的結(jié)果傳遞到下一個(gè)查詢(xún)中。在以下示例中，我們找到了莎士比亞寫(xiě)的劇本，并根據(jù)寫(xiě)劇的年份對(duì)它們進(jìn)行排序，最新的優(yōu)先。然后使用WITH，將結(jié)果通過(guò)管道傳遞到RETURN子句，該子句使用collect函數(shù)生成有限的播放標(biāo)題列表：

MATCH (bard:Author {lastname:'Shakespeare'})-[w:WROTE_PLAY]->(play) WITH play ORDER BY w.year DESC RETURN collect(play.title) AS plays

對(duì)我們的樣本圖執(zhí)行此查詢(xún)將產(chǎn)生以下結(jié)果：

+---------------------------------+ | plays | +---------------------------------+ | ["The Tempest","Julius Caesar"] | +---------------------------------+ 1 row

WITH可以用于將只讀子句與以寫(xiě)為中心的SET操作分開(kāi)。更普遍的是，WITH通過(guò)允許我們將單個(gè)復(fù)雜查詢(xún)分解為幾個(gè)更簡(jiǎn)單的模式來(lái)幫助劃分和解決復(fù)雜查詢(xún)。

5.7.常見(jiàn)的建模陷阱

盡管圖建模是掌握問(wèn)題域中復(fù)雜性的一種非常有表現(xiàn)力的方式，但是僅憑表現(xiàn)力并不能保證特定的圖適合目的。實(shí)際上，在有些情況下，甚至我們每天使用圖形的人都會(huì)犯錯(cuò)。在本部分中，我們將研究出現(xiàn)問(wèn)題的模型。這樣，我們將學(xué)習(xí)如何在建模工作中及早發(fā)現(xiàn)問(wèn)題，以及如何解決這些問(wèn)題。

5.7.1.電子郵件出處問(wèn)題域

本示例涉及電子郵件通信的分析。溝通模式分析是一個(gè)經(jīng)典的圖形問(wèn)題，涉及到查詢(xún)圖形以發(fā)現(xiàn)主題專(zhuān)家，關(guān)鍵影響者以及傳播信息的通信渠道。但是，在這種情況下，我們不是在尋找積極的榜樣（以專(zhuān)家的形式），而是在尋找流氓：也就是說(shuō)，可疑的電子郵件通信模式會(huì)違反公司治理，甚至?xí)|犯法律。

5.7.2.明智的第一次迭代？

在分析領(lǐng)域時(shí)，我們了解了潛在的不法行為者用來(lái)掩蓋其足跡的所有聰明模式：使用盲目復(fù)制（BCC），使用別名-甚至與這些別名進(jìn)行對(duì)話以模仿實(shí)際業(yè)務(wù)涉眾之間的合法交互。基于此分析，我們生成了一個(gè)具有代表性的圖形模型，該模型似乎捕獲了所有相關(guān)實(shí)體及其活動(dòng)。

為了說(shuō)明這個(gè)早期模型，我們將使用Cypher的CREATE子句生成一些表示用戶和別名的節(jié)點(diǎn)。我們還將生成一個(gè)關(guān)系，該關(guān)系表明Alice是Bob的已知?jiǎng)e名之一。（我們假設(shè)底層圖形數(shù)據(jù)庫(kù)正在為這些節(jié)點(diǎn)建立索引，以便我們以后可以查找它們并將它們用作查詢(xún)的起點(diǎn)。）以下是Cypher查詢(xún)，用于創(chuàng)建我們的第一個(gè)圖形：

CREATE (alice:User {username:'Alice'}),(bob:User {username:'Bob'}),(charlie:User {username:'Charlie'}),(davina:User {username:'Davina'}),(edward:User {username:'Edward'}),(alice)-[:ALIAS_OF]->(bob)

生成的圖形模型使我們很容易觀察到Alice是Bob的別名，如圖3-7所示。

現(xiàn)在，我們通過(guò)用戶交換的電子郵件將他們聚集在一起：

MATCH (bob:User {username:'Bob'}),(charlie:User {username:'Charlie'}),(davina:User {username:'Davina'}),(edward:User {username:'Edward'}) CREATE (bob)-[:EMAILED]->(charlie),(bob)-[:CC]->(davina),(bob)-[:BCC]->(edward)

乍一看，這似乎是對(duì)該域的合理忠實(shí)表示。每個(gè)子句都易于從左到右閱讀，從而通過(guò)了我們的一項(xiàng)非正式測(cè)試，以確保準(zhǔn)確性。例如，我們從圖表中可以看到“Bob通過(guò)電子郵件發(fā)送給Charlie”。只有在有必要確切確定潛在的不法行為Bob（以及他的另一個(gè)自我是Alice）交換的內(nèi)容時(shí)，該模型的局限性才會(huì)出現(xiàn)。我們可以看到Bob CC’d或?BCC’d有一些人，但我們看不到最重要的東西：電子郵件本身。

第一次建模嘗試產(chǎn)生了一個(gè)以Bob為中心的星形圖形。他的電子郵件，復(fù)制和盲目復(fù)制行為由從Bob延伸到代表他的郵件收件人的節(jié)點(diǎn)的關(guān)系表示。但是，如圖3-8所示，數(shù)據(jù)中最關(guān)鍵的元素，即實(shí)際的電子郵件，丟失了。

這種圖結(jié)構(gòu)是有損的，當(dāng)我們提出以下內(nèi)容時(shí)，這一事實(shí)變得明顯查詢(xún)：

MATCH (bob:User {username:'Bob'})-[e:EMAILED]->(charlie:User {username:'Charlie'}) RETURN e

此查詢(xún)返回Bob和Charlie之間的EMAILED關(guān)系（Bob發(fā)送給Charlie的每封電子郵件可能都有一個(gè)）。這告訴我們電子郵件已經(jīng)交換過(guò)，但是卻沒(méi)有告訴我們有關(guān)電子郵件本身的信息：

+----------------+ | e | +----------------+ | :EMAILED[1] {} | +----------------+ 1 row

我們可能認(rèn)為可以通過(guò)在EMAILED關(guān)系中添加屬性以表示電子郵件的屬性來(lái)糾正這種情況，但這只是時(shí)間的作用。即使將屬性附加到每個(gè)EMAILED關(guān)系中，我們?nèi)詫o(wú)法在EMAILED，CC和BCC關(guān)系之間建立關(guān)聯(lián)。也就是說(shuō)，我們將無(wú)法說(shuō)出復(fù)制了哪些電子郵件，復(fù)制了哪些電子郵件以及復(fù)制給了誰(shuí)。

事實(shí)是，我們不經(jīng)意間犯了一個(gè)簡(jiǎn)單的建模錯(cuò)誤，這主要是由于英語(yǔ)使用不多而不是圖論的任何缺點(diǎn)造成的。我們?nèi)粘Ｊ褂玫恼Z(yǔ)言使我們專(zhuān)注于動(dòng)詞“電子郵件”而不是電子郵件本身，因此，我們制作的模型缺乏真正的領(lǐng)域洞察力。

用英語(yǔ)，將短語(yǔ)“Bob sent an email to Charlie”縮寫(xiě)為“Bob emailed Charlie.”很容易和方便。在大多數(shù)情況下，名詞（實(shí)際電子郵件）的丟失并不重要，因?yàn)橐鈭D仍然很清楚。但是，在我們的法證場(chǎng)景中，這些被遺忘的陳述是有問(wèn)題的。意圖保持不變，但是Bob所發(fā)送的電子郵件的數(shù)量，內(nèi)容和收件人的詳細(xì)信息由于被折疊成EMAILED關(guān)系而丟失了，而不是被明確地建模為自身的節(jié)點(diǎn)。

5.7.3.第二次的魅力

要修復(fù)我們的有損模型，我們需要插入電子郵件節(jié)點(diǎn)以表示業(yè)務(wù)中交換的真實(shí)電子郵件，并擴(kuò)展我們的關(guān)系名稱(chēng)集以涵蓋電子郵件支持的整個(gè)尋址字段。現(xiàn)在，而不是創(chuàng)建像這樣的有損結(jié)構(gòu)：

CREATE (bob)-[:EMAILED]->(charlie)

我們將改為創(chuàng)建更詳細(xì)的結(jié)構(gòu)，如下所示：

CREATE (email_1:Email {id:'1', content:'Hi Charlie, ... Kind regards, Bob'}),(bob)-[:SENT]->(email_1),(email_1)-[:TO]->(charlie),(email_1)-[:CC]->(davina),(email_1)-[:CC]->(alice),(email_1)-[:BCC]->(edward)

這導(dǎo)致了另一個(gè)星形圖形結(jié)構(gòu)，但是這次電子郵件處于中心位置，如圖3-9所示。

當(dāng)然，在真實(shí)的系統(tǒng)中，會(huì)有更多這樣的電子郵件，每個(gè)電子郵件都有自己復(fù)雜的交互網(wǎng)絡(luò)供我們探索。很容易想象，隨著時(shí)間的推移，隨著電子郵件服務(wù)器記錄交互，還會(huì)執(zhí)行更多的CREATE語(yǔ)句，就像這樣（為簡(jiǎn)潔起見(jiàn)，我們省略了錨節(jié)點(diǎn)）：

CREATE (email_1:Email {id:'1', content:'email contents'}),(bob)-[:SENT]->(email_1),(email_1)-[:TO]->(charlie),(email_1)-[:CC]->(davina),(email_1)-[:CC]->(alice),(email_1)-[:BCC]->(edward); CREATE (email_2:Email {id:'2', content:'email contents'}),(bob)-[:SENT]->(email_2),(email_2)-[:TO]->(davina),(email_2)-[:BCC]->(edward); CREATE (email_3:Email {id:'3', content:'email contents'}),(davina)-[:SENT]->(email_3),(email_3)-[:TO]->(bob),(email_3)-[:CC]->(edward); CREATE (email_4:Email {id:'4', content:'email contents'}),(charlie)-[:SENT]->(email_4),(email_4)-[:TO]->(bob),(email_4)-[:TO]->(davina),(email_4)-[:TO]->(edward); CREATE (email_5:Email {id:'5', content:'email contents'}),(davina)-[:SENT]->(email_5),(email_5)-[:TO]->(alice),(email_5)-[:BCC]->(bob),(email_5)-[:BCC]->(edward);

這將導(dǎo)致我們?cè)趫D3-10中看到更復(fù)雜，更有趣的圖形。

現(xiàn)在，我們可以查詢(xún)此圖以識(shí)別潛在的可疑行為：

MATCH (bob:User {username:'Bob'})-[:SENT]->(email)-[:CC]->(alias),(alias)-[:ALIAS_OF]->(bob) RETURN email.id

在這里，我們檢索Bob抄送給他自己的別名之一的地方發(fā)送的所有電子郵件。與此模式匹配的所有電子郵件都表明流氓行為。而且由于Cypher和基礎(chǔ)圖形數(shù)據(jù)庫(kù)都具有圖形相似性，因此這些查詢(xún)（即使是在大型數(shù)據(jù)集上）也可以非常快速地運(yùn)行。該查詢(xún)返回以下結(jié)果：

+------------------------------------------+ | email | +------------------------------------------+ | Node[6]{id:"1",content:"email contents"} | +------------------------------------------+ 1 row

5.7.4.不斷發(fā)展的領(lǐng)域

與任何數(shù)據(jù)庫(kù)一樣，我們的圖形服務(wù)于一個(gè)可能隨著時(shí)間而發(fā)展的系統(tǒng)。那么當(dāng)圖演化時(shí)我們?cè)撛趺崔k？我們?cè)趺粗朗裁磯牧?#xff0c;或者實(shí)際上，我們?cè)趺粗滥臣乱呀?jīng)壞了？事實(shí)是，我們無(wú)法完全避免在圖形數(shù)據(jù)庫(kù)中進(jìn)行遷移：就像任何數(shù)據(jù)存儲(chǔ)一樣，它們是生活中不可或缺的事實(shí)。但是在圖形數(shù)據(jù)庫(kù)中，它們通常要簡(jiǎn)單得多。

在圖中，要添加新的事實(shí)或構(gòu)圖，我們傾向于添加新的節(jié)點(diǎn)和關(guān)系，而不是更改模型。使用新的關(guān)系添加到圖形不會(huì)影響任何現(xiàn)有查詢(xún)，并且是完全安全的。使用現(xiàn)有的關(guān)系類(lèi)型來(lái)更改圖形，以及更改現(xiàn)有節(jié)點(diǎn)的屬性（不僅是屬性值）可能是安全的，但是我們需要運(yùn)行一組代表性的查詢(xún)，以確保在結(jié)構(gòu)化之后圖形仍然適合于目的變化。但是，這些活動(dòng)與我們?cè)诔Ｒ?guī)數(shù)據(jù)庫(kù)操作期間執(zhí)行的動(dòng)作完全相同，因此在圖形世界中，遷移實(shí)際上只是照常進(jìn)行。

至此，我們有了一個(gè)圖表，描述了誰(shuí)發(fā)送和接收了電子郵件，以及電子郵件本身的內(nèi)容。但是，當(dāng)然，電子郵件的樂(lè)趣之一是收件人可以轉(zhuǎn)發(fā)或回復(fù)他們收到的電子郵件。這樣可以增加互動(dòng)和知識(shí)共享，但是在某些情況下會(huì)泄漏重要的業(yè)務(wù)信息。由于我們正在尋找可疑的通信模式，因此我們也應(yīng)該考慮轉(zhuǎn)發(fā)和答復(fù)。

乍一看，似乎不需要使用數(shù)據(jù)庫(kù)遷移來(lái)更新我們的圖以支持我們的新用例。我們可以做的最簡(jiǎn)單的添加就是將FORWARDED和EPLIED_TO關(guān)系添加到圖中，如圖3-11所示。這樣做不會(huì)影響任何先前存在的查詢(xún)，因?yàn)樗鼈儧](méi)有經(jīng)過(guò)編碼以識(shí)別新的關(guān)系。

但是，這種方法很快被證明是不合適的。與我們最初使用EMAILED關(guān)系的方式幾乎相同，添加FORWARDED或REPLIED關(guān)系是幼稚和有損的。為了說(shuō)明這一點(diǎn)，請(qǐng)考慮以下CREATE語(yǔ)句：

... MATCH (email:Email {id:'1234'}) CREATE (alice)-[:REPLIED_TO]->(email) CREATE (davina)-[:FORWARDED]->(email)-[:TO]->(charlie)

在第一個(gè)CREATE語(yǔ)句中，我們?cè)噲D記錄Alice回復(fù)特定電子郵件的事實(shí)。從左至右閱讀該陳述是合乎邏輯的，但這種情緒是有損的-我們無(wú)法確定愛(ài)麗絲是回信給所有電子郵件收件人還是直接回信給作者。我們所知道的是，已經(jīng)發(fā)送了一些答復(fù)。第二條語(yǔ)句從左到右也很讀：達(dá)維娜將電子郵件轉(zhuǎn)發(fā)給了查理。但是我們已經(jīng)使用TO關(guān)系來(lái)指示給定的電子郵件具有一個(gè)TO標(biāo)頭，用于標(biāo)識(shí)主要收件人。在這里重復(fù)使用TO使得無(wú)法分辨誰(shuí)是收件人以及誰(shuí)收到了電子郵件的轉(zhuǎn)發(fā)版本。

要解決此問(wèn)題，我們必須考慮領(lǐng)域的基礎(chǔ)。回復(fù)電子郵件本身就是新的電子郵件，但它也是回復(fù)。換句話說(shuō)，回復(fù)具有兩個(gè)角色，在圖中可以通過(guò)將兩個(gè)標(biāo)簽Email和Reply附加到回復(fù)節(jié)點(diǎn)來(lái)表示。無(wú)論回復(fù)是發(fā)給原始發(fā)件人，所有收件人還是子集，都可以使用相同的熟悉的TO，CC和BCC關(guān)系輕松建模，而原始電子郵件本身可以通過(guò)REPLY_TO關(guān)系進(jìn)行引用。這是一系列修改后的一系列寫(xiě)法，它們是由多個(gè)電子郵件操作產(chǎn)生的（再次，我們省略了必要的節(jié)點(diǎn)錨定）：

CREATE (email_6:Email {id:'6', content:'email'}),(bob)-[:SENT]->(email_6),(email_6)-[:TO]->(charlie),(email_6)-[:TO]->(davina); CREATE (reply_1:Email:Reply {id:'7', content:'response'}),(reply_1)-[:REPLY_TO]->(email_6),(davina)-[:SENT]->(reply_1),(reply_1)-[:TO]->(bob),(reply_1)-[:TO]->(charlie); CREATE (reply_2:Email:Reply {id:'8', content:'response'}),(reply_2)-[:REPLY_TO]->(email_6),(bob)-[:SENT]->(reply_2),(reply_2)-[:TO]->(davina),(reply_2)-[:TO]->(charlie),(reply_2)-[:CC]->(alice); CREATE (reply_3:Email:Reply {id:'9', content:'response'}),(reply_3)-[:REPLY_TO]->(reply_1),(charlie)-[:SENT]->(reply_3),(reply_3)-[:TO]->(bob),(reply_3)-[:TO]->(davina); CREATE (reply_4:Email:Reply {id:'10', content:'response'}),(reply_4)-[:REPLY_TO]->(reply_3),(bob)-[:SENT]->(reply_4),(reply_4)-[:TO]->(charlie),(reply_4)-[:TO]->(davina);

這將在圖3-12中創(chuàng)建該圖，該圖顯示了眾多答復(fù)和逐項(xiàng)答復(fù)。

現(xiàn)在，很容易看到誰(shuí)回復(fù)了鮑勃的原始電子郵件。首先，找到感興趣的電子郵件，然后與所有傳入的REPLY_TO關(guān)系（可能有多個(gè)答復(fù)）進(jìn)行匹配，然后從此處與傳入的SENT關(guān)系進(jìn)行匹配：這揭示了發(fā)件人。在Cypher中，這很容易表達(dá)。實(shí)際上，Cypher使得查找回復(fù)到回復(fù)的過(guò)程變得很容易，依此類(lèi)推可以任意深度（盡管在這里我們將深度限制為四級(jí)）：

MATCH p=(email:Email {id:'6'})<-[:REPLY_TO*1..4]-(:Reply)<-[:SENT]-(replier) RETURN replier.username AS replier, length(p) - 1 AS depth ORDER BY depth

在這里，我們捕獲每個(gè)匹配的路徑，并將其綁定到標(biāo)識(shí)符p。然后，在RETURN子句中，計(jì)算答復(fù)鏈的長(zhǎng)度（SENT關(guān)系減去1），并返回答復(fù)者的姓名和答復(fù)者的深度。此查詢(xún)返回以下結(jié)果：

+-------------------+ | replier | depth | +-------------------+ | "Davina" | 1 | | "Bob" | 1 | | "Charlie" | 2 | | "Bob" | 3 | +-------------------+ 4 rows

我們看到Davina和Bob都直接回復(fù)了Bob的原始電子郵件； Charlie回答了其中一項(xiàng)答復(fù)；然后Bob回復(fù)了其中一封回復(fù)。

轉(zhuǎn)發(fā)電子郵件的方式與此類(lèi)似，可以將其視為新電子郵件，恰好包含原始電子郵件的某些文本。與回復(fù)情況一樣，我們明確地對(duì)新電子郵件建模。我們還會(huì)引用轉(zhuǎn)發(fā)郵件中的原始電子郵件，以便始終提供詳細(xì)而準(zhǔn)確的出處數(shù)據(jù)。如果轉(zhuǎn)發(fā)的郵件本身是轉(zhuǎn)發(fā)的，則同樣適用，依此類(lèi)推。例如，如果愛(ài)麗絲(Alice)（鮑勃（Bob）的另一位自我）通過(guò)電子郵件向鮑勃（Bob）嘗試建立單獨(dú)的具體身份，然后Bob（希望進(jìn)行一些變通）將其轉(zhuǎn)發(fā)給查理（Charlie），然后查理（Charlie）將其轉(zhuǎn)發(fā)給達(dá)維納（Davina），我們實(shí)際上有三封電子郵件考慮。假設(shè)用戶（及其別名）已經(jīng)存在于數(shù)據(jù)庫(kù)中，在Cypher中，我們將審核信息寫(xiě)入數(shù)據(jù)庫(kù)，如下所示：

CREATE (email_11:Email {id:'11', content:'email'}),(alice)-[:SENT]->(email_11)-[:TO]->(bob); CREATE (email_12:Email:Forward {id:'12', content:'email'}),(email_12)-[:FORWARD_OF]->(email_11),(bob)-[:SENT]->(email_12)-[:TO]->(charlie); CREATE (email_13:Email:Forward {id:'13', content:'email'}),(email_13)-[:FORWARD_OF]->(email_12),(charlie)-[:SENT]->(email_13)-[:TO]->(davina);

完成這些寫(xiě)操作后，我們的數(shù)據(jù)庫(kù)將包含圖3-13所示的子圖。

使用此圖，我們可以確定轉(zhuǎn)發(fā)的電子郵件鏈的各種路徑。

MATCH (email:Email {id:'11'})<-[f:FORWARD_OF*]-(:Forward) RETURN count(f)

此查詢(xún)從給定的電子郵件開(kāi)始，然后與轉(zhuǎn)發(fā)的電子郵件樹(shù)中所有傳入的FOR WARD_OF關(guān)系進(jìn)行任何深度的匹配。這些關(guān)系綁定到標(biāo)識(shí)符f。為了計(jì)算電子郵件被轉(zhuǎn)發(fā)的次數(shù)，我們使用Cypher的count函數(shù)計(jì)算與f綁定的FORWARD_OF關(guān)系的數(shù)量。在此示例中，我們看到原始電子郵件已轉(zhuǎn)發(fā)兩次：

+----------+ | count(f) | +----------+ | 2 | +----------+ 1 row

6.識(shí)別節(jié)點(diǎn)和關(guān)系

建模過(guò)程可以最好地概括為嘗試創(chuàng)建一個(gè)圖形結(jié)構(gòu)，以表達(dá)我們要針對(duì)我們的領(lǐng)域提出的問(wèn)題。也就是說(shuō)，設(shè)計(jì)可查詢(xún)性：

描述激發(fā)我們模型的客戶或最終用戶目標(biāo)。

將這些目標(biāo)重寫(xiě)為我們的領(lǐng)域要問(wèn)的問(wèn)題。

確定出現(xiàn)在這些問(wèn)題中的實(shí)體和關(guān)系。

將這些實(shí)體和關(guān)系轉(zhuǎn)換為Cypher路徑表達(dá)式。

使用類(lèi)似于我們用來(lái)建模領(lǐng)域的路徑表達(dá)式，以圖形模式表達(dá)我們想以域模式問(wèn)我們的領(lǐng)域的問(wèn)題。

通過(guò)檢查用于描述領(lǐng)域的語(yǔ)言，我們可以非常快速地確定圖中的核心元素：

普通名詞成為標(biāo)簽：例如“ user”和“ email”成為標(biāo)簽User和Email。
帶對(duì)象的動(dòng)詞成為關(guān)系名稱(chēng)：例如，“sent”和“wrote”成為SENT和WROTE。
專(zhuān)有名詞（例如，人或公司的名稱(chēng)）是指事物的一個(gè)實(shí)例，我們使用一個(gè)或多個(gè)屬性來(lái)捕獲該事物的屬性，將其建模為節(jié)點(diǎn)。

7.避免反模式

通常，不要將實(shí)體編碼為關(guān)系。使用關(guān)系來(lái)傳達(dá)有關(guān)實(shí)體之間如何關(guān)聯(lián)以及這些關(guān)系的質(zhì)量的語(yǔ)義。

通常，不要將實(shí)體編碼為關(guān)系。使用關(guān)系來(lái)傳達(dá)有關(guān)實(shí)體之間如何關(guān)聯(lián)以及這些關(guān)系的質(zhì)量的語(yǔ)義。域?qū)嶓w在語(yǔ)音中并不總是立即可見(jiàn)，因此我們必須仔細(xì)考慮我們實(shí)際處理的名詞。 Verbing是名詞將名詞轉(zhuǎn)換為動(dòng)詞的語(yǔ)言習(xí)慣，通常可以隱藏名詞和相應(yīng)域?qū)嶓w的存在。技術(shù)和商業(yè)術(shù)語(yǔ)在此類(lèi)新詞中尤為流行：如我們所見(jiàn)，我們互相“email”，而不是發(fā)送電子郵件，“google”獲取結(jié)果，而不是搜索Google。

同樣重要的是要認(rèn)識(shí)到圖是自然可加的結(jié)構(gòu)。很自然地添加有關(guān)域?qū)嶓w及其使用新節(jié)點(diǎn)和新關(guān)系的相互關(guān)系方面的事實(shí)，即使感覺(jué)好像我們正在向數(shù)據(jù)庫(kù)中充斥大量數(shù)據(jù)。通常，在寫(xiě)入時(shí)嘗試合并數(shù)據(jù)元素以保持查詢(xún)時(shí)的效率是一種不好的做法。如果我們按照我們要對(duì)數(shù)據(jù)提出的問(wèn)題進(jìn)行建模，則將出現(xiàn)域的準(zhǔn)確表示。有了這個(gè)數(shù)據(jù)模型，我們可以相信圖形數(shù)據(jù)庫(kù)在讀取時(shí)表現(xiàn)良好。

圖形數(shù)據(jù)庫(kù)即使存儲(chǔ)大量數(shù)據(jù)也能保持快速查詢(xún)時(shí)間。當(dāng)學(xué)習(xí)構(gòu)造我們的圖而不對(duì)它們進(jìn)行規(guī)范化時(shí)，學(xué)會(huì)信任我們的圖數(shù)據(jù)庫(kù)非常重要。

8.摘要

圖形數(shù)據(jù)庫(kù)使軟件專(zhuān)業(yè)人員可以使用圖形表示問(wèn)題域，然后在運(yùn)行時(shí)持久保存并查詢(xún)?cè)搱D形。我們可以使用圖來(lái)清楚地描述問(wèn)題域；圖數(shù)據(jù)庫(kù)然后允許我們以在域和數(shù)據(jù)之間保持高親和力的方式存儲(chǔ)此表示。此外，圖形建模消除了使用復(fù)雜數(shù)據(jù)管理代碼對(duì)數(shù)據(jù)進(jìn)行規(guī)范化和非規(guī)范化的需求。

但是，我們?cè)S多人對(duì)于使用圖進(jìn)行建模將是新手。我們創(chuàng)建的圖形應(yīng)易于查詢(xún)，同時(shí)避免混淆實(shí)體和操作-可能會(huì)丟失有用的領(lǐng)域知識(shí)的不良做法。盡管圖形建模沒(méi)有絕對(duì)的對(duì)與錯(cuò)，但本章中的指南將幫助您創(chuàng)建可以在許多迭代中滿足系統(tǒng)需求的圖形數(shù)據(jù)，同時(shí)始終與代碼演進(jìn)保持同步。

了解了圖形數(shù)據(jù)建模之后，您現(xiàn)在可以考慮進(jìn)行圖形數(shù)據(jù)庫(kù)項(xiàng)目。在下一章中，我們將研究規(guī)劃和交付圖形數(shù)據(jù)庫(kù)解決方案所涉及的內(nèi)容。

總結(jié)

以上是生活随笔為你收集整理的Neo4j【有与无】【N3】使用图进行数据建模的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： jetson用什么编译器_Jetson
下一篇： DDOS攻击-压力测试工具webbenc