當(dāng)前位置：首頁 >

mongodb查询值不为空_MongoDB使用规范(上)

發(fā)布時間：2025/3/13 43 豆豆

生活随笔收集整理的這篇文章主要介紹了 mongodb查询值不为空_MongoDB使用规范(上) 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

MongoDB設(shè)計規(guī)范

1.1 mongoDB庫的設(shè)計

l 不能為空字符串(“”)

l 不能以$開頭

l 不能包含.(點號)和空字符串

l 數(shù)據(jù)庫名區(qū)分大小寫(建議數(shù)據(jù)庫名全部使用小寫)

l 禁止使用數(shù)字打頭的庫名

l 數(shù)據(jù)庫名最多為 64字符

l 不要與系統(tǒng)保留的數(shù)據(jù)庫名相同,這些數(shù)據(jù)庫包括:admin,local,config等

1.2 mongoDB集合的設(shè)計

l 集合名全部小寫

l 禁止使用任何 " _ "（下劃線）以外的特殊字符

l 禁止使用數(shù)字打頭的集合名稱

l 集合名稱最多為 64字符

l 一個庫中寫入較大的集合會影響其它集合的讀寫性能

l 如果評估單集合數(shù)據(jù)量較大，可以將一個大表拆分為多個小表，然后將每一個小表存放在獨立的庫中，由于MongoDB是庫級鎖，因此這樣做可以大幅減少并發(fā)寫入帶來的鎖爭用問題

l 集合名不能為空字符串(“”)

l 不能包含0或空字符,這個字符表示鍵的結(jié)尾

l 集合名不能以”system.”開頭,此前綴是系統(tǒng)本身保留的

l 集合名不能包含$字符(注:可包含 . 點號)

1.3 mongoDB文檔的設(shè)計

l 文檔中的 key 禁止使用任何 " _ "（下劃線）以外的特殊字符

l 盡量使用自定義 _id ，如：向 _id 中寫入自定義內(nèi)容（默認(rèn)索引）

l 盡量不要讓數(shù)組字段成為查詢條件

l 盡量存放統(tǒng)一了大小寫后的數(shù)據(jù)

l 盡量將同樣類型的文檔存放在一個集合中，將不同類型的文檔分散在不同的集合中

l 相同類型的文檔能夠大幅度提高索引利用率，如果文檔混雜存放則可能會出現(xiàn)查詢經(jīng)常需要全表掃描的情況

l 盡可能的縮短key的長度(注意是盡可能！會涉及到性能問題)

1.4 mongoDB索引的設(shè)計

優(yōu)先使用覆蓋索引（特定場景）

所有的查詢字段是索引的一部分

所有的查詢返回字段在同一個索引中

2. 備注-查詢會默認(rèn)帶出_id

！盡量遵循最左前綴原則

l 索引名稱長度不要超過 128 字符

l 應(yīng)盡量綜合評估查詢場景,通過評估盡可能的將單列索引并入組合索引以降低索引數(shù)量，結(jié)合上面2點

l 在創(chuàng)建組合索引的時候，應(yīng)評估索引中包含的字段，盡量將數(shù)據(jù)基數(shù)大的字段放在組合索引的前面

l 在數(shù)據(jù)量較大的時候，MongoDB 索引的創(chuàng)建是一個緩慢的過程，所以應(yīng)當(dāng)在上前線或數(shù)據(jù)量變得很大前盡量評估，按需創(chuàng)建會用到的索引

l MongoDB 的索引創(chuàng)建是庫級鎖，在索引創(chuàng)建時該集合所在庫不可讀寫，所以如需添加索引，請聯(lián)系 DBA

l 特別注意基于地理位置的索引建立時會帶來的問題。

建議

盡量在創(chuàng)建集合時，規(guī)劃好索引，在集合為空的時候創(chuàng)建索引

針對已有大量數(shù)據(jù)的集合，盡量后臺建索引--后臺建索引時并不是 bulk cursor，而是使用普通的 cursor 逐條插入，故不會去競爭 checkpoint 的鎖

1.5 查詢優(yōu)化

MongoDB可以自動對查詢進(jìn)行優(yōu)化并盡可能高效的對查詢進(jìn)行評估。評估通常包括基于謂詞的數(shù)據(jù)選擇和基于排序類別的數(shù)據(jù)排序。查詢優(yōu)化器會周期性的執(zhí)行多種查詢計劃并選擇性能變現(xiàn)最好的索引。這種經(jīng)驗式測試結(jié)果會以緩存查詢計劃存儲下來并周期性執(zhí)行。

MongoDB有explain工具，可以顯示每個查詢優(yōu)化前后的信息，包括：

l 文檔返回數(shù)

l 文檔讀取數(shù)

l 使用了哪個索引

l 查詢是否被覆蓋，如果覆蓋了，則文檔不需要讀取以返回數(shù)據(jù)

l 內(nèi)存排序是否執(zhí)行了，如果執(zhí)行了，就意味著加入索引會更高效

l 索引掃描數(shù)量

l 查詢多長時間可以返回結(jié)果（僅限于使用executionStats模式）

l 那個可選擇的查詢方案被否決了（僅限于allPlansExecution模式）

如果查詢的過程花費(fèi)不到1ms，那么解釋計劃會顯示0ms，通常，在一個優(yōu)化過的系統(tǒng)中，查詢時間就不應(yīng)該超過1ms。執(zhí)行計劃確定后，之前的緩存查詢計劃就會放棄，但是多樣的測試索引計劃還是會重復(fù)執(zhí)行保證最佳的執(zhí)行計劃會得到實施。查詢計劃可以在不執(zhí)行查詢的前提下對查詢過程進(jìn)行估算并返回結(jié)果，DBA不需要等到查詢過程執(zhí)行完就可以評估使用哪個查詢計劃。

1.6 注意點

索引的數(shù)量越少越好

每當(dāng)你建立一個索引時，系統(tǒng)會為你添加一個索引表，用于索引指定的列，然而當(dāng)你對已建立索引的列進(jìn)行插入或修改時，數(shù)據(jù)庫則需要對原來的索引表進(jìn)行重新排序，重新排序的過程非常消耗性能，但應(yīng)對少量的索引壓力并不是很大，但如果索引的數(shù)量較多的話對于性能的影響可想而知。所以在創(chuàng)建索引時需要謹(jǐn)慎建立索引，要把每個索引的功能都要發(fā)揮到極致，也就是說在可以滿足索引需求的情況下，索引的數(shù)量越少越好。

2. 索引列顆粒越小越好

　什么叫顆粒越小越好？在索引列中每個數(shù)據(jù)的重復(fù)數(shù)量稱為顆粒，也叫作索引的基數(shù)。如果數(shù)據(jù)的顆粒過大，索引就無法發(fā)揮該有的性能。例如，我們擁有一個"age"列索引，如果在"age"列中，20歲占了50%，如果現(xiàn)在要查詢一個20歲，名叫"Tom"的人，我們則需要在表的50%的數(shù)據(jù)中查詢，索引的作用大大降低。所以，我們在建立索引時要盡量將數(shù)據(jù)顆粒小的列放在索引左側(cè)，以保證索引發(fā)揮最大的作用。

1.7 shard key選擇

分片方式

范圍分片，能很好的支持范圍分片

hash分片，讀寫更好的均分到各個shard

2. shard key選擇應(yīng)結(jié)合實際業(yè)務(wù)需求，需要避免的問題

1. shard key 取值范圍太小（low cardinality）

2. shard key某個值的文檔特別多，這樣導(dǎo)致單個chunk特別大（jumbo chunk），會影響chunk遷移及負(fù)載均衡

3. 根據(jù)非shard key進(jìn)行查詢，更新操作會變成scatter-gather查詢，影響效率

備注：執(zhí)行創(chuàng)建片鍵時，若collection不為空，則需要提前創(chuàng)建好索引；反之，則為創(chuàng)建該索引

3 . 選擇片鍵設(shè)計

1. 對集合進(jìn)行分片時，要選擇一或兩個字段用于拆分?jǐn)?shù)據(jù)，這個鍵就叫做片鍵。

2. 拆分?jǐn)?shù)據(jù)最常用的數(shù)據(jù)分發(fā)方式有三種：升序片鍵、隨機(jī)分發(fā)的片鍵和基于位置的片鍵。

1). 升序片鍵：升序片鍵通常有點類似于"date"字段或者是ObjectId，是一種隨著時間穩(wěn)定增長的字段。缺點：例如ObjectId可能會導(dǎo)致接下來的所有的寫入操作都在同一塊分片上。

2). 隨機(jī)分發(fā)的片鍵：隨機(jī)分發(fā)的片鍵可以是用戶名，郵件地址，UDID，MD5散列值或者數(shù)據(jù)集中其他一些沒有規(guī)律的鍵。缺點：MongoDB在隨機(jī)訪問超出RAM大小的數(shù)據(jù)時效率不高。

3). 基于位置的片鍵：基于位置的片鍵可以是用戶的IP、經(jīng)緯度、或者地址。這里的"位置"比較抽象，不必與實際的物理位置字段相關(guān)。

如果希望特定范圍內(nèi)的塊出現(xiàn)在特定的分片中，可以為分片添加tag，然后為塊指定相應(yīng)的tag

3.1 片鍵策略：

1). 散列片鍵：如果追求的是數(shù)據(jù)加載速度的極致，那么散列片鍵是最佳選擇。散列片鍵可使其他任何鍵隨機(jī)分發(fā)，因此，如果打算在大量查詢中使用使用升序鍵，但同時又希望寫入數(shù)據(jù)隨機(jī)分發(fā)的話，

散列片鍵會是一個非常好的選擇。缺點：無法使用散列片鍵做指定目標(biāo)的范圍查找。

創(chuàng)建步驟： db.users.ensureIndex({"username":"hashed"}) , sh.shardCollection("app.users",{"username":"hashed"})

2). GridFS的散列片鍵

3). 流水策略：如果有一些服務(wù)器比其他服務(wù)器更強(qiáng)大，我們可能希望讓這些強(qiáng)大的服務(wù)器處理更多的負(fù)載。比如說：加入有一個使用SSD的分片能夠處理10倍于其他機(jī)器的負(fù)載。我們可以強(qiáng)制將所有新數(shù)據(jù)插入到SSD，然后讓均衡器將舊的塊移動到其他分片上。

a. 為SSD指定一個標(biāo)簽：sh.addShardTag("shard-name","ssd")

b. 將升序鍵的當(dāng)前值一直到正無窮范圍的塊都指定分布在SSD分片上：sh.addTagRange("dbName.collName",{"_id":ObjectId()},...{"_id":MaxKey},"ssd") ，所有插入請求均會路由到這個塊上，這個塊始終位于標(biāo)簽的ssd的分片上。

c. 除非修改標(biāo)簽范圍，否則從升序鍵的當(dāng)前值一直到正無窮都被固定在這個分片上。可以創(chuàng)建一個定時任務(wù)每天更新一次標(biāo)簽范圍：

use config

var tag =db.tags.findOne({"ns":"dbName.collName",..."max":{"shardKey":MaxKey}})

tag.min.shardKey = ObjectId()

db.tags.save(tag)

這樣前一天的數(shù)據(jù)就會被移動到其他分片上了。

此策略的另一個缺點：需要修改才能進(jìn)行擴(kuò)展。如果寫請求超出了SSD的處理能力，無法進(jìn)行負(fù)載均衡。

4). 多熱點：寫請求分布在集群中時，分片是最高效的。這種技術(shù)會創(chuàng)建多個熱點(最好在每個分片上都創(chuàng)建幾個熱點)，寫請求于是會均衡地分布在集群內(nèi)，而在單個分片上則是以升序分布的。

為了實現(xiàn)這種方式，需使用復(fù)合片鍵。復(fù)合片鍵中的第一個值只是比較粗略的隨機(jī)值，勢也比較低。

3.2 片鍵規(guī)則和指導(dǎo)方針：

1). 片鍵限制：片鍵不可以是數(shù)組。文檔一旦插入，其片鍵就無法修改了。要修改文檔的片鍵值，就必須先刪除文檔。

2). 片鍵的勢：選擇一個值會變化的的鍵非常重要，即值很多，隨著數(shù)據(jù)量的增大可以分出更多的片鍵。分片在勢比較高的字段上性能更佳。

3.3 控制數(shù)據(jù)分發(fā)

1). 對多個數(shù)據(jù)庫和集合使用一個集群：通過tag標(biāo)記，將重要的數(shù)據(jù)放到性能更好的服務(wù)器上，將不重要的數(shù)據(jù)放在性能一般的服務(wù)器上。

2). 手動分片：如果不希望數(shù)據(jù)被自動分發(fā)，可以關(guān)閉均衡器，使用moveChunk命令手動對數(shù)據(jù)進(jìn)行遷移。

開發(fā)規(guī)范

1 模式設(shè)計

1.1不要按照關(guān)系型來設(shè)計表結(jié)構(gòu)

MongoDB可以讓你像關(guān)系型數(shù)據(jù)庫一樣設(shè)計表結(jié)構(gòu)，但是它不支持外鍵，也不支持復(fù)雜的Join！如果你的程序發(fā)現(xiàn)有大量使用JOIN的地方，那你的設(shè)計可能需要重新來過。參照以下相關(guān)模式設(shè)計建議。

1.2 數(shù)據(jù)庫集合（collection）的數(shù)量不宜太多

MongoDB的模式設(shè)計基于靈活豐富的JSON文檔模式。在很多情況下，一個MongoDB應(yīng)用的數(shù)據(jù)庫內(nèi)的集合（表）的數(shù)量應(yīng)該遠(yuǎn)遠(yuǎn)小于使用關(guān)系數(shù)據(jù)庫的同類型應(yīng)用。MongoDB表設(shè)計不遵從第三范式。MongoDB的數(shù)據(jù)模型非常接近于對象模型，所以基本上就是按照主要的Domain object的數(shù)量來建相應(yīng)的集合。根據(jù)經(jīng)驗，一般小型應(yīng)用的集合數(shù)量通常在幾個之內(nèi)，中大型的應(yīng)用會在10多個或者最多幾十個。

1.3 不要害怕數(shù)據(jù)冗余

MongoDB模式設(shè)計不能按照第三范式，很多時候允許數(shù)據(jù)在多個文檔中重復(fù)，比如說，在每一個員工的文檔中重復(fù)他的部門名字，就是一個可以接受的做法。如果部門名字改了，可以執(zhí)行一個update({},{}, {multi:true}) 的多文檔更新來一次性把部門名字更新掉。

1.4 適合和不適合冗余的數(shù)據(jù)類型

一般來說，如果某個字段的數(shù)據(jù)值經(jīng)常會變，則不太適合被大量冗余到別的文檔或者別的集合里面去。舉例來說，如果我們是在做一些股票類型資產(chǎn)管理，可能有很多人都購買了Apple的股票，但是如果把經(jīng)常變動的股價冗余到客戶的文檔里，由于股票價格變動頻繁，會導(dǎo)致有大量的更新操作。從另外一個角度來說，如果是一些不經(jīng)常變的字段，如客戶的姓名，地址，部門等，則可以盡管進(jìn)行冗余

對 1：N（一些）的關(guān)系使用全部內(nèi)嵌

對于一對多的關(guān)系，如一個人有幾個聯(lián)系方式，一本書有10幾個章節(jié)，等等，建議使用內(nèi)嵌方式，把N的數(shù)據(jù)以數(shù)組形式來描述，如：(查詢性能優(yōu))

> db.person.findOne(){user_id: 'tjworks',name: 'TJ Tang', contact : [{ type: 'mobile', number: '1856783691' },{ type: 'wechat', number: 'tjtang826'}]}

對 1: NN (很多) 的關(guān)系使用ID內(nèi)嵌

有些時候這個一對多的多端數(shù)量較大，比如說，一個部門內(nèi)有多少員工。在華為一個三級部門可能有數(shù)千員工，這個時候如果把所有員工信息直接內(nèi)嵌到部門內(nèi)肯定不是個好的選擇，有可能會超出16MB的文檔限制。這個時候可以采用引用ID的方式：（更新性能優(yōu)）

> db.departments.findOne() {name : 'Enterprise BG',president: 'Zhang San',employees : [ // array of references to Employee colletionObjectID('AAAA'), ObjectID('F17C'), ObjectID('D2AA'),// etc] }

如果需要查詢部門下員工相關(guān)信息，你可以使用$lookup聚合操作符來把員工信息進(jìn)行關(guān)聯(lián)并返回。

對 1: NNN (很多) 的關(guān)系使用

如果一對多情況下，這個多端數(shù)量無限大并會頻繁增長，比如說，一個測量儀的每分鐘讀數(shù)，一年下來有幾十萬條，這個時候即使是把ID放到數(shù)組里都會管理不便，這個時候就應(yīng)該把多端的數(shù)據(jù)創(chuàng)建一個集合，并在那個集合的文檔里加入對主文檔的連接引用，如：

> db.sensors.findOne(){_id : ObjectID('AAAB'),name : 'engine temperature',vin : '4GD93039GI239',engine_id: '20394802',manuafacture: 'First Motor',production_date: '2014-02-01'...}>db.readings.findOne(){time : ISODate("2014-03-28T09:42:41.382Z"),sensor: ObjectID('AAAB'),reading: 67.4 }

1.5把二進(jìn)制大文件和元數(shù)據(jù)分集合存放

如果你有需要把PDF文件，圖片，甚至小視頻等二進(jìn)制文件需要管理，建議使用MongoDB 的GridFS API 或者自己手動分集合來分開管理二進(jìn)制數(shù)據(jù)和元數(shù)據(jù)。

1.6 經(jīng)常更新的數(shù)據(jù)不要放在嵌套數(shù)組內(nèi)

數(shù)組是用來表達(dá) 1對多關(guān)系的利器，但是MongoDB對嵌套的數(shù)組內(nèi)元素缺乏直接更新能力。比如說：

{name: "Annice",courses: [{ name: "English", score: 97 },{ name: "Math", score: 89 },{ name: "Physics", score: 95 }] }

這樣設(shè)計沒有嵌套數(shù)組，我們可以直接對 Math的score 修改為99：

db.students.update({name: "Annice"， "courses.name":"Math"}, {$set:{"courses.$.score": 99 }})

注意數(shù)組定位符 $ 的用法，$ 表示當(dāng)前匹配的第一個數(shù)組元素的在數(shù)組內(nèi)的索引。

但是下面這種情況就涉及到了數(shù)組嵌套：

{name: "Annice",courses: [{ name: "Math", scores: [ {term: 1, score: 80} ,{term: 2, score: 90}] },{ name: "Physics", score: 95 }]}

這個時候如果你想對Math course的term 1的Score進(jìn)行修改，你就需要把 scores 這個數(shù)組整個調(diào)到內(nèi)存然后在代碼里對這個嵌套數(shù)組的元素進(jìn)行修改。這是因為MongoDB的數(shù)組定位符 $ 只對第一層數(shù)組有效。

當(dāng)然，如果你的模型不需要修改嵌套的數(shù)組內(nèi)元素，那么這條就不適用。

1.程序配置

1.1.1 設(shè)定合適的MongoDB連接池大小（Connections Per Host）

Java驅(qū)動的默認(rèn)連接池大小是100（具體默認(rèn)值以 Driver 的文檔為準(zhǔn)）。建議按照應(yīng)用的實際情況做調(diào)整。對壓力較小的應(yīng)用可以適當(dāng)調(diào)小減少對應(yīng)用服務(wù)器的資源占用。

舉個例子，Mongod 的連接數(shù)限制為2000(shard的maxConns)，應(yīng)用業(yè)務(wù)上有40個服務(wù)進(jìn)程可能同時訪問這個Mongod，這時每個進(jìn)程里的 MongoClient 的連接數(shù)則應(yīng)該限制在 2000 / 40 = 50 以下（連接復(fù)制集時，MongoClient 還要跟復(fù)制集的每個成員建立一條連接，用于監(jiān)控復(fù)制集后端角色的變化情況）

1.1.2 正確使用寫關(guān)注設(shè)置（Write Concern）

MongoDB的建議最小部署是一個復(fù)制集，包含3個數(shù)據(jù)節(jié)點。默認(rèn)情況下應(yīng)用的寫操作（更新，插入或者刪除）在主節(jié)點上完成后就會立即返回。寫操作則通過OPLOG方式在后臺異步方式復(fù)制到其他節(jié)點。在極端情況下，這些寫操作可能還未在復(fù)制到從節(jié)點的時候主節(jié)點就出現(xiàn)宕機(jī)。這個時候發(fā)生主備節(jié)點切換，原主節(jié)點的寫操作會被回滾到文件而對應(yīng)用不可見。為防止這種情況出現(xiàn)，MongoDB建議對重要的數(shù)據(jù)使用 {w: “marjority”} 的選項。{w:”majority”} 可以保證數(shù)據(jù)在復(fù)制到多數(shù)節(jié)點后才返回成功結(jié)果。使用該機(jī)制可以有效防止數(shù)據(jù)回滾的發(fā)生。

另外你可以使用 {j:1} （可以和 w:”majrotiy” 結(jié)合使用）來指定數(shù)據(jù)必須在寫入WAL日志之后才向應(yīng)用返回成功確認(rèn)。這個會導(dǎo)致寫入性能有所下降，但是對于重要的數(shù)據(jù)可以考慮使用。

1.1.3 正確使用讀選項設(shè)置（Read Preference）

MongoDB由于是一個分布式系統(tǒng)，一份數(shù)據(jù)會在多個節(jié)點上進(jìn)行復(fù)制。從哪個節(jié)點上讀數(shù)據(jù)，要根據(jù)應(yīng)用讀數(shù)據(jù)的需求而定。以下是集中可以配置的讀選項：

primary: 默認(rèn)，在主節(jié)點上讀數(shù)據(jù)

primaryPreferred: 先從主節(jié)點上讀，如果未成功再到任意一臺從節(jié)點上讀

secondary：在從節(jié)點上讀數(shù)據(jù)（當(dāng)有多臺節(jié)點的時候，隨機(jī)的使用某一臺從節(jié)點）

secondaryPreferred：首先從從節(jié)點上讀，如果從節(jié)點由于某種原因不能提供服務(wù)，則從主節(jié)點上進(jìn)行讀

nearest：從距離最近的節(jié)點來讀。距離由ping操作的時間來決定。

除第一個選項之外，其他讀選項都存在讀到的數(shù)據(jù)不是最新的可能。原因是數(shù)據(jù)的復(fù)制是后臺異步完成的。

1.1.4 不要實例化多個MongoClient

MongoClient是個線程安全的類，自帶線程池。通常在一個JVM內(nèi)不要實例化多個MongoClient實例，避免連接數(shù)過多和資源的不必要浪費(fèi)。

1.1.5 對寫操作使用Retry機(jī)制

MongoDB使用復(fù)制集技術(shù)可以實現(xiàn)99.999%的高可用。當(dāng)一臺主節(jié)點不能寫入時，系統(tǒng)會自動故障轉(zhuǎn)移到另一臺節(jié)點。轉(zhuǎn)移可能會耗時幾秒鐘，在這期間應(yīng)用應(yīng)該捕獲相應(yīng)的Exception并執(zhí)行重試操作。重試應(yīng)該有backoff機(jī)制，例如，分別在1s，2s，4s，8s等時候進(jìn)行重試。

1.1.6 避免使用太長的字段名

MongoDB 沒有表結(jié)構(gòu)定義。每個文檔的結(jié)構(gòu)由每個文檔內(nèi)部的字段決定。所有字段名會在每個文檔內(nèi)重復(fù)。使用太長的字段名字會導(dǎo)致對內(nèi)存、網(wǎng)絡(luò)帶寬更多的需求。（由于壓縮技術(shù)，長字段名對硬盤上的存儲不會有太多占用）

1.1.7 使用有規(guī)律的命名方式

如： School， Course, StudentRecord

或者：school, course, stuent_record

1.1.8 正確使用更新語句

不要把MongoDB和普通的鍵值型數(shù)據(jù)庫（KV）視為等同。MongoDB支持和關(guān)系型數(shù)據(jù)庫update語句類似的in place update。你只需要在update語句中指定需要更新的字段，而不是整個文檔對象。

舉例來說，加入我想把用戶的名字從TJ改為Tang Jianfa.

不建議的做法：

user = db.users.findOne({_id: 101});

user.name="Tang Jianfa"

db.users.save(user);

建議的做法：

user = db.users.findOne({_id: 101});

// do certain things

db.users.update({_id:101}, {$set: {name: "Tang Jianfa"}});

使用投射（projection）來減少返回的內(nèi)容

MongoDB 支持類似于SQL語句里面的select，可以對返回的字段進(jìn)行過濾。使用Projection可以減少返回的內(nèi)容，降低網(wǎng)絡(luò)傳輸?shù)牧亢痛a中轉(zhuǎn)化成對象所需的時間。

1.1.9 使用TTL來自動刪除過期的數(shù)據(jù)

很多時候我們用MongoDB來存儲一些時效性的數(shù)據(jù)，如7天的監(jiān)控數(shù)據(jù)。與其自己寫個后臺腳本定期清理過期數(shù)據(jù)，你可以使用TTL索引來讓MongoDB自動刪除過期數(shù)據(jù)：

db.data.createIndex({create_time:1}, {expireAfterSeconds: 7*24*3600})

分表可采用drop的方式

1.1.10 使用execute命令來實現(xiàn)upsert

有些時候你不知道一條文檔數(shù)據(jù)是否已經(jīng)在庫里存在。這個時候你要么先查詢一下，要么就是使用upsert語句。在SpringData下面upsert語句需要你把每個字段的值都在upsert語句中格式化出來。字段多的時候未免有些繁瑣。SpringData MongoDB里面的MongoTemplate有個execute方法可以用來實現(xiàn)一個DB調(diào)用，也不用繁瑣的把所有字段羅列出來的例子。

public boolean persistEmployee(Employee employee) throws Exception {BasicDBObject dbObject = new BasicDBObject();mongoTemplate.getConverter().write(employee, dbObject);mongoTemplate.execute(Employee.class, new CollectionCallback<Object>() {public Object doInCollection(DBCollection collection) throws MongoException, DataAccessException {collection.update(new Query(Criteria.where("name").is(employee.getName())).getQueryObject(),dbObject,true, // means upsert - truefalse // multi update – false);return null;}});return true;}

Java API 操作

需要導(dǎo)入的文件：

import com.mongodb.MongoClient; import com.mongodb.MongoClientURI; import com.mongodb.ServerAddress; import com.mongodb.MongoCredential; import com.mongodb.MongoClientOptions; import java.util.Arrays;

使用MongoClient連接MongoDB，該MongoClient實例表示到數(shù)據(jù)庫的連接池，即使你有多個線程，也只需使用一個MongoClient。如果創(chuàng)建了多個MongoClient，可以使用MongoClient.close()進(jìn)行關(guān)閉。

1.1 連接單獨的MongoDB

可以實例化一個沒有任何參數(shù)的MongoClient對象來連接到在本地主機(jī)上運(yùn)行的MongoDB實例（默認(rèn)端口27017）：

MongoClient mongoClient = new MongoClient(); 可以明確指定主機(jī)名以連接到在指定主機(jī)上運(yùn)行的MongoDB實例（默認(rèn)端口27017）： MongoClient mongoClient = new MongoClient( "host1" );

可以明確指定主機(jī)名和端口：

MongoClient mongoClient = new MongoClient( "host1" , 27017 );

可以指定MongoClientURI連接字符串

MongoClient mongoClient = new MongoClient(new MongoClientURI

("mongodb://host1:27017"));

1.2 連接副本集

可以使用MongoClientURI指定副本集成員：

1. 指定至少兩個成員：

MongoClient mongoClient = new MongoClient( new MongoClientURI( "mongodb://host1:27017,host2:27017,host3:27017"));

2. 指定至少一個成員并且標(biāo)明replicaSet：

MongoClient mongoClient = new MongoClient( new MongoClientURI( "mongodb://host1:27017,host2:27017,host3:27017/?replicaSet=myReplicaSet"));

重點：MongoDB復(fù)制集里Primary節(jié)點是不固定的，當(dāng)遇到復(fù)制集輪轉(zhuǎn)升級、Primary宕機(jī)、網(wǎng)絡(luò)分區(qū)等場景時，復(fù)制集可能會選舉出一個新的Primary，而原來的Primary則會降級為Secondary，即發(fā)生主備切換。總而言之，MongoDB復(fù)制集里Primary節(jié)點是不固定的。

當(dāng)連接復(fù)制集時，如果只指定Primary的地址來連接，當(dāng)時可能可以正確讀寫數(shù)據(jù)的，但一旦復(fù)制集發(fā)生主備切換，你連接的Primary會降級為Secondary，你將無法繼續(xù)執(zhí)行寫操作，這將嚴(yán)重影響到你的線上服務(wù)。

所以生產(chǎn)環(huán)境千萬不要只連Primary。建議連接參數(shù)里面把所有主從節(jié)點都加上，使得能夠自動識別主節(jié)點。

1.3連接分片集群

連接單個mongos:

MongoClient mongoClient = new MongoClient( "localhost" , 27017 );MongoClient mongoClient = new MongoClient(new MongoClientURI( "mongodb://localhost:27017"));

連接多個mongos：

MongoClient mongoClient = new MongoClient(new MongoClientURI( "mongodb://host1:27017,host2:27017"));

重點：連接分片集群時，務(wù)必確保 MongoDB URI 里包含2個及以上的mongos地址，來實現(xiàn)負(fù)載均衡及高可用。客戶端會自動將請求分散到多個mongos 上，以實現(xiàn)負(fù)載均衡；同時，當(dāng)URI 里 mongos 數(shù)量在2個及以上時，當(dāng)有mongos故障時，客戶端能自動進(jìn)行 failover，將請求都分散到狀態(tài)正常的 mongos 上。

1.4 數(shù)據(jù)庫和集合

MongoDB存儲的一條數(shù)據(jù)叫做文檔，文檔儲存在集合里，集合儲存在數(shù)據(jù)庫中。

進(jìn)行之后操作前需要引入的文件：

import com.mongodb.MongoClient; import com.mongodb.client.MongoCollection; import com.mongodb.client.MongoDatabase; import static com.mongodb.client.model.Filters.*; import com.mongodb.client.model.CreateCollectionOptions; import com.mongodb.client.model.ValidationOptions;

連接集合

首先連接MongoDB：

MongoClient mongoClient = new MongoClient();

一旦你有一個MongoClient實例連接到MongoDB部署，使用它的getDatabase()方法來訪問數(shù)據(jù)庫。

為該getDatabase()方法指定數(shù)據(jù)庫的名稱。如果數(shù)據(jù)庫不存在，那么MongoDB會在首次存儲該數(shù)據(jù)庫的數(shù)據(jù)時創(chuàng)建數(shù)據(jù)庫。

MongoDatabase database = mongoClient.getDatabase("test");

注意：MongoDatabase 實例是不可變的。

一旦你有一個MongoDatabase實例，使用它的getCollection() 方法來訪問一個集合。

為該getCollection()方法指定集合的名稱。如果一個集合不存在，當(dāng)你第一次存儲該集合的數(shù)據(jù)時，MongoDB會創(chuàng)建該集合。

MongoCollection<Document> coll = database.getCollection("myTestCollection");

注意：MongoCollection實例是不可變的。

每次執(zhí)行完后，切記要關(guān)閉連接

MongoClient.close()

總結(jié)

以上是生活随笔為你收集整理的mongodb查询值不为空_MongoDB使用规范(上)的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： python写后台接口请求出错_pyth
下一篇： java 算法_JAVA经典算法40题