mongodb查询值不为空_MongoDB使用规范(上)
MongoDB設(shè)計規(guī)范
1.1 mongoDB庫的設(shè)計
1.2 mongoDB集合的設(shè)計
1.3 mongoDB文檔的設(shè)計
1.4 mongoDB索引的設(shè)計
所有的查詢字段是索引的一部分
所有的查詢返回字段在同一個索引中
2. 備注-查詢會默認(rèn)帶出_id
!盡量遵循最左前綴原則
l 索引名稱長度不要超過 128 字符
l 應(yīng)盡量綜合評估查詢場景,通過評估盡可能的將單列索引并入組合索引以降低索引數(shù)量,結(jié)合上面2點
l 在創(chuàng)建組合索引的時候,應(yīng)評估索引中包含的字段,盡量將數(shù)據(jù)基數(shù)大的字段放在組合索引的前面
l 在數(shù)據(jù)量較大的時候,MongoDB 索引的創(chuàng)建是一個緩慢的過程,所以應(yīng)當(dāng)在上前線或數(shù)據(jù)量變得很大前盡量評估,按需創(chuàng)建會用到的索引
l MongoDB 的索引創(chuàng)建是庫級鎖,在索引創(chuàng)建時該集合所在庫不可讀寫,所以如需添加索引,請聯(lián)系 DBA
l 特別注意基于地理位置的索引建立時會帶來的問題。
建議
盡量在創(chuàng)建集合時,規(guī)劃好索引,在集合為空的時候創(chuàng)建索引
針對已有大量數(shù)據(jù)的集合,盡量后臺建索引--后臺建索引時并不是 bulk cursor,而是使用普通的 cursor 逐條插入,故不會去競爭 checkpoint 的鎖
1.5 查詢優(yōu)化
MongoDB可以自動對查詢進(jìn)行優(yōu)化并盡可能高效的對查詢進(jìn)行評估。評估通常包括基于謂詞的數(shù)據(jù)選擇和基于排序類別的數(shù)據(jù)排序。查詢優(yōu)化器會周期性的執(zhí)行多種查詢計劃并選擇性能變現(xiàn)最好的索引。這種經(jīng)驗式測試結(jié)果會以緩存查詢計劃存儲下來并周期性執(zhí)行。
MongoDB有explain工具,可以顯示每個查詢優(yōu)化前后的信息,包括:
l 文檔返回數(shù)
l 文檔讀取數(shù)
l 使用了哪個索引
l 查詢是否被覆蓋,如果覆蓋了,則文檔不需要讀取以返回數(shù)據(jù)
l 內(nèi)存排序是否執(zhí)行了,如果執(zhí)行了,就意味著加入索引會更高效
l 索引掃描數(shù)量
l 查詢多長時間可以返回結(jié)果(僅限于使用executionStats模式)
l 那個可選擇的查詢方案被否決了(僅限于allPlansExecution模式)
如果查詢的過程花費(fèi)不到1ms,那么解釋計劃會顯示0ms,通常,在一個優(yōu)化過的系統(tǒng)中,查詢時間就不應(yīng)該超過1ms。執(zhí)行計劃確定后,之前的緩存查詢計劃就會放棄,但是多樣的測試索引計劃還是會重復(fù)執(zhí)行保證最佳的執(zhí)行計劃會得到實施。查詢計劃可以在不執(zhí)行查詢的前提下對查詢過程進(jìn)行估算并返回結(jié)果,DBA不需要等到查詢過程執(zhí)行完就可以評估使用哪個查詢計劃。
1.6 注意點
每當(dāng)你建立一個索引時,系統(tǒng)會為你添加一個索引表,用于索引指定的列,然而當(dāng)你對已建立索引的列進(jìn)行插入或修改時,數(shù)據(jù)庫則需要對原來的索引表進(jìn)行重新排序,重新排序的過程非常消耗性能,但應(yīng)對少量的索引壓力并不是很大,但如果索引的數(shù)量較多的話對于性能的影響可想而知。所以在創(chuàng)建索引時需要謹(jǐn)慎建立索引,要把每個索引的功能都要發(fā)揮到極致,也就是說在可以滿足索引需求的情況下,索引的數(shù)量越少越好。
2. 索引列顆粒越小越好
什么叫顆粒越小越好?在索引列中每個數(shù)據(jù)的重復(fù)數(shù)量稱為顆粒,也叫作索引的基數(shù)。如果數(shù)據(jù)的顆粒過大,索引就無法發(fā)揮該有的性能。例如,我們擁有一個"age"列索引,如果在"age"列中,20歲占了50%,如果現(xiàn)在要查詢一個20歲,名叫"Tom"的人,我們則需要在表的50%的數(shù)據(jù)中查詢,索引的作用大大降低。所以,我們在建立索引時要盡量將數(shù)據(jù)顆粒小的列放在索引左側(cè),以保證索引發(fā)揮最大的作用。
1.7 shard key選擇
范圍分片,能很好的支持范圍分片
hash分片,讀寫更好的均分到各個shard
2. shard key選擇應(yīng)結(jié)合實際業(yè)務(wù)需求,需要避免的問題
1. shard key 取值范圍太小(low cardinality)
2. shard key某個值的文檔特別多,這樣導(dǎo)致單個chunk特別大(jumbo chunk),會影響chunk遷移及負(fù)載均衡
3. 根據(jù)非shard key進(jìn)行查詢,更新操作會變成scatter-gather查詢,影響效率
備注:執(zhí)行創(chuàng)建片鍵時,若collection不為空,則需要提前創(chuàng)建好索引;反之,則為創(chuàng)建該索引
3 . 選擇片鍵設(shè)計
1. 對集合進(jìn)行分片時,要選擇一或兩個字段用于拆分?jǐn)?shù)據(jù),這個鍵就叫做片鍵。
2. 拆分?jǐn)?shù)據(jù)最常用的數(shù)據(jù)分發(fā)方式有三種:升序片鍵、隨機(jī)分發(fā)的片鍵和基于位置的片鍵。
1). 升序片鍵:升序片鍵通常有點類似于"date"字段或者是ObjectId,是一種隨著時間穩(wěn)定增長的字段。缺點:例如ObjectId可能會導(dǎo)致接下來的所有的寫入操作都在同一塊分片上。
2). 隨機(jī)分發(fā)的片鍵:隨機(jī)分發(fā)的片鍵可以是用戶名,郵件地址,UDID,MD5散列值或者數(shù)據(jù)集中其他一些沒有規(guī)律的鍵。缺點:MongoDB在隨機(jī)訪問超出RAM大小的數(shù)據(jù)時效率不高。
3). 基于位置的片鍵:基于位置的片鍵可以是用戶的IP、經(jīng)緯度、或者地址。這里的"位置"比較抽象,不必與實際的物理位置字段相關(guān)。
如果希望特定范圍內(nèi)的塊出現(xiàn)在特定的分片中,可以為分片添加tag,然后為塊指定相應(yīng)的tag
3.1 片鍵策略:
1). 散列片鍵:如果追求的是數(shù)據(jù)加載速度的極致,那么散列片鍵是最佳選擇。散列片鍵可使其他任何鍵隨機(jī)分發(fā),因此,如果打算在大量查詢中使用使用升序鍵,但同時又希望寫入數(shù)據(jù)隨機(jī)分發(fā)的話,
散列片鍵會是一個非常好的選擇。缺點:無法使用散列片鍵做指定目標(biāo)的范圍查找。
創(chuàng)建步驟: db.users.ensureIndex({"username":"hashed"}) , sh.shardCollection("app.users",{"username":"hashed"})
2). GridFS的散列片鍵
3). 流水策略:如果有一些服務(wù)器比其他服務(wù)器更強(qiáng)大,我們可能希望讓這些強(qiáng)大的服務(wù)器處理更多的負(fù)載。比如說:加入有一個使用SSD的分片能夠處理10倍于其他機(jī)器的負(fù)載。我們可以強(qiáng)制將所有新數(shù)據(jù)插入到SSD,然后讓均衡器將舊的塊移動到其他分片上。
a. 為SSD指定一個標(biāo)簽:sh.addShardTag("shard-name","ssd")
b. 將升序鍵的當(dāng)前值一直到正無窮范圍的塊都指定分布在SSD分片上:sh.addTagRange("dbName.collName",{"_id":ObjectId()},...{"_id":MaxKey},"ssd") ,所有插入請求均會路由到這個塊上,這個塊始終位于標(biāo)簽的ssd的分片上。
c. 除非修改標(biāo)簽范圍,否則從升序鍵的當(dāng)前值一直到正無窮都被固定在這個分片上。可以創(chuàng)建一個定時任務(wù)每天更新一次標(biāo)簽范圍:
use config
var tag =db.tags.findOne({"ns":"dbName.collName",..."max":{"shardKey":MaxKey}})
tag.min.shardKey = ObjectId()
db.tags.save(tag)
這樣前一天的數(shù)據(jù)就會被移動到其他分片上了。
此策略的另一個缺點:需要修改才能進(jìn)行擴(kuò)展。如果寫請求超出了SSD的處理能力,無法進(jìn)行負(fù)載均衡。
4). 多熱點:寫請求分布在集群中時,分片是最高效的。這種技術(shù)會創(chuàng)建多個熱點(最好在每個分片上都創(chuàng)建幾個熱點),寫請求于是會均衡地分布在集群內(nèi),而在單個分片上則是以升序分布的。
為了實現(xiàn)這種方式,需使用復(fù)合片鍵。復(fù)合片鍵中的第一個值只是比較粗略的隨機(jī)值,勢也比較低。
3.2 片鍵規(guī)則和指導(dǎo)方針:
1). 片鍵限制:片鍵不可以是數(shù)組。文檔一旦插入,其片鍵就無法修改了。要修改文檔的片鍵值,就必須先刪除文檔。
2). 片鍵的勢:選擇一個值會變化的的鍵非常重要,即值很多,隨著數(shù)據(jù)量的增大可以分出更多的片鍵。分片在勢比較高的字段上性能更佳。
3.3 控制數(shù)據(jù)分發(fā)
1). 對多個數(shù)據(jù)庫和集合使用一個集群:通過tag標(biāo)記,將重要的數(shù)據(jù)放到性能更好的服務(wù)器上,將不重要的數(shù)據(jù)放在性能一般的服務(wù)器上。
2). 手動分片:如果不希望數(shù)據(jù)被自動分發(fā),可以關(guān)閉均衡器,使用moveChunk命令手動對數(shù)據(jù)進(jìn)行遷移。
開發(fā)規(guī)范
1 模式設(shè)計
1.1不要按照關(guān)系型來設(shè)計表結(jié)構(gòu)
MongoDB可以讓你像關(guān)系型數(shù)據(jù)庫一樣設(shè)計表結(jié)構(gòu),但是它不支持外鍵,也不支持復(fù)雜的Join!如果你的程序發(fā)現(xiàn)有大量使用JOIN的地方,那你的設(shè)計可能需要重新來過。參照以下相關(guān)模式設(shè)計建議。
1.2 數(shù)據(jù)庫集合(collection)的數(shù)量不宜太多
MongoDB的模式設(shè)計基于靈活豐富的JSON文檔模式。在很多情況下,一個MongoDB應(yīng)用的數(shù)據(jù)庫內(nèi)的集合(表)的數(shù)量應(yīng)該遠(yuǎn)遠(yuǎn)小于使用關(guān)系數(shù)據(jù)庫的同類型應(yīng)用。MongoDB表設(shè)計不遵從第三范式。MongoDB的數(shù)據(jù)模型非常接近于對象模型,所以基本上就是按照主要的Domain object的數(shù)量來建相應(yīng)的集合。根據(jù)經(jīng)驗,一般小型應(yīng)用的集合數(shù)量通常在幾個之內(nèi),中大型的應(yīng)用會在10多個或者最多幾十個。
1.3 不要害怕數(shù)據(jù)冗余
MongoDB模式設(shè)計不能按照第三范式,很多時候允許數(shù)據(jù)在多個文檔中重復(fù),比如說,在每一個員工的文檔中重復(fù)他的部門名字,就是一個可以接受的做法。如果部門名字改了,可以執(zhí)行一個update({},{}, {multi:true}) 的多文檔更新來一次性把部門名字更新掉。
1.4 適合和不適合冗余的數(shù)據(jù)類型
一般來說,如果某個字段的數(shù)據(jù)值經(jīng)常會變,則不太適合被大量冗余到別的文檔或者別的集合里面去。舉例來說,如果我們是在做一些股票類型資產(chǎn)管理, 可能有很多人都購買了Apple的股票,但是如果把經(jīng)常變動的股價冗余到客戶的文檔里,由于股票價格變動頻繁,會導(dǎo)致有大量的更新操作。從另外一個角度來說,如果是一些不經(jīng)常變的字段,如客戶的姓名,地址,部門等,則可以盡管進(jìn)行冗余
對 1:N(一些)的關(guān)系使用全部內(nèi)嵌
對于一對多的關(guān)系,如一個人有幾個聯(lián)系方式,一本書有10幾個章節(jié),等等,建議使用內(nèi)嵌方式,把N的數(shù)據(jù)以數(shù)組形式來描述,如:(查詢性能優(yōu))
> db.person.findOne(){user_id: 'tjworks',name: 'TJ Tang', contact : [{ type: 'mobile', number: '1856783691' },{ type: 'wechat', number: 'tjtang826'}]}對 1: NN (很多) 的關(guān)系使用ID內(nèi)嵌
有些時候這個一對多的多端數(shù)量較大, 比如說,一個部門內(nèi)有多少員工。在華為一個三級部門可能有數(shù)千員工,這個時候如果把所有員工信息直接內(nèi)嵌到部門內(nèi)肯定不是個好的選擇,有可能會超出16MB的文檔限制。這個時候可以采用引用ID的方式:(更新性能優(yōu))
> db.departments.findOne() {name : 'Enterprise BG',president: 'Zhang San',employees : [ // array of references to Employee colletionObjectID('AAAA'), ObjectID('F17C'), ObjectID('D2AA'),// etc] }如果需要查詢部門下員工相關(guān)信息,你可以使用$lookup聚合操作符來把員工信息進(jìn)行關(guān)聯(lián)并返回。
對 1: NNN (很多) 的關(guān)系使用
如果一對多情況下,這個多端數(shù)量無限大并會頻繁增長,比如說,一個測量儀的每分鐘讀數(shù),一年下來有幾十萬條,這個時候即使是把ID放到數(shù)組里都會管理不便,這個時候就應(yīng)該把多端的數(shù)據(jù)創(chuàng)建一個集合,并在那個集合的文檔里加入對主文檔的連接引用,如:
> db.sensors.findOne(){_id : ObjectID('AAAB'),name : 'engine temperature',vin : '4GD93039GI239',engine_id: '20394802',manuafacture: 'First Motor',production_date: '2014-02-01'...}>db.readings.findOne(){time : ISODate("2014-03-28T09:42:41.382Z"),sensor: ObjectID('AAAB'),reading: 67.4 }1.5把二進(jìn)制大文件和元數(shù)據(jù)分集合存放
如果你有需要把PDF文件,圖片,甚至小視頻等二進(jìn)制文件需要管理,建議使用MongoDB 的GridFS API 或者自己手動分集合來分開管理二進(jìn)制數(shù)據(jù)和元數(shù)據(jù)。
1.6 經(jīng)常更新的數(shù)據(jù)不要放在嵌套數(shù)組內(nèi)
數(shù)組是用來表達(dá) 1對多關(guān)系的利器,但是MongoDB對嵌套的數(shù)組內(nèi)元素缺乏直接更新能力。比如說:
{name: "Annice",courses: [{ name: "English", score: 97 },{ name: "Math", score: 89 },{ name: "Physics", score: 95 }] }這樣設(shè)計沒有嵌套數(shù)組,我們可以直接對 Math的score 修改為99:
db.students.update({name: "Annice", "courses.name":"Math"}, {$set:{"courses.$.score": 99 }})
注意數(shù)組定位符 $ 的用法,$ 表示當(dāng)前匹配的第一個數(shù)組元素的在數(shù)組內(nèi)的索引。
但是下面這種情況就涉及到了數(shù)組嵌套:
{name: "Annice",courses: [{ name: "Math", scores: [ {term: 1, score: 80} ,{term: 2, score: 90}] },{ name: "Physics", score: 95 }]}這個時候如果你想對Math course的term 1的Score進(jìn)行修改,你就需要把 scores 這個數(shù)組整個調(diào)到內(nèi)存然后在代碼里對這個嵌套數(shù)組的元素進(jìn)行修改。這是因為MongoDB的數(shù)組定位符 $ 只對第一層數(shù)組有效。
當(dāng)然,如果你的模型不需要修改嵌套的數(shù)組內(nèi)元素,那么這條就不適用。
1.程序配置
1.1.1 設(shè)定合適的MongoDB連接池大小 (Connections Per Host)
Java驅(qū)動的默認(rèn)連接池大小是100(具體默認(rèn)值以 Driver 的文檔為準(zhǔn))。建議按照應(yīng)用的實際情況做調(diào)整。對壓力較小的應(yīng)用可以適當(dāng)調(diào)小減少對應(yīng)用服務(wù)器的資源占用。
舉個例子,Mongod 的連接數(shù)限制為2000(shard的maxConns),應(yīng)用業(yè)務(wù)上有40個服務(wù)進(jìn)程可能同時訪問這個Mongod,這時每個進(jìn)程里的 MongoClient 的連接數(shù)則應(yīng)該限制在 2000 / 40 = 50 以下 (連接復(fù)制集時,MongoClient 還要跟復(fù)制集的每個成員建立一條連接,用于監(jiān)控復(fù)制集后端角色的變化情況)
1.1.2 正確使用寫關(guān)注設(shè)置(Write Concern)
MongoDB的建議最小部署是一個復(fù)制集,包含3個數(shù)據(jù)節(jié)點。默認(rèn)情況下應(yīng)用的寫操作(更新,插入或者刪除)在主節(jié)點上完成后就會立即返回。寫操作則通過OPLOG方式在后臺異步方式復(fù)制到其他節(jié)點。在極端情況下,這些寫操作可能還未在復(fù)制到從節(jié)點的時候主節(jié)點就出現(xiàn)宕機(jī)。這個時候發(fā)生主備節(jié)點切換,原主節(jié)點的寫操作會被回滾到文件而對應(yīng)用不可見。為防止這種情況出現(xiàn),MongoDB建議對重要的數(shù)據(jù)使用 {w: “marjority”} 的選項。{w:”majority”} 可以保證數(shù)據(jù)在復(fù)制到多數(shù)節(jié)點后才返回成功結(jié)果。使用該機(jī)制可以有效防止數(shù)據(jù)回滾的發(fā)生。
另外你可以使用 {j:1} (可以和 w:”majrotiy” 結(jié)合使用) 來指定數(shù)據(jù)必須在寫入WAL日志之后才向應(yīng)用返回成功確認(rèn)。這個會導(dǎo)致寫入性能有所下降,但是對于重要的數(shù)據(jù)可以考慮使用。
1.1.3 正確使用讀選項設(shè)置(Read Preference)
MongoDB由于是一個分布式系統(tǒng),一份數(shù)據(jù)會在多個節(jié)點上進(jìn)行復(fù)制。從哪個節(jié)點上讀數(shù)據(jù),要根據(jù)應(yīng)用讀數(shù)據(jù)的需求而定。以下是集中可以配置的讀選項:
primary: 默認(rèn),在主節(jié)點上讀數(shù)據(jù)
primaryPreferred: 先從主節(jié)點上讀,如果未成功再到任意一臺從節(jié)點上讀
secondary: 在從節(jié)點上讀數(shù)據(jù)(當(dāng)有多臺節(jié)點的時候,隨機(jī)的使用某一臺從節(jié)點)
secondaryPreferred: 首先從從節(jié)點上讀,如果從節(jié)點由于某種原因不能提供服務(wù),則從主節(jié)點上進(jìn)行讀
nearest: 從距離最近的節(jié)點來讀。距離由ping操作的時間來決定。
除第一個選項之外,其他讀選項都存在讀到的數(shù)據(jù)不是最新的可能。原因是數(shù)據(jù)的復(fù)制是后臺異步完成的。
1.1.4 不要實例化多個MongoClient
MongoClient是個線程安全的類,自帶線程池。通常在一個JVM內(nèi)不要實例化多個MongoClient實例,避免連接數(shù)過多和資源的不必要浪費(fèi)。
1.1.5 對寫操作使用Retry機(jī)制
MongoDB使用復(fù)制集技術(shù)可以實現(xiàn)99.999%的高可用。當(dāng)一臺主節(jié)點不能寫入時,系統(tǒng)會自動故障轉(zhuǎn)移到另一臺節(jié)點。轉(zhuǎn)移可能會耗時幾秒鐘,在這期間應(yīng)用應(yīng)該捕獲相應(yīng)的Exception并執(zhí)行重試操作。重試應(yīng)該有backoff機(jī)制,例如,分別在1s,2s,4s,8s等時候進(jìn)行重試。
1.1.6 避免使用太長的字段名
MongoDB 沒有表結(jié)構(gòu)定義。每個文檔的結(jié)構(gòu)由每個文檔內(nèi)部的字段決定。所有字段名會在每個文檔內(nèi)重復(fù)。使用太長的字段名字會導(dǎo)致對內(nèi)存、網(wǎng)絡(luò)帶寬更多的需求。(由于壓縮技術(shù),長字段名對硬盤上的存儲不會有太多占用)
1.1.7 使用有規(guī)律的命名方式
如: School, Course, StudentRecord
或者:school, course, stuent_record
1.1.8 正確使用更新語句
不要把MongoDB和普通的鍵值型數(shù)據(jù)庫(KV)視為等同。MongoDB支持和關(guān)系型數(shù)據(jù)庫update語句類似的in place update。你只需要在update語句中指定需要更新的字段,而不是整個文檔對象。
舉例來說,加入我想把用戶的名字從TJ改為Tang Jianfa.
不建議的做法:
user = db.users.findOne({_id: 101});
user.name="Tang Jianfa"
db.users.save(user);
建議的做法:
user = db.users.findOne({_id: 101});
// do certain things
db.users.update({_id:101}, {$set: {name: "Tang Jianfa"}});
使用投射 (projection)來減少返回的內(nèi)容
MongoDB 支持類似于SQL語句里面的select,可以對返回的字段進(jìn)行過濾。使用Projection可以減少返回的內(nèi)容,降低網(wǎng)絡(luò)傳輸?shù)牧亢痛a中轉(zhuǎn)化成對象所需的時間。
1.1.9 使用TTL來自動刪除過期的數(shù)據(jù)
很多時候我們用MongoDB來存儲一些時效性的數(shù)據(jù),如7天的監(jiān)控數(shù)據(jù)。與其自己寫個后臺腳本定期清理過期數(shù)據(jù),你可以使用TTL索引來讓MongoDB自動刪除過期數(shù)據(jù):
db.data.createIndex({create_time:1}, {expireAfterSeconds: 7*24*3600})
分表可采用drop的方式
1.1.10 使用execute命令來實現(xiàn)upsert
有些時候你不知道一條文檔數(shù)據(jù)是否已經(jīng)在庫里存在。這個時候你要么先查詢一下,要么就是使用upsert語句。在SpringData下面upsert語句需要你把每個字段的值都在upsert語句中格式化出來。字段多的時候未免有些繁瑣。SpringData MongoDB里面的MongoTemplate有個execute方法可以用來實現(xiàn)一個DB調(diào)用,也不用繁瑣的把所有字段羅列出來的例子。
public boolean persistEmployee(Employee employee) throws Exception {BasicDBObject dbObject = new BasicDBObject();mongoTemplate.getConverter().write(employee, dbObject);mongoTemplate.execute(Employee.class, new CollectionCallback<Object>() {public Object doInCollection(DBCollection collection) throws MongoException, DataAccessException {collection.update(new Query(Criteria.where("name").is(employee.getName())).getQueryObject(),dbObject,true, // means upsert - truefalse // multi update – false);return null;}});return true;}Java API 操作
需要導(dǎo)入的文件:
import com.mongodb.MongoClient; import com.mongodb.MongoClientURI; import com.mongodb.ServerAddress; import com.mongodb.MongoCredential; import com.mongodb.MongoClientOptions; import java.util.Arrays;使用MongoClient連接MongoDB,該MongoClient實例表示到數(shù)據(jù)庫的連接池,即使你有多個線程,也只需使用一個MongoClient。如果創(chuàng)建了多個MongoClient,可以使用MongoClient.close()進(jìn)行關(guān)閉。
1.1 連接單獨的MongoDB
可以實例化一個沒有任何參數(shù)的MongoClient對象來連接到在本地主機(jī)上運(yùn)行的MongoDB實例(默認(rèn)端口27017):
MongoClient mongoClient = new MongoClient(); 可以明確指定主機(jī)名以連接到在指定主機(jī)上運(yùn)行的MongoDB實例(默認(rèn)端口27017): MongoClient mongoClient = new MongoClient( "host1" );可以明確指定主機(jī)名和端口:
MongoClient mongoClient = new MongoClient( "host1" , 27017 );
可以指定MongoClientURI連接字符串
MongoClient mongoClient = new MongoClient(new MongoClientURI
("mongodb://host1:27017"));
1.2 連接副本集
可以使用MongoClientURI指定副本集成員:
1. 指定至少兩個成員:
MongoClient mongoClient = new MongoClient( new MongoClientURI( "mongodb://host1:27017,host2:27017,host3:27017"));2. 指定至少一個成員并且標(biāo)明replicaSet:
MongoClient mongoClient = new MongoClient( new MongoClientURI( "mongodb://host1:27017,host2:27017,host3:27017/?replicaSet=myReplicaSet"));重點:MongoDB復(fù)制集里Primary節(jié)點是不固定的,當(dāng)遇到復(fù)制集輪轉(zhuǎn)升級、Primary宕機(jī)、網(wǎng)絡(luò)分區(qū)等場景時,復(fù)制集可能會選舉出一個新的Primary,而原來的Primary則會降級為Secondary,即發(fā)生主備切換。總而言之,MongoDB復(fù)制集里Primary節(jié)點是不固定的。
當(dāng)連接復(fù)制集時,如果只指定Primary的地址來連接,當(dāng)時可能可以正確讀寫數(shù)據(jù)的,但一旦復(fù)制集發(fā)生主備切換,你連接的Primary會降級為Secondary,你將無法繼續(xù)執(zhí)行寫操作,這將嚴(yán)重影響到你的線上服務(wù)。
所以生產(chǎn)環(huán)境千萬不要只連Primary。建議連接參數(shù)里面把所有主從節(jié)點都加上,使得能夠自動識別主節(jié)點。
1.3連接分片集群
連接單個mongos:
MongoClient mongoClient = new MongoClient( "localhost" , 27017 );MongoClient mongoClient = new MongoClient(new MongoClientURI( "mongodb://localhost:27017"));連接多個mongos:
MongoClient mongoClient = new MongoClient(new MongoClientURI( "mongodb://host1:27017,host2:27017"));重點:連接分片集群時,務(wù)必確保 MongoDB URI 里包含2個及以上的mongos地址,來實現(xiàn)負(fù)載均衡及高可用。客戶端會自動將請求分散到多個mongos 上,以實現(xiàn)負(fù)載均衡;同時,當(dāng)URI 里 mongos 數(shù)量在2個及以上時,當(dāng)有mongos故障時,客戶端能自動進(jìn)行 failover,將請求都分散到狀態(tài)正常的 mongos 上。
1.4 數(shù)據(jù)庫和集合
MongoDB存儲的一條數(shù)據(jù)叫做文檔,文檔儲存在集合里,集合儲存在數(shù)據(jù)庫中。
進(jìn)行之后操作前需要引入的文件:
import com.mongodb.MongoClient; import com.mongodb.client.MongoCollection; import com.mongodb.client.MongoDatabase; import static com.mongodb.client.model.Filters.*; import com.mongodb.client.model.CreateCollectionOptions; import com.mongodb.client.model.ValidationOptions;連接集合
首先連接MongoDB:
MongoClient mongoClient = new MongoClient();
一旦你有一個MongoClient實例連接到MongoDB部署,使用它的getDatabase()方法來訪問數(shù)據(jù)庫。
為該getDatabase()方法指定數(shù)據(jù)庫的名稱。如果數(shù)據(jù)庫不存在,那么MongoDB會在首次存儲該數(shù)據(jù)庫的數(shù)據(jù)時創(chuàng)建數(shù)據(jù)庫。
MongoDatabase database = mongoClient.getDatabase("test");
注意:MongoDatabase 實例是不可變的。
一旦你有一個MongoDatabase實例,使用它的getCollection() 方法來訪問一個集合。
為該getCollection()方法指定集合的名稱。如果一個集合不存在,當(dāng)你第一次存儲該集合的數(shù)據(jù)時,MongoDB會創(chuàng)建該集合。
MongoCollection<Document> coll = database.getCollection("myTestCollection");
注意:MongoCollection實例是不可變的。
每次執(zhí)行完后,切記要關(guān)閉連接
MongoClient.close()
總結(jié)
以上是生活随笔為你收集整理的mongodb查询值不为空_MongoDB使用规范(上)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python写后台接口请求出错_pyth
- 下一篇: java 算法_JAVA经典算法40题