LuceneLucene简介
1、Lucene是一套用于全文檢索和搜尋的開源程式庫,由Apache軟件基金會支持和提供;Lucene提供了一個簡單卻強大的應(yīng)用程式接口,能夠做全文索引和搜尋。
2、Lucene是一個開放源代碼的全文檢索引擎工具包,即它不是一個完整的全文檢索引擎,而是一個全文檢索引擎的架構(gòu);
3、提供了完整的查詢引擎和索引引擎,部分文本分析引擎(英文與德文兩種西方語言)。
4、Lucene的目的是為軟件開發(fā)人員提供一個簡單易用的工具包,以方便的在目標系統(tǒng)中實現(xiàn)全文檢索的功能,或者是以此為基礎(chǔ)建立起完整的全文檢索引擎。
5、Lucene是一個高性能、可伸縮的信息搜索(IR)庫。它可以為你的應(yīng)用程序添加索引和搜索能力。Lucene是用java實現(xiàn)的、成熟的開源項目,是著名的Apache Jakarta大家庭的一員,并且基于Apache軟件許可 [ASF, License]。同樣,Lucene是當前非常流行的、免費的Java信息搜索(IR)庫。
6、Lucene作為一個全文檢索引擎,其具有如下突出的優(yōu)點:
(1)索引文件格式獨立于應(yīng)用平臺。Lucene定義了一套以8位字節(jié)為基礎(chǔ)的索引文件格式,使得兼容系統(tǒng)或者不同平臺的應(yīng)用能夠共享建立的索引文件。
(2)在傳統(tǒng)全文檢索引擎的倒排索引的基礎(chǔ)上,實現(xiàn)了分塊索引,能夠針對新的文件建立小文件索引,提升索引速度。然后通過與原有索引的合并,達到優(yōu)化的目的。
(3)優(yōu)秀的面向?qū)ο蟮南到y(tǒng)架構(gòu),使得對于Lucene擴展的學習難度降低,方便擴充新功能。
(4)設(shè)計了獨立于語言和文件格式的文本分析接口,索引器通過接受Token流完成索引文件的創(chuàng)立,用戶擴展新的語言和文件格式,只需要實現(xiàn)文本分析的接口。
(5)已經(jīng)默認實現(xiàn)了一套強大的查詢引擎,用戶無需自己編寫代碼即可使系統(tǒng)可獲得強大的查詢能力,Lucene的查詢實現(xiàn)中默認實現(xiàn)了布爾操作、模糊查詢(Fuzzy Search[11])、分組查詢等等。
總結(jié)
以上是生活随笔為你收集整理的LuceneLucene简介的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: java实现图片验证码
- 下一篇: 【Lucene】Lucene的工作原理