一个专业搜索公司关于lucene+solar资料
http://tech.funnyai.com/index.php/Solar
Solar
取自 技術(shù)百科
跳轉(zhuǎn)到: 導(dǎo)航, 搜索Solr是一個獨(dú)立的企業(yè)級搜索應(yīng)用服務(wù)器,它對外提供類似于Web-service的API接口。用戶可以通過http請求,向搜索引擎服務(wù)器提交一定格式的XML文件,生成索引;也可以通過Http Get操作提出查找請求,并得到XML格式的返回結(jié)果;
Solr是一個高性能,采用Java5開發(fā),基于Lucene的全文搜索服務(wù)器。同時對其進(jìn)行了擴(kuò)展,提供了比Lucene更為豐富的查詢語言,同時實(shí)現(xiàn)了可配置、可擴(kuò)展并對查詢性能進(jìn)行了優(yōu)化,并且提供了一個完善的功能管理界面,是一款非常優(yōu)秀的全文搜索引擎。
文檔通過Http利用XML 加到一個搜索集合中。查詢該集合也是通過http收到一個XML/JSON響應(yīng)來實(shí)現(xiàn)。它的主要特性包括:高效、靈活的緩存功能,垂直搜索功能,高亮顯示搜索結(jié)果,通過索引復(fù)制來提高可用性,提供一套強(qiáng)大Data Schema來定義字段,類型和設(shè)置文本分析,提供基于Web的管理界面等。
本文主要是使用solr的簡單教程。詳細(xì)內(nèi)容可以參考http://lucene.apache.org/solr/tutorial.html或者其他網(wǎng)站。
1.首先下載solr1.3.0,地址為http://www.apache.org/dyn/closer.cgi/lucene/solr/
2.將下載下的文件解壓。
3.下載下的solr自帶一個jetty啟動的版本,運(yùn)行apache-solr-1.3.0\example下的start.jar即可
4.訪問http://localhost:8983/solr/admin/,可以看到一個管理界面,這是進(jìn)行搜索,返回的結(jié)果都是0,因?yàn)檫€沒有索引。
5.現(xiàn)在開始建立索引,solr是基于lucene,所以一些概念是一樣的,比如field,doc等等。如果不理解這些概念,可以看一下lucene in action這本書,或者是lucene的相關(guān)文檔。solr的索引內(nèi)容可以用xml形式的文件描述,exampledoc文件下有一些example,隨便打開一個,大致內(nèi)容如下:
<add> <doc> <field name="id">SOLR1000</field> <field name="name">Solr, the Enterprise Search Server</field> <field name="manu">Apache Software Foundation</field> <field name="cat">software</field> <field name="cat">search</field> <field name="features">Advanced Full-Text Search Capabilities using Lucene</field> <field name="features">Optimized for High Volume Web Traffic</field> <field name="features">Standards Based Open Interfaces - XML and HTTP</field> <field name="features">Comprehensive HTML Administration Interfaces</field> <field name="features">Scalability - Efficient Replication to other Solr Search Servers</field> <field name="features">Flexible and Adaptable with XML configuration and Schema</field> <field name="features">Good unicode support: héllo (hello with an accent over the e)</field> <field name="price">0</field> <field name="popularity">10</field> <field name="inStock">true</field> <field name="incubationdate_dt">2006-01-17T00:00:00.000Z</field> </doc> </add>
如果使用過lucene,應(yīng)該很容易理解這個xml的內(nèi)容的含義。也可以自己寫一些類似格式的xml文件。
6.提交索引 運(yùn)行這個目錄下的exampledioc目錄下的post.jar,將需要提交的xml的文件作為參數(shù),比如:
java -jar post.jar solr.xml
這樣索引就會提交并建立好
7.此時在訪問http://localhost:8983/solr/admin/,在querystring中輸入solr作為關(guān)鍵字。點(diǎn)擊搜索,可以看到返回的搜索結(jié)果。
?
?
===========
http://download.csdn.net/detail/zxh116116/727276
總結(jié)
以上是生活随笔為你收集整理的一个专业搜索公司关于lucene+solar资料的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 为您详细解析防火墙的工作原理
- 下一篇: POI LastRowNum and