日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 >

solr中文分词

發布時間:2025/4/16 43 豆豆
生活随笔 收集整理的這篇文章主要介紹了 solr中文分词 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1.簡介

Solr是一個高性能,采用Java5開發,Solr基于Lucene的全文搜索服務器。同時對其進行了擴展,提供了比Lucene更為豐富的查詢語言,同時實現了可配置、可擴展并對查詢性能進行了優化,并且提供了一個完善的功能管理界面,是一款非常優秀的全文搜索引擎。因為中文的特殊性,在對中文文檔建立全文索引時,需要利用分詞工具進行分詞。

目前比較知名的分詞工具有:
IK,庖丁等

2.下載

?solr鏈接:https://pan.baidu.com/s/1iitpaYgBVpXQSUABtkCm5Q?
提取碼:tuuo?

3.安裝

解壓文件。

進入bin 啟動solr

./solr start -p 8984

可以在ip:8984端口上查看solr情況

關閉solr

./solr stop -all

4.中文分詞配置

copy ik-analyzer-solr5-5.x.jar to server/solr-webapp/webapp/WEB-INF/lib

ik-analyzer-solr5-5.x.jar 下載地址:鏈接:https://pan.baidu.com/s/1MlzginuetwyONGQ5KbtnOg?
提取碼:7g7z?

?

/usr/local/solr/solr-5.4.0/server/solr-webapp/webapp/WEB-INF/lib

修改schema.xml

<fieldType name="text_ik" class="solr.TextField"> <analyzer type="index"> <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" /> </analyzer><analyzer type="query"><tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" /></analyzer></fieldType>

<field name="docContent" type="text_ik" indexed="true" stored="true" multiValued="true"/>

<field name="docType" type="text_ik" indexed="true" stored="true" multiValued="true"/>

<field name="docName" type="text_ik" indexed="true" stored="true" multiValued="true"/>

重啟solr

檢測:
進入solr管理頁面-->analysis 查看分詞結果

?

轉載于:https://www.cnblogs.com/pigdata/p/10305562.html

總結

以上是生活随笔為你收集整理的solr中文分词的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。