日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

ElasticSearch 之中文分词器

發布時間:2025/3/15 编程问答 20 豆豆
生活随笔 收集整理的這篇文章主要介紹了 ElasticSearch 之中文分词器 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

4,中文分詞器

4.1.? smartCN(這個是參照別人的安裝方法安裝的有興趣可以試一下)

一個簡單的中文或中英文混合文本的分詞器

這個插件提供?smartcn?analyzer 和?smartcn_tokenizer?tokenizer,而且不需要配置

# 安裝 bin/elasticsearch-plugin install analysis-smartcn # 卸載 bin/elasticsearch-plugin remove analysis-smartcn

測試一下

可以看到,“今天天氣真好”用smartcn分析器的結果是:

[ 今天 , 天氣 , 真 , 好 ]

如果用standard分析器的話,結果會是:

[ 今 ,天 ,氣 , 真 , 好 ]

4.2 我們一般都會用? ? ?IK分詞器(我們就具體搭建一下ik中文分詞器)

下載對應的版本,這里我下載6.8.6:https://github.com/medcl/elasticsearch-analysis-ik/releases/tag/v6.8.6?

linux下使用wget命令(進入es插件目錄)

cd /usr/local/java/elasticsearch-6.8.6/plugins wget https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.8.6/elasticsearch-analysis-ik-6.8.6.zip

然后,在Elasticsearch的plugins目錄下建一個ik目錄,將剛才下載的文件解壓到該目錄下

unzip elasticsearch-analysis-ik-6.8.6.zip

最后,重啟Elasticsearch

查看es啟動情況

su esuser cd /usr/local/java/elasticsearch-6.8.6/bin ps -ef | grep elasticsearch

重啟

./elasticsearch?

重啟完成下面我們看下IK中文分詞器的如何使用

IK有兩種顆粒度的拆分:

ik_smart: 會做最粗粒度的拆分

ik_max_word: 會將文本做最細粒度的拆分

1) ik_smart 拆分

GET /_analyze {"text":"中華人民共和國國徽","analyzer":"ik_smart" }

?

2)ik_max_word 拆分

GET /_analyze {"text":"中華人民共和國國徽","analyzer":"ik_max_word" }

?

java學習討論群:725562382

?

總結

以上是生活随笔為你收集整理的ElasticSearch 之中文分词器的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。