ES5中文分词(IK)
ElasticSearch5中文分詞(IK)
ElasticSearch安裝
官網:https://www.elastic.co
1.ElasticSearch安裝
1.1.下載安裝公共密鑰
rpm --import https://artifacts.elastic.co/GPG-KEY-elasticsearch
1.2.在 /etc/yum.repos.d/ 目錄下建立 elasticsearch.repo 文件
vim /etc/yum.repos.d/elasticsearch.repo
在文件中寫入:
[elasticsearch-5.x]
name=Elasticsearch repository for 5.x packages
baseurl=https://artifacts.elastic.co/packages/5.x/yum
gpgcheck=1
gpgkey=https://artifacts.elastic.co/GPG-KEY-elasticsearch
enabled=1
autorefresh=1
type=rpm-md
保存退出
1.3.使用yum安裝
yum install elasticsearch
1.4.添加系統服務
chkconfig --add elasticsearch
service elasticsearch start //啟動
service elasticsearch stop //關閉
service elasticsearch status//查看狀態
啟動后訪問 localhost:9200 得到
{
"name" : "Cp8oag6",
"cluster_name" : "elasticsearch",
"cluster_uuid" : "AT69_T_DTp-1qgIJlatQqA",
"version" : {
"number" : "5.0.1",
"build_hash" : "f27399d",
"build_date" : "2016-11-21T09:51:41.449Z",
"build_snapshot" : false,
"lucene_version" : "6.2.1"
},
"tagline" : "You Know, for Search"
}
2 安裝ik中文分詞插件
2.1 ik git地址 https://github.com/medcl/elasticsearch-analysis-ik
克隆ik
git clone https://github.com/medcl/elasticsearch-analysis-ik
git checkout tags/v5.0.1 切換版本 版本號可以修改
2.2 通過java工具打包
mvn package
如果提示 mvn 不存在看下面
打包后 在 target/releases/ 這個路徑下面 有一個 elasticsearch-analysis-ik-{version}.zip 這個文件 將這個壓縮文件復制到 ElasticSearch 下plugins/ik 目錄下 然后解壓
我的 plugins 目錄是 /usr/share/elasticsearch/plugins 這個路
建立 ik 目錄
mkdir /usr/share/elasticsearch/plugins/ik
復制文件
cp ./target/releases/elasticsearch-analysis-ik-{version}.zip /usr/share/elasticsearch/plugins/ik
解壓
cd /usr/share/elasticsearch/plugins/ik
unzip elasticsearch-analysis-ik-{version}.zip
2.3 將ik 插件 安裝到 ElasticSearch中
創建索引m8:
http put 'http://localhost:9200/m8'
如果提示http put不存在看下面
為索引(m8)及類型(logs)下的字段(message)設置分詞器(分詞器可選ik_smart或ik_max_word):
http put localhost:9200/m8 -d '{
"settings" : {
"analysis" : {
"analyzer" : {
"ik" : {
"tokenizer" : "ik_smart"
}
}
}
},
"mappings" : {
"logs" : {
"dynamic" : true,
"properties" : {
"message" : {
"type" : "string",
"analyzer" : "ik_smart"
}
}
}
}
}'
案例
http://192.168.199.115:9200/m8/_analyze?analyzer=ik_max_word&text=南京市長江大橋
結果
參數說明:
ik_max_word: 會將文本做最細粒度的拆分,比如會將“中華人民共和國國歌”拆分為“中華人民共和國,中華人民,中華,華人,人民共和國,人民,人,民,共和國,共和,和,國國,國歌”,會窮盡各種可能的組合;
ik_smart: 會做最粗粒度的拆分,比如會將“中華人民共和國國歌”拆分為“中華人民共和國,國歌”。
mvn 不存在看下面 解決:
1.安裝java的jdk
官網下載地址http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html
下載rpm包:
wget http://download.oracle.com/otn-pub/java/jdk/8u111-b14/jdk-8u111-linux-x64.rpm?AuthParam=1479708556_19e817839b0ee72d40569ae8a23689d0
安裝:
rpm -ivh jdk-8u111-linux-x64.rpm
設置環境變量:
vim /etc/profile
在最后添加
JAVA_HOME=/usr/java/jdk1.8.0_111
JRE_HOME=/usr/java/jdk1.8.0_111/jre
PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin
CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib
export JAVA_HOME JRE_HOME PATH CLASSPATH
立即生效:
source /etc/profile
驗證:
java -version
安裝 maven 就是 mvn 命令 他需要java 才能運行
wget http://repos.fedorapeople.org/repos/dchen/apache-maven/epel-apache-maven.repo -O /etc/yum.repos.d/epel-apache-maven.repo
yum -y install apache-maven
http put不存在問題:
yum install httpie
轉載請注明來源 http://www.cnblogs.com/phpshen/p/6085274.html
總結
以上是生活随笔為你收集整理的ES5中文分词(IK)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 80G透镜雷达物位计工作原理
- 下一篇: 推荐一款仿iPhone桌面的代码. __