NLPIR简介及使用配置
NLPIR漢語(yǔ)分詞系統(tǒng)(又名ICTCLAS2013),主要功能包括中文分詞;詞性標(biāo)注;命名實(shí)體識(shí)別;用戶詞典功能;支持GBK編碼、UTF8編碼、BIG5編碼。新增微博分詞、新詞發(fā)現(xiàn)與關(guān)鍵詞提取;
官方網(wǎng)址:http://ictclas.nlpir.org(地址一直在變,要是不能用直接搜NLPIR)
大數(shù)據(jù)論壇:http://www.bigdatabbs.com/forum.php?mod=forumdisplay&fid=64
資源下載
要是直接從官網(wǎng)下載最新版本,會(huì)一直配置出錯(cuò),我已經(jīng)整合了可用的資源,分享在網(wǎng)盤:http://pan.baidu.com/s/1c0hLarm
下載之后,在eclipse里面創(chuàng)建工程并且按照以下結(jié)構(gòu)來(lái)搭建:
注意要點(diǎn):
1 直接把kevin文件夾復(fù)制到src文件夾,使它成為如上所示的包結(jié)構(gòu);
2 file文件夾里面放著數(shù)據(jù),比如詞典,很多init錯(cuò)誤都是因?yàn)檫@個(gè)文件夾的原因;
3 NLPIR_JNI.dll和NLPIR.dll放在根目錄下。
測(cè)試代碼:
1 import java.io.UnsupportedEncodingException;
2
3 import kevin.zhang.NLPIR;
4
5 public class Init {
6 public static void main(String[] args) throws UnsupportedEncodingException {
7 NLPIR testNLPIR = new NLPIR();
8 String argu = "./file/";
9 System.out.println("NLPIR_Init...");
10 if (testNLPIR.NLPIR_Init(argu.getBytes("GB2312"), 0) == false) {
11 System.out.println("Init Fail!..");
12 return;
13 }
14 System.out.println("NLPIR_Success...");
15 testNLPIR.NLPIR_Exit();
16 }
17 }
看到下面的輸出則表示eclipse工程已經(jīng)成功配置
1 NLPIR_Init... 2 NLPIR_Success...
總結(jié)
以上是生活随笔為你收集整理的NLPIR简介及使用配置的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Pandas操作数据库新建表&增
- 下一篇: 小米网关api