日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

让 sphinx 支持中文、日文和韩文

發布時間:2025/4/5 编程问答 27 豆豆
生活随笔 收集整理的這篇文章主要介紹了 让 sphinx 支持中文、日文和韩文 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

在國內搜索 sphinx 的話找到的資源好像都是挺久遠的,無奈之下只好跑到國外去找了。聽起來有點不可思議,但是最近整 sphinx 的時候突然想到 mediawiki 官方有 sphinx 的安裝介紹,然后就去參考了,驚奇的發現里面有提到 ?sphinx 支持 CJK 的方法。

CJK 在這邊是 Chinese, Japanese, Korean 首字母的縮寫。所以如果想要在國外搜索 sphinx 支持中文、日文和韓文的話,建議使用 sphinx 和 CJK 作為關鍵詞。

下面的內容其實總結自?Using Sphinx search engine with Chinese, Japanese, and Korean language documents?,建議英語好的或者有興趣的人也閱讀下原文。

讓 sphinx 支持 CJK 的 4 個要素分別是:

1、要建立索引的資料最好是 Unicode(UTF-8) 編碼,然后把 sphinx 的 charset_type 設置為 utf-8。

2、設置 CJK 專用的 charset_table ,這部分應該是最重要的。具體操作是訪問 sphinx 官方提供的charset_tables?實例。在里面你可以找到 CJK 對應的列表,然后將 sphinx.conf 中 charset_table 的值設置為你復制的內容。需要注意的:內容很多,不能全寫在一行里,要分多行記錄;記得自行把“→”改為“->”……

3、ngram_chars,依舊是上面那個鏈接,在最底部有 CJK Ngram Characters ,把內容復制并設定為參數 ngram_chars 的值,注意事項同上。

4、需要把 ngram_len 設置為 1 。

另外,如果你符合了上面的條件還沒有成功的話,可以試下:mediawiki 指南中有提到非英語的話記得注釋掉 morphology。

ivinco.com 在上面的鏈接給出了支持CJK的配置范例。

轉載于:https://www.cnblogs.com/zl0372/p/sphinx_11.html

總結

以上是生活随笔為你收集整理的让 sphinx 支持中文、日文和韩文的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。