當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

solr入门之參考淘宝搜索提示功能优化拼音加汉字搜索功能

發布時間：2024/4/17 编程问答 52 豆豆

生活随笔收集整理的這篇文章主要介紹了 solr入门之參考淘宝搜索提示功能优化拼音加汉字搜索功能小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

首先看一下從淘寶輸入搜索keyword獲取到的一些數據信息:

第一張:使用拼音的全程來查詢能夠看到提示的是匹配的轉換的拼音的方式,看最后一個提示項這里另一個在指定分類文件夾下搜索的功能,難道后臺還存儲的類目的信息?

另一個標簽的信息要存儲

第二使用首字母來匹配這里看不出來淘寶的東西太多了,首字母直接有了相應的全程

第三使用切斷字母的匹配看的出來走的還是全然匹配的路徑

第四使用漢字匹配的方法 : ?這個沒得說的這是主功能了

第五使用拼音加漢字的方式: 可以匹配到使用所有的拼音時這里能看出來是使用了轉換的方法了先將漢字轉為拼音在去匹配

第六這里使用部分 ?這個沒啥問題轉成拼音后 ?shouta*

第七這里應該是先轉成拼音為 stao 看以下一張圖搜索結果是吻合的,可是結果太少了, 這里淘寶因該使用了另外的搜索機制了.假設這樣的方法搜索到的數量不夠,那么就使用查詢模式即再放一個分詞的字段用來查詢, 我想是分成一個一個的模式也就是搜索 s 套了這里不須要考慮順序了詞中含有這兩個就能夠了就是以下的結果了

這里和上面說的是一個道理從這里大家應按能猜出來搜索shtao是沒有結果的,能夠驗證下假設有興趣

這里看到沒有提示結果,就是沒有了依照推測出來的兩種搜索方式
淘寶處理對于拼音加漢字問題應該是使用了雙重查詢 ,保證漢字是正確匹配的(應該使用的是當個分詞字段) 然后再進行漢字轉為拼音后的過濾,

學到一點解決拼音加漢字搜索建議的解決方法新加入一個字段使用全然分詞模式即分成一個一個用來做漢字匹配過濾查詢然后再用漢字轉拼音查詢 ?當數量不夠時再使用一次檢索查詢含有keyword就可以不要求位置在首位
以下是自己的搜索建議改造拼音加漢字的改寫
1.加入一個漢字單個分詞的字段 schema.xml中配置 <fieldtype?name="ng1_1"?class="solr.TextField"?positionIncrementGap="100"> <analyzer> <tokenizer?class="solr.NGramTokenizerFactory"?minGramSize="1"?maxGramSize="1"/> <filter?class="solr.LowerCaseFilterFactory"/> </analyzer> </fieldtype>  <field?name="word_n1"?type="ng1_1"?indexed="true"?stored="false"/> <copyField?source="word"?dest="word_n1"/>

2.代碼中加入過濾部分 //這里加入過濾--要包括的漢字--使用filter添加查詢速度 if(StringFilterUtils.filterAll(q)!=null?&&?StringFilterUtils.filterAll(q).trim().length()>0){ query.set(CommonParams.FQ,?BaseSuggestIndex.Fd.word_n1.name()+":"+StringFilterUtils.filterAll(q).trim()); }

對照搜索條件

未優化前

優化后

能夠發現漢字輸入不對,就不能出來提示了以下是一些輸入正確的出來的結果

轉載于:https://www.cnblogs.com/gccbuaa/p/7306195.html

總結

以上是生活随笔為你收集整理的solr入门之參考淘宝搜索提示功能优化拼音加汉字搜索功能的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：【前端】JavaScript
下一篇： Matlab变量、分支语句和循环语句

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

solr入门之參考淘宝搜索提示功能优化拼音加汉字搜索功能

總結