社区论坛行业搜索最佳实践
案例背景
某技術社區作為國內的中文IT內容社區,致力于為中國軟件開發者提供知識傳播、在線學習、職業發展等全生命周期服務,旗下包括多款產品。
自開始接觸阿里云開放搜索產品,在一年的時間里逐步上量,陸續接入PC端、移動端的多個平臺,覆蓋首頁搜索、博客、下載、問答等細分業務的頻道搜索。通過開放搜索,為旗下產品的用戶提供高質量的搜索服務,并通過搜索能力的優化帶來更多的業務轉化,以提升整體業務收入。
內容搜索場景需求:
?更多的曝光機會——空結果率低;
?更好的搜索質量——搜索相關性高;
?更豐富的業務特征——結合業務特性調整搜索結果;
?更全面的配套功能——智能糾錯、下拉提示等配套能力;
?更低的擁有成本——相較自建搜索引擎更低的TCO成本;
?更便捷的開發使用——上線周期短,降低搜索引擎開發、效果調優難度;
以某論壇社區為例,產品線覆蓋多個平臺,包含網頁、APP、小程序等形式,同時業務上區分多個頻道。隨著業務的發展,首頁綜合搜索(后簡稱“主搜”)的流量越來越大,各種付費、引流業務接入,對搜索流量的運營變得更加重要,對主搜的業務訴求越來越多,需要聚合多個頻道的內容,同時搜索結果相關性要求更加精準,在考慮文本相關性的前提下,要加入更多的商業因素考慮,如eCPM等。
成熟的搜索引擎涉及離線模塊、在線模塊、查詢理解服務、算法平臺等系統組成,所需大量開發、算法調優以及持續的復雜運維工作,由于人力有限,社區論壇經過多方競品調研和產品試用,最終接入阿里云開放搜索。
開放搜索最佳實踐
更符合IT行業的查詢理解功能
在核心索引上配置使用針對IT行業定制了詞權重模型,糾錯模型,改寫模型等,擴大召回結果,精準命中需求;
排序優化
- 排序表達式應用
支持制兩輪相關性排序規則來準確控制搜索結果的排序。第一輪為基礎排序(粗排),從命中的文檔集合里海選出相關文檔。第二輪為業務排序(精排),對粗排的結果做更精細篩選,支持任意復雜的表達式和特征函數應用,方便更準確控制排序效果,優化系統性能,提高搜索響應速度。定制CTR點擊率預估模型,實現更智能的排序效果.
- 算法調優-人氣模型
人氣模型是淘寶搜索最基礎的排序算法模型,計算量化出每個產品的靜態質量及受歡迎的程度的值,將人氣模型引入到排序表達式中,可構建更精細化的排序模型;
- 高級定制排序插件-Cava語言
更強的靈活性和定制能力:Cava提供了較表達式更加豐富的語法功能,支持及時編譯,滿足更多個性化的業務需求。
搜索引導功能
下拉提示
是搜索服務的基礎功能,在用戶輸入查詢詞的過程中,智能推薦候選query,提高用戶輸入效率,幫助用戶盡快找到想要的內容。
下拉提示實現了基于用戶文檔內容的query智能抽取,可以通過中文前綴,拼音全拼,拼音首字母簡拼查詢以及漢字加拼音,分詞后前綴,中文同音別字等查詢下拉提示的候選query。
業務價值
? 對比客戶基于開源自建的服務CTR提升超過80%
? 經迭代,開放搜索返回的搜索結果首位點擊率高于某D站內搜索服務的點擊率,期間多日點擊率高出3%
配置前后效果對比
以上就是社區論壇行業開放搜索最佳實踐的內容。
原文鏈接:https://developer.aliyun.com/article/780957?
版權聲明:本文內容由阿里云實名注冊用戶自發貢獻,版權歸原作者所有,阿里云開發者社區不擁有其著作權,亦不承擔相應法律責任。具體規則請查看《阿里云開發者社區用戶服務協議》和《阿里云開發者社區知識產權保護指引》。如果您發現本社區中有涉嫌抄襲的內容,填寫侵權投訴表單進行舉報,一經查實,本社區將立刻刪除涉嫌侵權內容。總結
以上是生活随笔為你收集整理的社区论坛行业搜索最佳实践的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 冷链食品竟然也有 “身份证”?
- 下一篇: Apache RocketMQ 4.8.