内容搜索排序表达式的最佳实践
某新聞資訊平臺(tái),在內(nèi)容搜索場(chǎng)景中需要滿足業(yè)務(wù)多樣化,個(gè)性化的需求,在query改寫配置好后,希望在排序階段進(jìn)行優(yōu)化,實(shí)現(xiàn)強(qiáng)大的相關(guān)性排序效果,提高用戶點(diǎn)擊率。今天會(huì)結(jié)合幾個(gè)典型場(chǎng)景該如何來(lái)思考和設(shè)計(jì)排序因子,和大家詳解特征性函數(shù)的應(yīng)用
Query在開放搜索的執(zhí)行流程
開放搜索排序表達(dá)式配置
接下來(lái)給大家分析幾個(gè)常見的排序優(yōu)化需求:
場(chǎng)景1:查詢?cè)~和召回字段匹配程度排序優(yōu)化
案例:當(dāng)用戶搜索“藥品公司”,分詞數(shù)量為2個(gè):藥品,公司,在召回結(jié)果包含的查詢?cè)~分詞個(gè)數(shù)相同情況下,如何把title“藥品公司”排在“藥品杭州分公司”的前面那?
開放搜索解決方案:應(yīng)用排序相關(guān)性特征函數(shù)項(xiàng)field_match_ratio, 查詢?cè)~的分詞個(gè)數(shù)與召回字段的總詞組字個(gè)數(shù)比值,比值越低,排序分越高.
詳細(xì)用法:https://help.aliyun.com/document_detail/51287.htmlspm=a2c4g.11186623.6.626.64786ab8OOs7hM
場(chǎng)景2: 標(biāo)簽特征權(quán)重在“個(gè)性化”排序召回中的應(yīng)用
案例: 當(dāng)用戶搜索"吃雞",可能是游戲吃雞內(nèi)容搜索,也可以能是新聞內(nèi)容搜索,如何把用戶更感興趣的游戲內(nèi)容排到前面那?
開放搜索解決方案:匹配文檔和請(qǐng)求中的標(biāo)簽tag_match 函數(shù),用于對(duì)查詢語(yǔ)句和文檔做標(biāo)簽匹配,使用匹配結(jié)果對(duì)文檔進(jìn)行算分加權(quán);
? 通過(guò)長(zhǎng)時(shí)間的積累能獲知每個(gè)用戶的興趣標(biāo)簽,可以和內(nèi)容/商品標(biāo)簽對(duì)應(yīng),做到“個(gè)性化”排序
? 實(shí)現(xiàn)對(duì)用戶感興趣的帖子加權(quán),把用戶更感興趣的內(nèi)容/商品排到前面;
假設(shè)文檔內(nèi)容共有如下10類型的標(biāo)簽:
1-財(cái)經(jīng), 2-科技 ,3-體育 ,4-娛樂(lè) ,5-時(shí)尚, 6-教育 ,7-旅游 ,8-游戲 ,9-科普 ,10-醫(yī)療
如果想將“8-游戲”標(biāo)簽的文檔在前面展示,可設(shè)置tag_match函數(shù)
適用場(chǎng)景:此函數(shù)不僅試用于內(nèi)容搜索場(chǎng)景,同樣適用商品搜索場(chǎng)景,滿足個(gè)性化商品排序
其他案例和用法:https://developer.aliyun.com/article/775488
場(chǎng)景3:根據(jù)查詢?cè)~在title和body的緊密程度排序優(yōu)化
案例:搜索"黑色幽默",意圖是搜索title“周杰倫《黑色幽默》的歌曲”,但在數(shù)據(jù)庫(kù)里有條文本body記錄為“下雨了,天空是灰黑色的,即便幽默的人此時(shí)也比較煩悶”,導(dǎo)致這條記錄也被召回,并且排序也比較靠前, 如何將title字段的緊密度在排序中起主導(dǎo)作用?
開放搜索解決方案:為了使這條不太相關(guān)的body記錄排序靠后,title字段排序靠前, 可以使用fieldterm_proximity函數(shù)獲取文檔緊密程度的得分來(lái)實(shí)現(xiàn). 此函數(shù)用來(lái)表示關(guān)鍵詞分詞詞組在字段上的緊密程度,緊密度越高,排序分越高。精排公式寫為:fieldterm_proximity(title)*10 + fieldterm_proximity(body)
詳細(xì)用法:https://help.aliyun.com/document_detail/51281.html?spm=a2c4g.11186623.6.621.3c0938de1kdUfp
場(chǎng)景4:內(nèi)容時(shí)效性
案例:用戶對(duì)時(shí)間的敏感度越高,那么越希望得到新的內(nèi)容,內(nèi)容的時(shí)效性和整體的滿意度直接相關(guān),如何優(yōu)化排序配置,滿足內(nèi)容排序的時(shí)效性敏感度?
開放搜索解決方案:運(yùn)用函數(shù)timeliness--時(shí)效分,用于衡量文檔的新舊程度, 值越大表示時(shí)效性越好
詳細(xì)用法:https://help.aliyun.com/document_detail/51270.html?spm=a2c4g.11174283.6.636.121f5a19EWuQQM
場(chǎng)景5:關(guān)鍵詞(分類、標(biāo)題、作者)相關(guān)性排序優(yōu)化
案例1:搜索“子女”,優(yōu)化前排序結(jié)果“女裝靴子/褲子/葉子”排在“預(yù)測(cè)子女性別”的前面,如何運(yùn)用排序表達(dá)式優(yōu)化把"子女"最相關(guān)的內(nèi)容排序靠前那?
案例2: 在精排中對(duì)title和body進(jìn)行文本算分,權(quán)重比為3:1
開放搜索解決方案:在精排中進(jìn)行文本算分,關(guān)鍵詞在字段上的文本匹配度-text_relevance函數(shù),匹配度越高,分值越高,排序越靠前.
詳細(xì)用法:https://help.aliyun.com/document_detail/51280.html?spm=a2c4g.11186623.6.635.287e42c3whTeg9
以上就是阿里云開放搜索內(nèi)容行業(yè)"排序表達(dá)式及特征函數(shù)”的應(yīng)用案例,如果您對(duì)搜索與推薦相關(guān)技術(shù)感興趣,歡迎加入釘釘群內(nèi)交流~
https://free.aliyun.com/product/opensearch-free-trial
原文鏈接:https://developer.aliyun.com/article/779309?
版權(quán)聲明:本文內(nèi)容由阿里云實(shí)名注冊(cè)用戶自發(fā)貢獻(xiàn),版權(quán)歸原作者所有,阿里云開發(fā)者社區(qū)不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。具體規(guī)則請(qǐng)查看《阿里云開發(fā)者社區(qū)用戶服務(wù)協(xié)議》和《阿里云開發(fā)者社區(qū)知識(shí)產(chǎn)權(quán)保護(hù)指引》。如果您發(fā)現(xiàn)本社區(qū)中有涉嫌抄襲的內(nèi)容,填寫侵權(quán)投訴表單進(jìn)行舉報(bào),一經(jīng)查實(shí),本社區(qū)將立刻刪除涉嫌侵權(quán)內(nèi)容。總結(jié)
以上是生活随笔為你收集整理的内容搜索排序表达式的最佳实践的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 命令行工具开发:如何快速实现命令行提示?
- 下一篇: 揭秘 | 连续3年支撑双11,阿里云神龙