日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 >

交互搜索中的自然语言理解技术

發(fā)布時間:2025/7/14 42 豆豆
生活随笔 收集整理的這篇文章主要介紹了 交互搜索中的自然语言理解技术 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

交互搜索

交互搜索是一種新的產品形態(tài),可以和用戶對話,記住用戶的購物需求和偏好,提供購物知識和建議。在搜索頁面下拉就可以進入了,類似于微信的小程序的進入方式。

自然語言理解

對話和搜索的最大區(qū)別就是對話是多輪的,而搜索是單輪的。另外對話中,特別是語音輸入中,會有更多的自然語言,而搜索中更多的是商品語言。因此,對話中的核心技術就是自然語言理解(NLU),在交互過程中,理解用戶的購物需求和意圖。

上面是用戶多輪對話購物的一個例子,在用戶每次輸入后,Query理解模塊(QU)都會識別他本次對話的意圖、類目和屬性,對話狀態(tài)管理模塊(DST)都會更新當前最終的意圖、類目和屬性。

  • 意圖(intent):

    • 購物:我想買連衣裙
    • 知識問答:高端手機品牌有哪些,怎么除甲醛
    • 購物攻略:怎么挑連衣裙
    • 搭配:紅色連衣裙搭配什么鞋子
    • 促銷活動:iphone8活動
    • 產品比較:iphone8 mate10 哪個好
  • 類目(category):商品的類目或者品類。
  • 屬性(attribute):類目或品類下,商品的屬性(CPV)。

NLU技術點

自然語言理解的模塊如下:

意圖識別 很多時候,用戶的意圖是不明確的,比如搜“手機”,可能既想買手機,也不知道怎么挑。但是從概率上來說,“手機”這個query的主要意圖還是購物。而“怎么挑手機”,則主要是找購物攻略。因此,我們可以從querylog中找出用戶在輸入某些短語(如“怎么挑”)的時候,是想找購物攻略的。意圖識別就是把這些短語挖掘出來,對query的意圖分類。

Session切分 在用戶的一次購物過程中,可能會買多種類目(品類)的商品,同一個類目的商品屬于一個購物需求或者一個session。因此,每次用戶輸入后,都要識別用戶是繼續(xù)說的,還是新的需求。有的時候,這種session切換會包含歧義,如先搜“手機”,再搜"蘋果",這時可能是“蘋果手機”,或者是“蘋果水果”,這時需要根據概率出默認的語義(蘋果手機),并且給用戶其他的選項(蘋果水果)。

類目預測 如果session切分是正確的,類目預測就會比較容易了。不過,多輪的時候,用戶的需求更復雜,對類目預測的要求也更高。當然,如果session切分錯了,類目預測也會出錯。由于session切分和類目預測都是對類目需求的理解,這兩個任務之間有很多共同點,所以我們也在考慮一起優(yōu)化。

屬性填充Slot filling 不同的葉子類目有不同的屬性集合,淘寶的上萬個葉子類目中,也有上萬個屬性(Slot)。高頻的屬性值可以通過知識圖譜中的CPV來直接匹配,但中低頻的屬性值則需要用到更多的信息。很多屬性值有不同的說法,比如:iphone8plus、iphone8p、8plus、8p,這4個詞都是指"型號:iphone8plus"。還有很多屬性值并不在CPV中,比如“3到4歲”的奶粉。這些都需要識別到某一個CPV屬性,或者一個文本屬性,或者是沒有意義的詞。

對話狀態(tài)管理State Tracking 這里主要是進行屬性值的追加或者替換,比如先搜“only連衣裙”,再搜“zara”,這時的狀態(tài)是“zara連衣裙”。更復雜的是文本屬性的替換,比如先搜“便宜的手機”,再搜“貴的”,這時的狀態(tài)是“貴的手機”。

State Tracking之后,用戶對話的語義理解就完成了,會輸出表示當前搜索語義的“標準Query”和tagging的結果,給后續(xù)的對話策略、排序等模塊使用。

后記

交互搜索中的自然語言理解就給大家簡單介紹到這里,真正想要理解自然語言的語義,任重而道遠。舉幾個語音搜索中的例子,作為未來的目標,“1.5米寬兒童上下床帶衣柜”,“我要夜蘿莉精靈夢中的蘿莉公主最好便宜的”,“必背小孩子玩的玩具”。

總結

以上是生活随笔為你收集整理的交互搜索中的自然语言理解技术的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。