如何提高QnA maker机器人训练中文语义理解的能力
這是一個常見的問題,在人工智能的世界里面,圖像理解、語言及語義理解、數據理解是三個核心領域。而關于語言及語義理解,又與具體的語言和文字密切相關。目前來說,大家都是用機器學習去訓練模型,如果要更好的理解中文,當然是要用中文的語義模型去訓練更好。
聽起來很簡單的一個事情,最近我在使用QnA maker這個服務時卻遇到一些小問題,深究了一下,也搞明白了他怎么選定語義模型的邏輯:當前來說,他會根據開發者定義的KB的素材,自動推斷語言。
這可能是一個足夠“智能”,但不夠聰明的設計。
我發現問題的原因在于我在一個KB中,先是定義了一個Hi這種測試用的提問。然后又導入了一個中文的知識庫材料。如下圖所示:
然后我在測試時發現,很多明明定義在question里面的短語,就是無法識別出來。例如
我百思不得其解,后來發現這個KB的語言被識別為了英文,難怪呢。
問題倒是找到了,但怎么調整這個設置呢?查了很多材料,也沒有找到地方可以改設置。只能發郵件給產品組溝通。
攻城獅們告訴我的情況是,讓我重新建立一個KB,而且一定要確保第一個KB Pair是中文的。我頓時就明白了。
然后,你可以通過這個接口來驗證當前你定義的Knowledge base是用什么語言來訓練的。
https://westus.dev.cognitive.microsoft.com/docs/services/5a93fcf85b4ccd136866eb37/operations/knowledgebases_getknowledgebasedetails/console
另外一個好消息是,根據我跟產品組的溝通,很快會有一個功能,就是讓開發者自己可以手工地設定語言。
這當然是更加自然、而且合乎邏輯的設計。
總結
以上是生活随笔為你收集整理的如何提高QnA maker机器人训练中文语义理解的能力的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: .NET开发者必须学习.NET Core
- 下一篇: Bumblebee微服务网关之请求统一验