XiaoHu日志 9/5~9/6
9/5 導入線上實體后,原先包含多種學科信息的filter變得只包含一個學科信息,因為訊飛只會識別出第一個匹配上的實體,這樣還不如之前拿到一個不準確的結果,然后用自己的方法從詞庫中識別出學科信息。我一個半小時都在解決這個問題,拿出一個方法,然后用新的方法來解決方法帶來的問題,然后又拿新新的方法來解決新方法帶來的新問題。
9/6 取消了線上實體,把filter重置為不定長字符串。我發現我可以從語料的角度解決問題,添加線上實體的目的是為了讓我免除標注實體的煩惱。那么我可以使每一條語料的學科實體都是“語文”然后在錄入時把“語文”替換為“filter”,這樣也能達成原來的效果,還能保證我識別的準確度。在下午我調試時,我發現一個問題,我數學課的名字叫“函數上”,在查詢過評時,如果我問“數學成績”,是無法取得結果的。因為過評信息里不包含學科信息,它只來自一門叫“函數上”的課,但是不知道這門課的學科是什么。這就導致我無法查“數學成績”,只能查“函數上”的成績。這個情況在我搞學科查詢的時候也發生過,但是其區別在于課程數據結構里是包含一個“subject”學科信息的,我只需要多考慮一個信息就可以。但是過評數據結構里沒有“subject”,只有這門課的名稱和其“id”。兩種結構里的id是互通的,所以我可以對于一門課的過評找到與之對應的課程數據,然后在課程數據里找到subject信息。我在獲取過評列表后,對于每個過評獲取其課程的id,由于發出過評的課程一定在我的所有課程里,我可以在我的所有課程里找到與這個id對應的課程信息,我把學科信息附在過評的課程名稱后,這樣過評所對應的學科也能出現在對于課程名稱分詞的結果中,就實現了“數學成績”的查詢。
總結
以上是生活随笔為你收集整理的XiaoHu日志 9/5~9/6的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Nimbus的黎明
- 下一篇: 一个偶然发现还挺有意思的逻辑题