2020 CCF BDCI小学数学应用题自动解题解题思路
簡單說幾點這個題目的看法:
1、此題用蘇劍林開源的 生成模型來做 大概得分就是我們的現在的得分
BERT可以上幾年級了?Seq2Seq“硬剛”小學數學應用題 - 科學空間|Scientific Spaces?spaces.ac.cn/archives/7809正在上傳…重新上傳取消
2、然后要通過一些后處理方式 把答案加以修正
(1)比如答案是什么類型的 幾分之幾的 問的是利率的 問的是小數的 等等分數就可以上一點
3、此題最大的問題是合規問題,官方沒有給出標記的表達式,導致大家都只能去用ape數據集 然后就開始堆模型
不過我們試驗了 堆模型效果并不理想,通過仔細觀察 如果題目的語序變一下之后 他的預測結果就不穩了
4、另外提供一個思路 我們認為把表達式 標記成方程要好預測一些 畢竟方程短一些 并且更加直觀 但是很費人工
5、對于第4點 要注意 前后題目的方程必須要統一,比如雞兔同籠問題不能 一道題目設置雞為x 一道題目設置兔為x 這樣數據就混亂了 不利于訓練模型
6、另外現在的預訓練模型 其實對于句法的結構并不敏感 學到的更多的還是 詞語的意思
7、事情研究到這里 ,暫時沒有太大價值 繼續
這里貼一下成績:
8、可能現在人工智能還達不到自動解題的程度
北京智源人工智能研究院:智源深度 | NLP 面臨的三大真實挑戰(含視頻)21 贊同 · 0 評論文章正在上傳…重新上傳取消
個人感覺人在思考問題的時候 聯結主義和 符號主義是間斷存在的 現在深度網絡的方法應該只模仿了人腦的功能區。
9、其實生成的方法有個問題:本來一個題目的表達式其實有多種寫法,比如加法乘法有交換律結合律,也就是數字在這種情況下是不區分前后的,但是標簽只能標一個,兩個表達式必定有一個對 一個錯 (其實都對),這里定義loss就有一個問題,能不能定一個,loss兩個都對?
請教大家這個問題
總結
以上是生活随笔為你收集整理的2020 CCF BDCI小学数学应用题自动解题解题思路的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 全网整合营销能力训练要点
- 下一篇: sywz