Automatic Summarization of Bug Reports
| ? |
| ?CONTENT: example : KDE bug report: https://bugs.kde.org/show_bug.cgi?id=188311 ? (其中還有很多comments沒顯示) 構建分類器,對comments中的每一句話(sentence)進行二分類。其中,0代表不選入summary,1代表選入summary。 最終,生成對bug report的答案: |
| 研究問題:
|
| 實驗方法: 1.找一幫人(10個人),對5個開源項目(Eclipse,Platform,Gnome,Mozilla和KDE)的bug report進行人工的總結,最后對每個bug report,總結出所謂的gold standard summary(GSS)。 2.根據語料庫的不同(email,email&meeting data,bug report data),定義統一的特征,分別建立三個分類器。 為什么選擇email和meeting data,是因為,他們都屬于conversation(類似于對話的形式)的數據。 所謂的conversation features:
特別地,對于第一個分類器,基于email threads: 第二個分類器,基于email threads和meeting: 第三個分類器,基于bug report: 采用一部分bug report拿來做訓練,每句話同時由三個人看過。0代表沒有一個人將這句話納入gold standard summary,1代表只有一個人將這句話納入gold standard summary,以此類推。。。 因此,2和3(≥2)表示為positive sentence。 3.對于同一個(新的)bug report,三個不同的分類器都會生成三個不同的summary。 將其與gold standard summary進行比較,看看哪個更接近gold。 |
| ?個人觀點: 對于bug report的summary,更多應該針對于具體的內容而言,而其中的一些feature,例如,word count,position等顯然沒有十分豐富的意義,更多應該考慮一些語義方面的信息轉化成為可以量化的feature。 |
| ?備注:TSE2013 |
?
?
?
?
?
?
?
?
轉載于:https://www.cnblogs.com/XBWer/p/6417522.html
總結
以上是生活随笔為你收集整理的Automatic Summarization of Bug Reports的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: oracle case when及dec
- 下一篇: CloudStack学习-2