201671010423 词频统计软件项目报告
生活随笔
收集整理的這篇文章主要介紹了
201671010423 词频统计软件项目报告
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
需求分析
1.程序可讀入任意英文文本文件,該文件中英文詞數大于等于1個。 2.程序需要很壯健,能讀取容納英文原版《哈利波特》10萬詞以上的文章。基本功能
1.指定單詞詞頻統計功能:用戶可輸入從該文本中想要查找詞頻的一個或任意多個英文單詞,運行程序的統計功能可顯示對應單詞在文本中出現的次數和柱狀圖。 2.高頻詞統計功能:用戶從鍵盤輸入高頻詞輸出的個數k,運行程序統計功能,可按文本中詞頻數降序顯示前k個單詞的詞頻及單詞。 3.統計該文本所有單詞數量及詞頻數,并能將單詞及詞頻數按字典順序輸出到文件result.txt。環境需求
1.測試機環境:Windows環境 2.JDK版本:jdk8u161 3.JRE版本:jre8u161功能設計
1.新建文本文件data.txt 2.統計各個單詞出現的次數 3.如果次數相同,安裝單詞的字典順序排序 4.輸出單詞個數 5.輸入要查詢的單詞,顯示它出現的次數 6.輸出結果并將其存儲到result.txt文件中設計實現
通過Map集合,以鍵值對的方式去存儲單詞和出現的次數,定義一個文件字節讀取流,去讀取磁盤中的文件,創建了一個BufferReader的緩沖流,將字符流對象傳進去,提高讀取的效率,創建一個split數組,用來分割字符串,通過調用map的key值獲取value,進行單詞統計,用TreeMap實現Comparator接口,對Map集合進行排序測試運行
- 程序的運行截圖如下圖:
- 單詞查找:
- 單詞個數統計:
- 詞頻統計:
- 詞頻輸出結果:
- 單詞查找:
代碼片段
- 詞頻統計
- 詞頻數降序顯示
- 詞頻結果輸出到指定文件
展示PSP
| 任務內容 | 計劃共完成需要的時間(min) | 實際完成需要的時間(min) |
| 計劃 | 10 | 9 |
| 估計這個任務需要多少時間,并規劃大致工作步驟 | 15 | 20 |
| 開發 | 200 | 230 |
| 需求分析 (包括學習新技術) | 10 | 10 |
| 生成設計文檔 | 10 | 15 |
| 設計復審 (和同事審核設計文檔) | 10 | 12 |
| 代碼規范 (為目前的開發制定合適的規范) | 10 | 9 |
| 具體設計 | 40 | 45 |
| 具體編碼 | 120 | 130 |
| 代碼復審 | 15 | 12 |
| 測試(自我測試,修改代碼,提交修改) | 30 | 40 |
| 報告 | 15 | 15 |
| 測試報告 | 5 | 6 |
| 計算工作量 | 5 | 3 |
| 事后總結 ,并提出過程改進計劃 | 6 | 4 |
本次作業項目github地址
轉載于:https://www.cnblogs.com/MALIS/p/10527900.html
總結
以上是生活随笔為你收集整理的201671010423 词频统计软件项目报告的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 第27章:MongoDB-索引--唯一索
- 下一篇: python中迭代器和生成器的区别