日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪(fǎng)問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

201671010423 词频统计软件项目报告

發(fā)布時(shí)間:2024/7/5 编程问答 34 豆豆
生活随笔 收集整理的這篇文章主要介紹了 201671010423 词频统计软件项目报告 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

需求分析

1.程序可讀入任意英文文本文件,該文件中英文詞數(shù)大于等于1個(gè)。 2.程序需要很壯健,能讀取容納英文原版《哈利波特》10萬(wàn)詞以上的文章。

基本功能

1.指定單詞詞頻統(tǒng)計(jì)功能:用戶(hù)可輸入從該文本中想要查找詞頻的一個(gè)或任意多個(gè)英文單詞,運(yùn)行程序的統(tǒng)計(jì)功能可顯示對(duì)應(yīng)單詞在文本中出現(xiàn)的次數(shù)和柱狀圖。 2.高頻詞統(tǒng)計(jì)功能:用戶(hù)從鍵盤(pán)輸入高頻詞輸出的個(gè)數(shù)k,運(yùn)行程序統(tǒng)計(jì)功能,可按文本中詞頻數(shù)降序顯示前k個(gè)單詞的詞頻及單詞。 3.統(tǒng)計(jì)該文本所有單詞數(shù)量及詞頻數(shù),并能將單詞及詞頻數(shù)按字典順序輸出到文件result.txt。

環(huán)境需求

1.測(cè)試機(jī)環(huán)境:Windows環(huán)境 2.JDK版本:jdk8u161 3.JRE版本:jre8u161

功能設(shè)計(jì)

1.新建文本文件data.txt 2.統(tǒng)計(jì)各個(gè)單詞出現(xiàn)的次數(shù) 3.如果次數(shù)相同,安裝單詞的字典順序排序 4.輸出單詞個(gè)數(shù) 5.輸入要查詢(xún)的單詞,顯示它出現(xiàn)的次數(shù) 6.輸出結(jié)果并將其存儲(chǔ)到result.txt文件中

設(shè)計(jì)實(shí)現(xiàn)

通過(guò)Map集合,以鍵值對(duì)的方式去存儲(chǔ)單詞和出現(xiàn)的次數(shù),定義一個(gè)文件字節(jié)讀取流,去讀取磁盤(pán)中的文件,創(chuàng)建了一個(gè)BufferReader的緩沖流,將字符流對(duì)象傳進(jìn)去,提高讀取的效率,創(chuàng)建一個(gè)split數(shù)組,用來(lái)分割字符串,通過(guò)調(diào)用map的key值獲取value,進(jìn)行單詞統(tǒng)計(jì),用TreeMap實(shí)現(xiàn)Comparator接口,對(duì)Map集合進(jìn)行排序

測(cè)試運(yùn)行

  • 程序的運(yùn)行截圖如下圖:
    • 單詞查找:

    • 單詞個(gè)數(shù)統(tǒng)計(jì):
    • 詞頻統(tǒng)計(jì):
    • 詞頻輸出結(jié)果:

代碼片段

  • 詞頻統(tǒng)計(jì)
Map<String, Integer> wordsCount = new TreeMap<String,Integer>(); //存儲(chǔ)單詞計(jì)數(shù)信息,key值為單詞,value為單詞數(shù) //單詞的詞頻統(tǒng)計(jì) for (String li : lists) { if(wordsCount.get(li) != null){ wordsCount.put(li,wordsCount.get(li) + 1); }else{ wordsCount.put(li,1);
  • 詞頻數(shù)降序顯示
ArrayList<Map.Entry<String,Integer>> list = new ArrayList<Map.Entry<String,Integer>>(oldmap.entrySet()); Collections.sort(list,new Comparator<Map.Entry<String,Integer>>(){ @Override public int compare(Entry<String, Integer> o1, Entry<String, Integer> o2) { return o2.getValue() - o1.getValue(); //降序 } });
  • 詞頻結(jié)果輸出到指定文件
try{FileWriter fr=new FileWriter("D:\\results.txt");BufferedWriter txt=new BufferedWriter(fr);for (Map.Entry<String,Integer> entry: list) {txt.write(entry.getKey()+":"+entry.getValue());txt.newLine();}txt.flush();txt.close();System.out.println("詞頻統(tǒng)計(jì)結(jié)果已輸出到result.txt文件!");}catch(IOException e) {e.printStackTrace();

展示PSP

任務(wù)內(nèi)容計(jì)劃共完成需要的時(shí)間(min)實(shí)際完成需要的時(shí)間(min)
計(jì)劃109
估計(jì)這個(gè)任務(wù)需要多少時(shí)間,并規(guī)劃大致工作步驟1520
開(kāi)發(fā)200230
需求分析 (包括學(xué)習(xí)新技術(shù))1010
生成設(shè)計(jì)文檔1015
設(shè)計(jì)復(fù)審 (和同事審核設(shè)計(jì)文檔)1012
代碼規(guī)范 (為目前的開(kāi)發(fā)制定合適的規(guī)范)109
具體設(shè)計(jì)4045
具體編碼120130
代碼復(fù)審1512
測(cè)試(自我測(cè)試,修改代碼,提交修改)3040
報(bào)告1515
測(cè)試報(bào)告56
計(jì)算工作量53
事后總結(jié) ,并提出過(guò)程改進(jìn)計(jì)劃64
具體設(shè)計(jì)和具體編碼環(huán)節(jié)耗時(shí)最多,測(cè)試(自我測(cè)試,修改代碼,提交修改)環(huán)節(jié)估計(jì)和實(shí)踐相差巨大。具體原因可能要?dú)w結(jié)于由于Java編程功底很弱,對(duì)于Java語(yǔ)法結(jié)構(gòu)、類(lèi)的定義、函數(shù)的構(gòu)造等知識(shí)方面都嚴(yán)重匱乏導(dǎo)致在代碼編碼上浪費(fèi)了很多時(shí)間。

本次作業(yè)項(xiàng)目github地址

轉(zhuǎn)載于:https://www.cnblogs.com/MALIS/p/10527900.html

總結(jié)

以上是生活随笔為你收集整理的201671010423 词频统计软件项目报告的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。