M2 终审
?1、團隊成員簡介
?
左邊:馬騰躍 右邊:陳謀
左上:李劍鋒 ?左下:仉伯龍 右:盧惠明
團隊成員及博客:
李劍鋒: ? ? ? ?Blog: ? ? ?http://www.cnblogs.com/Power-Byte/
陳謀: ? ? ? ? ? ?Blog:????????http://www.cnblogs.com/13061176Terry/
馬騰躍: ? ? ? ??Blog: ? ? ? ?http://www.cnblogs.com/summerMTY/
盧惠民: ? ? ? ??Blog:????????http://www.cnblogs.com/lhm924/
仉伯龍: ? ? ? ??Blog: ? ? ? ?http://www.cnblogs.com/zhangbolong/
2、軟件工程介紹
?
項目目標:
- 在線問答網(wǎng)站中散落著許多有價值的知識和有借鑒意義的經(jīng)驗,然而對于一個不精通于信息檢索的人來說要尋找這些有價值的信息往往要耗費大量時間,甚至根本不能找到,故而本軟件在此需求的基礎(chǔ)上進行開發(fā),以滿足用戶對于信息檢索,信息篩選,信息翻譯,信息可視化等方面的需求。
預(yù)期的典型用戶:
軟件的用戶方一方面是學(xué)霸在線教學(xué)問答系統(tǒng)后臺的開發(fā)人員,開發(fā)人員可以通過軟件提供的接口來直接對于數(shù)據(jù)進行處理,開發(fā)人員具有專業(yè)計算機水平,
軟件的用戶方另一方面是普通用戶,本軟件將功能性的模塊進行集成與封裝并且提供UI接口服務(wù)于普通用戶對于信息檢索,信息篩選,信息翻譯,信息可視化等方面的需求。
預(yù)期的功能描述:
軟件產(chǎn)品功能主要包括定義在線教學(xué)問答網(wǎng)站的內(nèi)容結(jié)構(gòu),能夠從爬到的內(nèi)容中抽取元數(shù)據(jù)并將其納入到既定的組織結(jié)構(gòu)中,在用戶查詢時能夠給予快速準確的響應(yīng),并且支持標簽,翻譯的功能。
- 在線問答網(wǎng)站的內(nèi)容結(jié)構(gòu)定義;
主要是對在線問答網(wǎng)站的組織進行格式化提取,(包括網(wǎng)站的用戶提出的問題,以及其他用戶給出的相應(yīng)的解決方式),然后按照既定的格式整理并且存儲到數(shù)據(jù)庫中。
- 增量式的數(shù)據(jù)處理;
對于后續(xù)爬取得到的最新數(shù)據(jù),能夠按照定義好的內(nèi)容結(jié)構(gòu)準確地合并到已有的內(nèi)容中。
- 文本標簽;
對于用戶提出的問題所屬的類別使用標簽進行分類。
- 文本關(guān)鍵詞提取;
對于問題中所涉及的主要內(nèi)容以及術(shù)語進行分類提取。
- 文本內(nèi)容翻譯;
滿足基于不同語言背景的用戶搜集檢索資料的需求。
- 用戶界面與用戶進行交互。
滿足界面友好的要求,對于用戶來說易于上手,易于使用。
- 給在線組和app手機客戶端組上傳數(shù)據(jù)
當(dāng)有需求的時候,我們會給在線組上傳一定量的數(shù)據(jù),由于給網(wǎng)站上傳大量數(shù)據(jù)的時候會給網(wǎng)站服務(wù)器增加負擔(dān),有時網(wǎng)站拒絕訪問,有時網(wǎng)站崩潰,所以每次我們只上傳一定量的數(shù)據(jù),從而讓上傳數(shù)據(jù)變得穩(wěn)定。
預(yù)期用戶
- 由于我們的應(yīng)用是給學(xué)霸客戶端和在線系統(tǒng)使用,所以的目標就是給他們定時提供數(shù)據(jù)。
3、產(chǎn)品需求及反饋
?
| ? 需求 | 反饋 |
| 1.上傳數(shù)據(jù)(在線組、手機app組) | 1.定義Json規(guī)格,定義上傳文件類型 2.通過Json向Solr這個搜索引擎后臺上傳數(shù)據(jù) |
| 2.視頻文件(在線組) | 1.向爬蟲組提出要求,并且定時進行交流。 2.效果不盡如人意 |
| 3.問答(在線組、手機app組) | 1.剛開始用Stackoverflow的數(shù)據(jù)進行測試上傳 2.實現(xiàn)搜搜問問、百度知道、德問、cnblogs數(shù)據(jù)處理 |
| 4.對標簽進行定義(在線組) | 1.通過stackoverflow的api對相應(yīng)的標簽進行定義。 2.其他標簽從文章中抽取。 |
| 5.標簽、關(guān)鍵詞結(jié)果分析(老師) | 1.與學(xué)長的進行了相應(yīng)的對比,從F值來看,我們的測試效果比學(xué)長高17.8個百分點左右 |
| 6.兩個后端(老師) | 1.將處理數(shù)據(jù)和上傳數(shù)據(jù)分成兩部分,不同用戶可以登陸不同后端進行相應(yīng)的操作。 |
?
用戶評價:
| 在線組 | 數(shù)據(jù)能夠用,但是上傳的數(shù)據(jù)太少 |
| app組 | 數(shù)據(jù)現(xiàn)在能用的太少 |
?
4、預(yù)期目標以及實際情況
?
| 預(yù)期目標 | 1.處理數(shù)量 60000條 上傳數(shù)量8000條 2.能夠處理pdf、ppt、視頻、doc 3.問答網(wǎng)站:搜搜問問、百度知道、德問、cnblogs、stackoverflow、知乎 |
| 實際情況 | 1.實際處理數(shù)量 55308條 上傳數(shù)量240條 2.實際能處理的文件pdf、ppt、小部分視頻 3.實際問答網(wǎng)站:搜搜問問、百度知道、德問、cnblogs、stackoverflow |
?
由于后期時間原因,我們與在線組和app組的交流比較少,導(dǎo)致我們在Json格式定義、測試方面比較緩慢;
視頻部分能夠處理是因為我們獲得的文件不都是特別好,有些是因為視頻的相關(guān)文本數(shù)據(jù)太少,所以沒法給其
添加標簽、關(guān)鍵字等重要搜索關(guān)鍵字。
5、分工協(xié)作
?
我覺得一個PM在擔(dān)當(dāng)總的設(shè)計、構(gòu)建是不太好的,我真心的認為兩個規(guī)劃能力好的同學(xué)共同擔(dān)當(dāng)效果會更好。
因為我在統(tǒng)籌規(guī)劃的同時真心地覺得自身能力的不足,無法完美地擔(dān)任這個職責(zé),所以我覺得至少有一個人監(jiān)督會更好。
?
6、平衡 時間/質(zhì)量/資源
?
| 時間 |
| ||||||||||||||||||||||||||||||||||||||||||
| 質(zhì)量 | 進行了單元測試 | ||||||||||||||||||||||||||||||||||||||||||
| 資源 | 我們?nèi)肆Y源、物力資源都比較充足 |
?
7、軟件質(zhì)量
?
?
對每一個功能都進行了單元測試,雖然有些測試并非完全覆蓋,但是總體來說我們的功能比較完善,而且bug比較少
?
?
8、M2階段的實際進展
?
9、團隊成員在M2的角色和具體貢獻
?
| 名字 | 角色 | 具體的,?可衡量的,?可驗證的貢獻 | 得分 |
| 陳謀 | PM & Dev | 寫了10篇博客,多次和爬蟲組、客戶端、在線系統(tǒng)進行溝通,寫了 3213行代碼 | 90 |
| 李劍鋒 | Dev & Test | 寫了823行代碼, ?200行注釋, 1篇博客? | 60 |
| 盧惠明 | Dev & Test | 完成關(guān)鍵詞抽取,寫了495行代碼,并完成相應(yīng)的測試,2篇博客 | 40 |
| 仉伯龍 | ?Dev & Test | ?測試了關(guān)鍵詞抽取代碼,寫了235行代碼,測試其結(jié)果等 | 37 |
| ?劉夕霆 | Dev & Test | ?與android客戶端組進行溝通,寫了276行代碼,測試最終版本 | 35 |
| ?馬騰躍 | ?Dev & Test | ?寫了276行代碼,與在線組進行溝通、交流 | 38 |
?
10、成果展示
?
- 登陸界面
?
- 主界面:
- 添加文本:
- 原始數(shù)據(jù):
- 去噪:
- 分詞:
- 翻譯原文本:(API)
- 翻譯譯文:
- 中英對照:
- 最終結(jié)果:
?
- 上傳數(shù)據(jù)
?
11、軟件Bug
?
我們的軟件管理中遇到的Bug基本上在http://www.cnblogs.com/cheneygroup/p/5117810.html
?
12、個人總結(jié)
?
轉(zhuǎn)載于:https://www.cnblogs.com/cheneygroup/p/5118595.html
總結(jié)
- 上一篇: SpringMVC数据库链接池,以及其他
- 下一篇: Html5添加原生radio按钮和che