近期计划
感覺自己涉入算法研究的時(shí)間太少了。好比一頭拉磨的驢子,一直在糾結(jié)于一些細(xì)枝末節(jié)的技術(shù)。從C# 跑到Python,然后又回歸C++,完全是在原地轉(zhuǎn)了一個(gè)很大的圈圈。目前已經(jīng)確定自己要學(xué)習(xí)C++語言,將在自己的實(shí)驗(yàn)框架都搭在C++語言平臺(tái)上,這樣就可以集中精力攻關(guān)一門語言了,不用C#會(huì)一點(diǎn),Python會(huì)一點(diǎn),卻都是小半瓶水的水平了。
近期還打算寫三個(gè)系列的偏技術(shù)性質(zhì)的博客,
1。libsvm分類,包括文本預(yù)處理部分的代碼以及調(diào)用libsvm部分的代碼。這個(gè)也是研一做的一個(gè)課程項(xiàng)目;
2。將上學(xué)期王斌老師的《現(xiàn)代信息檢索》課程項(xiàng)目過程中下載的語料庫整理下,整理成為分類語料庫。目前免費(fèi)像廣大網(wǎng)友提供提供分類語料庫的只有搜狗實(shí)驗(yàn)室一家,搜狗提供的新聞?dòng)兴约旱膬?yōu)點(diǎn):篇章長度都差不多,但是也有缺點(diǎn)。仿佛一些類別中的文章分類有錯(cuò)誤。
3。改寫一個(gè)Mini規(guī)模的搜索引擎 TSE(Tiny Search Engine)這個(gè)開源程序的提供者為《搜索引擎--原理,技術(shù)與系統(tǒng)》的作者,李曉明老師。但是原來的程序是在Linux平臺(tái)下運(yùn)行的,我想將它改為一個(gè)可以在Windows平臺(tái)運(yùn)行的程序。我在做本科畢設(shè)的時(shí)候,曾經(jīng)下載過該程序,可惜并沒有在Linux平臺(tái)上搭建成功。email 助教索求 配置文檔,也沒有回音。(估計(jì)助教那時(shí)候已經(jīng)畢業(yè)了。)《搜索引擎》一書還是不錯(cuò)的,偏重于工程實(shí)踐,如果再加上一份可運(yùn)行的代碼,那么可以幫助讀者更快地對搜索引擎有個(gè)框架性的入門了解。我個(gè)人覺得作者既然寫了這本書,而且在書中的3-5章著重介紹了TSE的實(shí)現(xiàn),并且還提供了源碼下載地址,那么就應(yīng)該維護(hù)一份能讓讀者自己通過閱讀簡要的配置說明,就能夠成功配置運(yùn)行的源碼。
轉(zhuǎn)載于:https://www.cnblogs.com/finallyliuyu/archive/2010/09/04/1817798.html
創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎(jiǎng)勵(lì)來咯,堅(jiān)持創(chuàng)作打卡瓜分現(xiàn)金大獎(jiǎng)總結(jié)
- 上一篇: 接雨水c语言算法精解,详解一道高频面试题
- 下一篇: File的创建删除复制等功能实现