特定热点事件监控与分析项目
EventMonitor
Event monitor based on online news corpus built by Baidu search enginee using event keyword for event storyline and analysis,基于給定事件關鍵詞,采集事件資訊,對事件進行挖掘和分析。
項目地址:https://github.com/liuhuanyong/EventMonitor/
項目路線圖
項目細分
1) 基于話題關鍵詞的話題歷時語料庫采集
執行方式:進入EventMonitor目錄下,進入cmd窗口,執行"scrapy crawl eventspider -a keyword=話題關鍵詞",或者直接python crawl.py, 等待數秒后,既可以在news文件夾中存儲相應的新聞文件,可以得到相應事件的話題集,話題歷史文本
2)關于熱點事件的情感分析
對于1)得到的歷史語料,可以使用基于依存語義和情感詞庫的篇章級情感分析算法進行情感分析
這部分參考我的篇章級情感分析項目DocSentimentAnalysis:https://github.com/liuhuanyong/DocSentimentAnalysis
3)關于熱點事件的搜索趨勢
對于1)得到的歷史語料,可以使用百度指數,新浪微博指數進行采集
這部分參考我的百度指數采集項目BaiduIndexSpyder:https://github.com/liuhuanyong/BaiduIndexSpyder
微博指數采集項目WeiboIndexSpyder:https://github.com/liuhuanyong/WeiboIndexSpyder
4)關于熱點事件的話題分析
對于1)得到的歷史語料,可以使用LDA,Kmeans模型進行話題分析
這部分參考我的話題分析項目Topicluster:https://github.com/liuhuanyong/TopicCluster
5)關于熱點事件的代表性文本分析
對于1)得到的歷史語料,可以使用跨篇章的textrank算法,對文本集的重要性進行計算和排序
這部分參考我的文本重要性分析項目ImportantEventExtractor:https://github.com/liuhuanyong/ImportantEventExtractor
6)關于熱點事件新聞文本的圖譜化展示
對于得到每個歷史新聞事件文本,可以使用關鍵詞,實體識別等關系抽取方法對文本進行可視化展示
這部分內容,參考我的文本內容可視化項目項目TextGrapher:https://github.com/liuhuanyong/TextGrapher
結束語
關于事件監測的方法有很多,也有很多問題需要去解決,以上提出的方法只是一個嘗試,就算法本身還有許多需要改進的地方
項目地址:https://github.com/liuhuanyong/EventMonitor/
If any question about the project or me ,see https://liuhuanyong.github.io/
總結
以上是生活随笔為你收集整理的特定热点事件监控与分析项目的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Android官方开发文档Trainin
- 下一篇: Webpack构建性能优化指南