python股票涨势_stock
stock
###思路
1 統計雪球討論熱門的股票
1.1.在主頁獲取雪球活躍用戶
1.2.在活躍用戶的發帖中統計股票被提及的次數
1.3.畫出與個股討論度與價格走勢圖
2 對評論情感分析
2.1.使用jieba分詞
[https://github.com/fxsjy/jieba.git](https://github.com/fxsjy/jieba.git)
2.2.股票領域語料庫的構建
統計評論中的詞語提及次數,把頻率較高的當做股票領域詞語
2.3.提取特征值
根據語料庫,提取特征值
2.4.使用nltk NaiveBayesClassifier簡單分類評論的正面和負面情緒
[http://streamhacker.com/2010/05/10/text-classification-sentiment-analysis-naive-bayes-classifier/](http://streamhacker.com/2010/05/10/text-classification-sentiment-analysis-naive-bayes-classifier/)
2.5.結論
利用上邊的語料庫提取特征值,很難判斷評論的正反情感,準確率只有一半。
詞典不夠代表性
2.6.第二種方法
論壇里對股票的評論一般都是正面的
把前幾天的個股討論度上升下降與第二天的股價上升下降進行機器學習,即統計概率
輸入前幾天的個股討論度,輸出第二天最有可能的股價走勢。
目前是統計前兩天的討論度和兩天的股價與第二天的股價走勢的關系,
0表示比昨天上升1表示下降2表示平,
例如前兩天的評論與股價走勢'1010'與第二天股價上升、下降、平的概率 0.0444444444444 0.955555555556 0.0
2.6.1.結論
結果準確率只有一半
2.7.第三種方法
討論度與第二天股價關系
todo:
統計被提及股票的版塊熱度圖,判斷版塊熱度加速度是否是熱點轉換的依據
個股與行業討論度與股價走勢的關系,利用機器學習預測走勢
分析用戶(或者大神)對個股的情緒與股價走勢的關系
分詞 不開心 會分成 不 開心 對情緒分析有點影響
分析哪幾個大V的觀點與大盤的走勢相符(合力對市場的影響)
###運行說明
python stockCode.py
用于抓取網易的股票信息,并保存在stock.xls中
python xueqiuPawer.py 3 2
抓取雪球從3天前開始2天內的數據
###需要安裝的python模塊
beautifulsoup
xlwt
xlrd
selenium
xlutils
nltk
####其他
chromedriver
###特殊說明
linux環境必須桌面版才能運行,因為需要打開瀏覽器
與50位技術專家面對面20年技術見證,附贈技術全景圖總結
以上是生活随笔為你收集整理的python股票涨势_stock的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: pep8 python 编码规范_「原创
- 下一篇: scanf调试_STM32调试利器之IT