文本分析:吉利不裁员不降薪背后的真相是什么
??之前推薦了一些數據入門的資料,這里不妨以一個小小的案例講解如何進行簡單的文本分析。主要的步驟包括以下:
我們可以借知乎了解一下最近沸沸揚揚的吉利事件,了解一下偉大的民族汽車品牌、買車就是愛國的浙江吉利控股。當然純粹技術分享,卑微的號沒啥流量,求資本家放過。
首先是爬蟲,打開該問題網頁后找到真正和服務器端交流的鏈接。然后用requests自動把內容搞下來,結果存入csv中如圖所示:
這里主要爬取了以下問題:
吉利汽車不裁員的內幕曝光后,大家怎么看待民營汽車巨頭?
如何評價吉利汽車的單休、軍訓、裁員套餐?
如何看待吉利對外宣稱不裁員不降薪,卻疑似內部裁員 20%?
接著,可以借用分詞工具jieba進行分詞,分詞前和分詞后的效果如圖所示
分完詞,可以稍加調整一下詞庫和停用詞,就是想顯示的詞加到詞庫里,不想看見的詞加到停用詞里。
按照頻率高低畫出高頻詞匯??梢钥吹匠霈F了一些奇怪的詞,如藍海、培訓、變相、仲裁、20、C、賠償等。這些高頻詞匯稍稍了解就可以知道事情真相。原來是:吉利總裁高調宣稱不裁員不降薪,原來吉利是不直接裁員,而是搞了個“藍海”計劃“變相”裁員,這個計劃是給20%的人績效打‘C’去勞動培訓,從而拒絕勞動法規定的賠償,因此很多同事得到通知后要去仲裁。這樣我們就可以通過找到高頻詞匯了解主流民意了
最后,用wordcloud畫出詞云來==。
詞云可以顯示出更多的詞來,例如勞動法、惡心、強制、法律、管理等。也可以把字的輪廓顯示如下,哈哈。
最后不妨用馬克思的一段話作為總結:
只有當他和自己的雇主疏遠了的時候,當他明顯地看出了雇主僅僅是由于私人利益、僅僅由于追求利潤才和他發生聯系的時候,當那種連最小的考驗也經不起的虛偽的善意完全消失了的時候,也只是在這個時候,工人才開始認清自己的地位和利益,開始獨立地發展起來,只是在這個時候,他才不再在思想上、感情上和要求上像奴隸一樣地跟著資產階級走。
聯系方式
公眾號搜索:YueTan
總結
以上是生活随笔為你收集整理的文本分析:吉利不裁员不降薪背后的真相是什么的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Pycharm+PyQt5环境配置
- 下一篇: 数据挖掘:一个end2end完整实例