用python来吐槽,真是太会玩啦
文 |?ssw
來源:Python 技術(shù)「ID: pythonall」
上回說到要吐槽軒逸,羅列完就沒管它了:
晚上無聊刷懂車帝,看到有位哥們開噴的帖子
反手就是一個(gè)贊。
正所謂,師出有名,吐槽它也得有理有據(jù)。
巧婦難為無米之炊,先收集論據(jù)!
爬軒逸車友圈
過程照舊,請(qǐng)參考Python指導(dǎo)你買車,第二彈, 修改scrapy幾處:
條件改為“最不滿意”
設(shè)置爬60頁
爬到符合“【最不滿意】”的內(nèi)容130條:
http://ssw.fit/file/ 可查看內(nèi)容
詞云
“異響,塑料,飄,車漆薄,噪音”等等詞語在車主的描述中反復(fù)出現(xiàn),誰稱得上“罪魁禍?zhǔn)住?#xff1f;首當(dāng)其沖的就是“車漆”
'''生成詞云''' import?jieba from?wordcloud?import?WordCloudtxt?=?''?#文本內(nèi)容打開網(wǎng)頁復(fù)制即可:http://ssw.fit/file/軒逸最不滿意.txt words?=?jieba.lcut(txt)?????#精確分詞 newtxt?=?''.join(words)????#空格拼接 wordcloud?=?WordCloud(width?=?1200,height?=?1000,max_font_size?=?160,font_path="ZKTSongFXSFU.TTF").generate(newtxt) wordcloud.to_file('ciyun.png')經(jīng)檢查,文本中車漆薄、車漆太薄、車漆是真的薄、車漆是薄、車漆比較薄、車漆確實(shí)薄、車漆方面也比較薄、車漆非常的薄、車漆有點(diǎn)薄等出現(xiàn)“車漆”的地方多達(dá)21處。
軒逸的第一個(gè)槽點(diǎn)很明顯了,簡(jiǎn)而言之,用書法大家黃庭堅(jiān)的如椽大筆來寫就兩字:
漆薄
此書法剛勁有力,力透紙背,尤其“漆薄”兩大字,妙到巔峰。
值得注意的是,漆薄并非最大槽點(diǎn),我們繼續(xù)往下看。
某些字跡不夠清晰,更換字體重新生成詞云:
和動(dòng)力相關(guān)的吐槽占據(jù)了頭條,最大槽點(diǎn)是它!
槽點(diǎn)排行榜
上圖還不夠明顯,繼續(xù)調(diào)整參數(shù)
max_font_size?=?160將最大字號(hào)放大,用"方正蘇新"字體重新生成詞云:
圖中的字越大,可認(rèn)為文本中的相關(guān)描述越多,槽點(diǎn)越大
特別是“車漆薄”這種短詞語,詞云最容易體現(xiàn)。相比之下,“動(dòng)力”可能被車主描述為“上坡干吼不走,提速是真慢”,詞云不易體現(xiàn)。
觀察圖片,根據(jù)文字大小尋找到關(guān)鍵詞:
動(dòng)力、車漆、“隔音+噪音”、配置、定速巡航、異響、超車、飄
接下來統(tǒng)計(jì)它們?cè)谖谋局谐霈F(xiàn)的次數(shù)
import?codecs?#?作用:處理中文不亂碼 import?jieba?#?分詞 from?collections?import?Counter?#?計(jì)數(shù)def?make_word(txt):make_list?=?jieba.cut(txt)c?=?Counter()?#?對(duì)字典的增強(qiáng)for?i??in?make_list:if?len(i)?>=1?and?i!='\r\n':c[i]?=?c[i]?+1for?k,v?in?c.most_common(1000):if?k?in?['動(dòng)力','車漆','隔音','噪音','配置','定速巡航','異響','超車','飄']:print(k,v)if?__name__?==?'__main__':with?codecs.open('x.txt','r','utf8')?as?f:txt?=?f.read()make_word(txt)得到槽點(diǎn)的出現(xiàn)次數(shù),內(nèi)容如下
通過pyecharts繪制柱狀圖
榜單顯示,“動(dòng)力”32條穩(wěn)居榜首,“車漆”緊隨其后,“噪音”表現(xiàn)亮眼屈居季軍,“配置低”憑借一貫的尿性竄入前四?!鞍裎仓疇?zhēng)”倒不激烈,叨陪末座的“飄”,大概是車身輕,跑快了容易飄,加上動(dòng)力弱承受了不該承受的激情與速度,軒逸已難受控制,用小沈陽的話講,就是“軒逸,你咋又跑偏了捏?”。
軒逸說你這么吐槽我,太委屈了,就一無是處嗎?。
那咱們換個(gè)可愛一點(diǎn)的字體,給你個(gè)“真皮大沙發(fā)”:
定速巡航同樣被吐槽的多,頂配都減配,眾所周知,委系的作風(fēng)一貫如此。
到這里就基本吐槽完了,作為一臺(tái)價(jià)格10w級(jí)以上的家用轎車,軒逸雷凌卡羅拉“馬路三大媽”同為日系,缺點(diǎn)如出一轍,動(dòng)力弱雞、皮薄少餡安全差!真雞賊!
補(bǔ)充一點(diǎn),詞云在處理中文時(shí)還需要指定中文字體(font_path參數(shù)),為豐富詞云圖片效果,可以下載一些字體
字體
下載一個(gè)叫“字加”的軟件
選擇喜歡的字體點(diǎn)擊紅框的地方,就會(huì)自動(dòng)在C:\Windows\Fonts添加這種字體
打開自己電腦C:\Windows\Fonts
選擇字體右鍵復(fù)制,并將該字體文件與代碼存放在同一目錄下(或在字體文件名前增加完整路徑)
設(shè)置wordcloud的font_path參數(shù)為字體名
至此,運(yùn)行腳本就可以看到各種字體的詞云圖片了
PS:Python技術(shù)交流群(技術(shù)交流、摸魚、白嫖課程為主)又不定時(shí)開放了,感興趣的朋友,可以在下方公號(hào)內(nèi)回復(fù):666,即可進(jìn)入,一起?100?天計(jì)劃!
老規(guī)矩,醬友們還記得么,右下角的 “在看” 點(diǎn)一下,如果感覺文章內(nèi)容不錯(cuò)的話,記得分享朋友圈讓更多的人知道!
【神秘禮包獲取方式】
識(shí)別文末二維碼,回復(fù):1024
總結(jié)
以上是生活随笔為你收集整理的用python来吐槽,真是太会玩啦的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 选择题
- 下一篇: 【Python】NumPy 中 rave