python爬虫数据可视化_适用于Python入门者的爬虫和数据可视化案例
本篇文章適用于Python小白的教程篇,如果有哪里不足歡迎指出來,希望對你幫助。
本篇文章用到的模塊:
requests,re,os,jieba,glob,json,lxml,pyecharts,heapq,collection
首先
本文我們的目的
抓取周杰倫的所有歌曲,
歌詞,
以及評論
直接在搜索框搜索周杰倫
適用于Python入門者的爬蟲和數據可視化案例
第一步:
適用于Python入門者的爬蟲和數據可視化案例
在谷歌瀏覽器的抓包工具(F12)里面查看交互信息發現如下:
適用于Python入門者的爬蟲和數據可視化案例
如圖所示:是我們需要的信息,知道這些事情就變得簡單了
我們不需要用復雜的工具比如(selenium)去加載整個頁面
事實上,如果還沒想到抓取歌曲的方法,我估計就得用它了
我們再看header里面有什么
適用于Python入門者的爬蟲和數據可視化案例
這里面的string就不用管了,因為它已經在我們的url里面了
只需要看request headers 這個就是我們給服務器發送的東西,
發送之后,服務器返回給我們的就是network里面的信息。
好,接下來我們偽造瀏覽器發送請求。
具體代碼如下:
適用于Python入門者的爬蟲和數據可視化案例
這里面用到了xpath來找到對應標簽里面數據,
代碼不重要,思想懂了就行(代碼單獨執行可行)
執行結果如下:
適用于Python入門者的爬蟲和數據可視化案例
開始抓取歌曲信息
適用于Python入門者的爬蟲和數據可視化案例
同樣的道理我們通過偽造方式發送信息,獲取歌曲信息!!
直接上代碼
適用于Python入門者的爬蟲和數據可視化案例
上面需要注意:xpath來獲取需要的信息,利用正則來獲取ID(其實有很多方法)
適用于Python入門者的爬蟲和數據可視化案例
適用于Python入門者的爬蟲和數據可視化案例
一樣的道理,我們分析network來獲取我們需要的信息歌詞,評論!!
直接上代碼
適用于Python入門者的爬蟲和數據可視化案例
上面需要注意的是:利用json獲取需要的數據(至少比正則快點)
適用于Python入門者的爬蟲和數據可視化案例
數據分析,可視化
適用于Python入門者的爬蟲和數據可視化案例
上面需要注意的是:我們合并數據的時候,可以選擇性的刪除一些無用數據
適用于Python入門者的爬蟲和數據可視化案例
下面我們對周杰倫歌曲進行情緒化分析
適用于Python入門者的爬蟲和數據可視化案例
下面完成數據詞頻各種分析
適用于Python入門者的爬蟲和數據可視化案例
我們來看下結果
適用于Python入門者的爬蟲和數據可視化案例
適用于Python入門者的爬蟲和數據可視化案例
適用于Python入門者的爬蟲和數據可視化案例
適用于Python入門者的爬蟲和數據可視化案例
適用于Python入門者的爬蟲和數據可視化案例
適用于Python入門者的爬蟲和數據可視化案例
適用于Python入門者的爬蟲和數據可視化案例
適用于Python入門者的爬蟲和數據可視化案例
適用于Python入門者的爬蟲和數據可視化案例
適用于Python入門者的爬蟲和數據可視化案例
適用于Python入門者的爬蟲和數據可視化案例
適用于Python入門者的爬蟲和數據可視化案例
怎么樣,學到了嗎?看完記得動手操作哦!
總結
以上是生活随笔為你收集整理的python爬虫数据可视化_适用于Python入门者的爬虫和数据可视化案例的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 朝朝盈最多能存多少?
- 下一篇: python多个函数_什么是在Pytho