當前位置:
首頁 >
Python爬取当当网图书数据
發布時間:2023/12/31
44
豆豆
生活随笔
收集整理的這篇文章主要介紹了
Python爬取当当网图书数据
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
Python爬取當當網圖書數據
前言:前段時間一直在幫人爬取當當網圖書數據。由于技術有限,折騰了挺久的,也在網上借鑒了些經驗,一開始一直拿不到自己想要的內容,后來發現了另外一個案例,拿到手后,修改了一些代碼, 終于實現了目標,在此分享給想爬取當當網圖書數據的童鞋。特別感謝前面的作者,給了我思路,代碼頭有原作者的代號!
直接上代碼吧!
前面部分代碼如上圖,稍微解釋一下(雖然我也很垃圾):這里是用Excel儲存的,7-15行代碼的作用是打開了一個Excel活動表,并命名了活動表的名稱,設置了表頭(注:時間是出版時間),第二十行是本人搜索的圖書類型,只爬取前面4頁的數據,根據自己需求,搜索圖書類型或者其他,找到URL規律換上自己的就行了。
這部分代碼就是提取及儲存的代碼了,可以自己研究下應用到別的網站,部分被注釋的代碼是作者用txt儲存的代碼,也可以在去掉注釋后用csv儲存也是可以的,一起送上代碼吧!
前面的都一樣,把openpyxl換成csv,就行了。注意表頭的順序,如果你要改變順序,代碼也是要調換一下的。
當當當,這就是最后的結果,灰常滿意!
有不懂的代碼,歡迎留言,一起交流交流!
第一次發表文章,請多多指教,共同進步!
源碼鏈接:
當當案例
總結
以上是生活随笔為你收集整理的Python爬取当当网图书数据的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Video Caption(跨模态视频摘
- 下一篇: python爬取图书信息_Python爬