第4期-通过起点中文网爬取小说
生活随笔
收集整理的這篇文章主要介紹了
第4期-通过起点中文网爬取小说
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
起點中文網的歷史比較悠久,一般來說,新的小說和古老的小說的格式恐怕是不太一樣的,甚至vip章節和普通章節也是不一樣的,因此,我們就盡量挑選最新的小說研究一下。
首先是排行榜的地址
https://www.qidian.com/rank/hotsales/直接通過requests發起請求,就可以獲得所有的數據,沒有任何的反爬措施,可以說,起點是到目前為止見到過的最友好的網站,輕松就可以拿到排行榜數據。
然后我們選擇當前最熱門的小說《大奉打工人》
https://book.qidian.com/info/1019664125/同樣,沒有任何反爬措施,輕松就可以拿到所有的小說章節
進入小說章節后,我們發現,現在遇到了第一個小的麻煩,對方網站禁止了右鍵
但是,我們不用管他,直接對地址發起請求,可以看到,所有的數據都直接拿到了
<p>許七安幽幽醒來,嗅到了空氣中潮濕的腐臭味,令人輕微的不適,胃酸翻涌。 <p>這撲面而來的臭味是怎么回事,家里的二哈又跑床上拉屎來了....根據熏人程度,怕不是在我頭頂拉的... <p>許七安家里養了一條狗,品種哈士奇,俗稱二哈。 <p>北漂了十年,孤孤單單的,這人啊,寂寞久了,難免會想養條狗里慰藉和消遣....不是肉體上。 <p>睜開眼,看了下周遭,許七安懵了一下。 <p>石塊壘砌的墻壁,三個碗口大的方塊窗,他躺在冰涼的破爛草席上,陽光透過方塊窗照射在他胸口,光束中塵糜浮動。除了這個p標簽看著有點奇怪以外,所有的數據全部都是可以正常獲得
當然了,起點是一個收費網站,所有的vip章節是必須要賬號登錄,花錢購買才能爬取的,除此之外,起點是非常友好的,所有的數據獲取沒有反爬,沒有加密,隨便就可以獲得了
查看2021更多爬蟲分析,點擊這里
總結
以上是生活随笔為你收集整理的第4期-通过起点中文网爬取小说的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: C#程序崩溃捕获与自动重启方法(简洁有效
- 下一篇: 经典 | 单片机常用外围电路设计