日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

爬取动态页面2

發(fā)布時間:2024/9/5 编程问答 31 豆豆
生活随笔 收集整理的這篇文章主要介紹了 爬取动态页面2 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

動態(tài)頁面的爬取思路:

  1.? ajax? -----數(shù)據(jù)放在 json 中,在里面是否有url

  2.? js? 數(shù)據(jù)? ?通過? ? 搜索原頁面上的數(shù)據(jù)關(guān)鍵字? ? :ctrl + f? ?, 全局搜索關(guān)鍵字

?

例子:

開始網(wǎng)站? url = 'https://www.xuexi.cn/'

爬取的頁面1:

url 1= 'https://www.xuexi.cn/f997e76a890b0e5a053c57b19f468436/018d244441062d8916dd472a4c6a0a0b.html'

需求:爬取url1 所有新聞的詳情頁面

分析思路:圖示

  用?js 數(shù)據(jù)動態(tài)生成的思路 :? ?通過 搜索原頁面上的數(shù)據(jù)關(guān)鍵字? ? :ctrl + f? ?, 全局搜索關(guān)鍵字

?

爬取的頁面2:

url 2= 'https://www.xuexi.cn/261c9a142ef8e6375ed554815a26d585/f2d8ff735982530b7a8c9bb90fa99f68.html'

需求:爬取url2 所有新聞的詳情頁面

分析思路:

  先按思路 ,js 動態(tài)生成數(shù)據(jù)的思路,找,沒找到在按ajax 動態(tài)生成數(shù)據(jù)的思路。

  用 ajax動態(tài)生成的思路 :??ajax? -----數(shù)據(jù)放在 json 中,在里面是否有數(shù)據(jù)。(此處為ajax)

圖示:

代碼:

import requests分析之后得到獲取數(shù)據(jù)的url地址: url1 文需求1 的數(shù)據(jù)地址,url2 為需求2 的數(shù)據(jù)獲取地址。 url1 = 'https://www.xuexi.cn/f997e76a890b0e5a053c57b19f468436/data018d244441062d8916dd472a4c6a0a0b.js' url2 = 'https://www.xuexi.cn/lgdata/261c9a142ef8e6375ed554815a26d585/f2d8ff735982530b7a8c9bb90fa99f68.json'headers={'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.67 Safari/537.36' } res1 = requests.get(url=url2,headers=headers) res2 = requests.get(url=url2,headers=headers)

print(res1.content.decode()) print(res2.content.decode())

?

轉(zhuǎn)載于:https://www.cnblogs.com/knighterrant/p/10575523.html

總結(jié)

以上是生活随笔為你收集整理的爬取动态页面2的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。