當(dāng)前位置：首頁 > 编程语言 > python >内容正文

python

【Python】基于Python的百度迁徙（2020年10月21日更）

發(fā)布時間：2023/12/10 python 52 豆豆

生活随笔收集整理的這篇文章主要介紹了【Python】基于Python的百度迁徙（2020年10月21日更）小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

簡介

百度遷徙
之前瞎投的中國人口地理學(xué)會的匯報居然中了，本菜雞居然居然居然被邀請上去匯報。。。
這幾天因為要準(zhǔn)備匯報的PPT，所以又登上去看看百度遷徙大數(shù)據(jù)，發(fā)現(xiàn)數(shù)據(jù)更新了！
從9月22日開始到昨天（10月20日）的數(shù)據(jù)都有。然后我就拿上半年寫的代碼試著爬取了一下，發(fā)現(xiàn)舊的代碼不太適用了，于是乎我研究了一下就寫了這篇博客。

舊代碼及爬取效果可以看我前幾篇文章，鏈接在下面。
基于python的百度遷徙1——遷入、遷出數(shù)據(jù)（附代碼）
基于python的百度遷徙2——遷徙規(guī)模指數(shù)（附代碼）
基于python的百度遷徙3——城內(nèi)出行強(qiáng)度（附代碼）

基于前幾篇博文的代碼改變

我研究了一下，主要是requests返回的文本數(shù)據(jù)和以前不一樣了。
新返回的文本好像在一開始的地方多了一個字母（之前什么樣具體我也忘記了），如下圖。

所以，在進(jìn)行json化處理之前，需要重新提取一下文本。也就是說把之前的r=response.text[3:-1]全部更改為r=response.text[4:-1]。意思就是說之前提取的是從第3個字符到倒數(shù)第2個字符之間的內(nèi)容，現(xiàn)在要提取第4個字符到倒數(shù)第2個字符之間的內(nèi)容。
更更更簡單的說，就是按ctrl+H把代碼里r=response.text[3:-1]全部替換為r=response.text[4:-1]。
-----------------------分割線（以下是乞討內(nèi)容）-----------------------

總結(jié)

以上是生活随笔為你收集整理的【Python】基于Python的百度迁徙（2020年10月21日更）的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

Python

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

生活随笔