【Python】基于Python的百度迁徙(2020年10月21日更)
目錄
- 簡介
- 基于前幾篇博文的代碼改變
簡介
百度遷徙
之前瞎投的中國人口地理學會的匯報居然中了,本菜雞居然居然居然被邀請上去匯報。。。
這幾天因為要準備匯報的PPT,所以又登上去看看百度遷徙大數據,發現數據更新了!
從9月22日開始到昨天(10月20日)的數據都有。然后我就拿上半年寫的代碼試著爬取了一下,發現舊的代碼不太適用了,于是乎我研究了一下就寫了這篇博客。
舊代碼及爬取效果可以看我前幾篇文章,鏈接在下面。
基于python的百度遷徙1——遷入、遷出數據(附代碼)
基于python的百度遷徙2——遷徙規模指數(附代碼)
基于python的百度遷徙3——城內出行強度(附代碼)
基于前幾篇博文的代碼改變
我研究了一下,主要是requests返回的文本數據和以前不一樣了。
新返回的文本好像在一開始的地方多了一個字母(之前什么樣具體我也忘記了),如下圖。
所以,在進行json化處理之前,需要重新提取一下文本。也就是說把之前的r=response.text[3:-1]全部更改為r=response.text[4:-1]。意思就是說之前提取的是從第3個字符到倒數第2個字符之間的內容,現在要提取第4個字符到倒數第2個字符之間的內容。
更更更簡單的說,就是按ctrl+H把代碼里r=response.text[3:-1]全部替換為r=response.text[4:-1]。
-----------------------分割線(以下是乞討內容)-----------------------
總結
以上是生活随笔為你收集整理的【Python】基于Python的百度迁徙(2020年10月21日更)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 文件下载时,文件名乱码问题
- 下一篇: python学习第11天(2)