Python实战:利用正则表达式(requests模块)获取电影排行榜
本文的文字及圖片來源于網絡,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯系我們以作處理
以下文章來源于騰訊云 作者:做全棧攻城獅
( 想要學習Python?Python學習交流群:1039649593,滿足你的需求,資料都已經上傳群文件流,可以自行下載!還有海量最新2020python學習資料。 )
Python應用現在如火如荼,應用范圍很廣。因其效率高開發迅速的優勢,快速進入編程語言排行榜前幾名。本系列文章致力于可以全面系統的介紹Python語言開發知識和相關知識總結。希望大家能夠快速入門并學習Python這門語言。
這個網頁也是由html編寫而成的。打開微博熱搜。在網頁空白處點擊右鍵就可以看到網頁源代碼。
你會發現整個html代碼非常復雜。所以我們這邊就使用一個神器:開發人員工具。
網頁空白處點擊右鍵審查元素
然后選擇實時熱搜里面的內容。下方就會自動定位到你所選擇的代碼了。
我們查看一下實時熱搜這幾個標簽有什么規律:
我們可以看到我們想要的熱搜的內容都是如下結構:
電影名稱
所以我們就可以按照如上內容寫正則表達式,然后在html源代碼中匹配出來電影名稱就可以了
我們正則表達式可以這樣寫
.*?
其中我們用到了一個python網絡請求的框架。這個框架默認是沒有的。我們需要進行安裝的。
下載requests模塊,
安裝requests模塊
解壓模塊文件并打開kennethreitz-requests-3314259文件夾
按住鍵盤shift鍵,在空白區域右鍵點擊-在此處打開命令窗口
輸入以下指令:python setup.py install
點擊回車即可安裝。此時就可以導入requests模塊了
至此一個簡單的獲取熱門電影的爬蟲小程序開發完成。
總結
以上是生活随笔為你收集整理的Python实战:利用正则表达式(requests模块)获取电影排行榜的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: MySQL8.0 setup_actor
- 下一篇: 飞机大战小游戏 C语言(课设任务)