python从入门到放弃篇31(selenium库)模拟天猫登录输入不含验证码,初步实现
生活随笔
收集整理的這篇文章主要介紹了
python从入门到放弃篇31(selenium库)模拟天猫登录输入不含验证码,初步实现
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
今天把之前兩天的文章補上再說。這兩天在研究模擬登錄。暫時還沒有進展,但是我相信會好起來的。
我之前有一篇博文,是說爬取天貓圖書信息的,我是在爬了一頁后,也就是60本書后,遇到一個問題,就是碰到天貓要求登錄才能查看所有圖書信息,也就是說登錄后才能爬取全部,所以,就開始研究登錄爬取。
我們這次案例的網址是:https://www.tmall.com/,我們先來爬取一頁試試手。
完整代碼:
首先,我們還是用之前博文說的selenium庫模擬搜索和點擊加上構造xpath路徑,來爬取商品魔方全套的第一個頁面。我們的代碼會讓搜索框,自動搜索“魔方全套”商品信息。如下圖:
爬取過程:
然后,爬取完畢,會自動點擊鏈接"下一頁"進入下一頁進行爬取,但是,當你點擊下一頁的鏈接,會進入登錄界面,如下圖:
然后,我們可以故技重施,用自動輸入的方式,輸入我們的賬號和密碼,再自動點擊登錄按鈕,所以,代碼如下圖:
結果:
我突然發現事情不簡單,有驗證碼。。。然后,正在籌劃怎么通過驗證,不過,先跟大家分享一下我的進度。
最后,感謝大家前來閱讀鄙人的文章,文中或有諸多不妥之處,還望指出和海涵。
總結
以上是生活随笔為你收集整理的python从入门到放弃篇31(selenium库)模拟天猫登录输入不含验证码,初步实现的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Ernest Adams总结50个最伟大
- 下一篇: Excel设置选项按钮