《Python3网络爬虫开发实战(第二版)》上市了!!!!
“?
閱讀本文大概需要 5 分鐘。
?”告訴大家一個好消息:我的好朋友崔慶才老師的《Python3網絡爬蟲開發實戰(第二版)》現在正式上市了!!!!
沒錯,就是這本:
就是那個《Python3網絡爬蟲開發實戰》第一版的作者寫的,現在他出了第二版了。
崔慶才,如果你對爬蟲有所涉獵的話想必可能聽過他的名字,他目前在微軟就職,之前他的那本《Python3網絡爬蟲開發實戰》第一版算是廣大爬蟲愛好者的入門書籍了,銷量近 100000 冊。
后來,由于一些技術更迭,他開始策劃編寫本書的第二版。
2021 年11月,這第二版本書歷經各種反復修改、審稿等階段,到今天終于上市了!
第二版更新內容
大家第一個問題可能就會問,第二版比第一版更新了哪些內容?
因為技術總是在不斷發展和進步的,爬蟲技術也是一樣,它在爬蟲和反爬蟲不斷斗爭的過程中也在不斷演進。比如現在越來越多的網頁采取了各種防護措施,比如前端代碼的壓縮和混淆、API 的參數加密、WebDriver 的檢測,要做到高效的數據爬取,我們就需要懂得一些 JavaScript 逆向分析相關技術。App 也是一樣,App 的抓包防護、加殼保護、Native 化、風控檢測使得越來越多的 App 數據難以爬取,所以我們也不得不了解一些逆向相關技術,如 Xposed、Frida、IDA Pro 等工具的使用。除此之外,近幾年深度學習和人工智能發展得也是如火如荼,所以爬蟲也可以和人工智能結合起來,比如基于深度學習的驗證碼識別、網頁內容的智能化解析和提取等技術我們也可以進行學習和了解。另外,一些大規模爬蟲的管理和運維技術也在不斷發展,當前 Kubernetes、Docker、Prometheus 等云原生技術也非常火爆,基于 Kubernetes 等云原生技術的爬蟲管理和運維解決方案也已經很受青睞。然而,之前第一版書對以上提到的這些新興技術幾乎沒有提及。
除此之外,第一版書在講解數據爬取的過程中引用了很多案例和服務,比如貓眼電影網站、淘寶網站、代理服務網站,然而幾年過去了,有些案例網站和服務早已經改版或者停止維護,這就導致第一版書中的很多案例已經不能正常運行了。這其實是一個很大的問題,因為程序運行不通會大大降低學習的積極性和成就感,而且會浪費不少時間。另外,即使案例對應的爬蟲代碼及時更新了,那我們也不知道這些案例網站和服務什么時候會再次改版,因為這都是不可控的。所以,為了徹底解決這個問題,作者花費了近半年的時間構建了一個爬蟲案例平臺(https://scrape.center),平臺包含了幾十個爬蟲案例,包括服務端渲染(SSR)網站、單頁面應用(SPA)網站、各類反爬網站、驗證碼網站、模擬登錄網站、各類 App 等,覆蓋了現在爬蟲和反爬蟲相關的大多數技術,整個平臺都是我來維護的,書中幾乎所有案例都是從案例平臺來的,從而解決了頁面改版的問題。
所以,本書相比第一版來說,更新的內容主要如下:
絕大多數都遷移到了自建的案例平臺,以后再也不用擔心案例有過期或改版問題。
替換了原本第一章環境安裝的章節,將環境配置的部分全部匯總并遷移到案例平臺(https://setup.scrape.center)并在書中以外鏈的形式附上,以確保環境的配置和安裝說明能夠被及時更新。
增加了一些新的請求庫、解析庫、存儲庫等的介紹,如 httpx、parsel、Elasticsearch 等庫的介紹。
增加了異步爬蟲的介紹,如協程的基本原理、aiohttp 的使用和爬取實戰介紹。
增加了一些新興自動化工具的介紹,如 Pyppeteer、Playwright 的介紹。
增加了深度學習相關內容,如圖形驗證碼、滑動驗證碼的識別方案。
豐富了模擬登錄章節的內容,如增加了 JWT 模擬登錄的介紹和實戰、大規模賬號池的優化。
增加了 JavaScript 逆向的章節,包括網站加密和混淆技術、JavaScript 逆向調試技巧、JavaScript 的各種模擬執行方式、AST 還原混淆代碼、WebAssembly 等相關技術的介紹。
豐富了 App 自動化爬取技術的章節,如新興框架 Airtest 的介紹、手機群控和云手機技術的介紹。
增加了 Android 逆向章節,如反編譯、反匯編、Hook、脫殼、so 文件分析和模擬執行等技術的介紹。
增加了網頁智能化解析章節,包括列表頁、詳情頁內容提取算法和分類算法。
豐富了 Scrapy 相關章節的介紹,如 Pyppeteer 的對接、RabbitMQ 的對接、Prometheus 的對接等。
增加了基于 Kubernetes、Docker、Prometheus、Grafana 等云原生技術爬蟲管理和運維解決方案的介紹。
以上就是第二版的主要更新內容,更多詳情可以看《Python3網絡爬蟲開發實戰(第二版)》內容介紹
章節介紹
為了讓大家更直接地了解到全書的內容,這里就直接放目錄了:
整體來說,新增了很多很多爬蟲知識點,更新了全書爬蟲案例并解決了案例過期的問題。
另外通過目錄可以看到,全書一共 900 多頁,(量了下有 4.3 厘米厚),定價是 139.8 元。
可以直接看第二版嗎?
當然,有朋友也會擔心,我需不需要先學習第一版,然后才能學第二版呢?
答案是:可以直接學第二版,第二版書爬蟲的內容知識體系是完整的,一些舊的技術已經在第一版中移除,第二版的書籍是對所有爬蟲知識體系的全新升級。
沒有基礎可以學嗎?
有朋友也可能會問,沒有爬蟲或者 Python 基礎可以學嗎?
答案是:可以。本書就是專為零爬蟲基礎的朋友準備的,本書從最基礎的環境配置、基礎知識的講解開始,循序漸進地對爬蟲的各個知識點進行介紹,所以完全不用擔心沒有爬蟲基礎學不會的問題。如果沒有 Python 基礎,那也沒關系(當然有會更好),書中也會提及 Python 環境的配置并附上一些 Python 入門學習資料和鏈接,同時也會通過各個 Python 代碼片段來進行講解,很多案例也很簡單易懂,學爬蟲的時候 Python 也就會逐漸掌握了。
大咖推薦
這本書同時還獲得了 Python 之父的推薦(沒錯就是 Python 的創始人,Guido van Rossum)
另外還獲得了微軟亞洲互聯網工程院副院長曾文峰、知名爬蟲專家梁斌penny、中國人民大學高瓴人工智能學院長聘副教授宋睿華的推薦。
下面是推薦語的內容:
宣傳彩頁
另外編輯還為本書制作了幾張宣傳彩頁,是對整本書的一個宣傳介紹,大家可以看下:
有沒有電子版?
看到這里,大家可能也會問了,有沒有電子版呢?可能有的朋友習慣看電子版的書本來學習,有的朋友可能在海外也不方便購買,所以想要電子版。
但還是很遺憾地說:沒有電子版。
因為大家知道的,如果出了電子版,那么馬上就會有各種盜版襲來,網上也會造成各種惡意傳播。
所以,為了保護版權,這本書是沒有上電子版的,還請各位讀者諒解,謝謝。
購買鏈接
是的,最后就是大家最關心的部分了,到哪里能夠買到呢?
上架之前,作者與編輯經過各種溝通,原本是想給廣大讀者和粉絲們有個專屬優惠的,但是這個比較難操作,所以最終決定,整本書現在全網統一 7 折銷售了!
也就是說,原價 139.8 元,現在只需要 97.9 元就能買到了。
不過這個也是限時的,7 折優惠只到周五,也就是 12 月 3 日,之后會恢復 84 折銷售,也就是 117 元。
另外還有一個消息,前幾天作者簽名了 1000 本書。所以,現在這個階段,賣的全都是簽名版(只在京東),一共 1000 本,賣完即止,先到先得。
大家拿到書之后,扉頁就會有作者的簽名,是這樣子的:
如果不想要簽名版的朋友可以再等等,等簽名版的賣完了就是非簽名版的了。
下面是京東商品的截圖,可以看到寫著 1000 冊簽名版先到先得。
好了,廢話不多說了,上購買鏈接:
https://item.jd.com/13527222.html
為了方便購買,我把這個鏈接轉成了二維碼,大家可以直接掃碼購買:
星球送書活動
為了慶祝新書上市,作者也送福利給各位讀者啦。
之前作者崔慶才建立了一個知識星球,用于給星球的各位朋友解答問題,同時崔慶才也會在星球分享一些想法、干貨等內容,星球售價是 149?元,具體的詳情大家可以看這篇文章我創辦了一個知識星球。
現在有一個好消息,之前加入星球的和以后加入星球的,統統都送一本《Python3網絡爬蟲開發實戰(第二版)》的簽名書,目前無限期有效(如果有特殊變動會在星球公布)。
所以說,這個方式就是一個穩定有效的獲取簽名書的方式。
也就是說現在 149 元(以后可能會漲價)加入星球,現在能獲取原價 139.8 的書,還能有一年的星球服務。
這是星球的鏈接,大家感興趣可以掃碼加入:
好了,以上就是本篇文章的全部內容了!愿各位讀者都可以如愿得到想要的書籍~
好文和朋友一起看
總結
以上是生活随笔為你收集整理的《Python3网络爬虫开发实战(第二版)》上市了!!!!的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【机器学习】逻辑回归代码练习
- 下一篇: 【Python】全文3000字,Pyec