python2异步编程_Python 异步编程入门
本文是寫給 JavaScript 程序員的 Python 教程。
Python 的異步編程,其他人可能覺得很難,但是 JavaScript 程序員應該特別容易理解,因為兩者的概念和語法類似。JavaScript 的異步模型更簡單直觀,很適合作為學習 Python 異步的基礎。
本文解釋 Python 的異步模塊 asyncio 的概念和基本用法,并且演示如何通過 Python 腳本操作無頭瀏覽器 pyppeteer 。
一、Python 異步編程的由來
歷史上,Python 并不支持專門的異步編程語法,因為不需要。
有了多線程(threading)和多進程(multiprocessing),就沒必要一定支持異步了。如果一個線程(或進程)阻塞,新建其他線程(或進程)就可以了,程序不會卡死。
但是,多線程有"線程競爭"的問題,處理起來很復雜,還涉及加鎖。對于簡單的異步任務來說(比如與網頁互動),寫起來很麻煩。
Python 3.4 引入了 asyncio 模塊,增加了異步編程,跟 JavaScript 的async/await 極為類似,大大方便了異步任務的處理。它受到了開發者的歡迎,成為從 Python 2 升級到 Python 3 的主要理由之一。
二、asyncio 的設計
asyncio 模塊最大特點就是,只存在一個線程,跟 JavaScript 一樣。
由于只有一個線程,就不可能多個任務同時運行。asyncio 是"多任務合作"模式(cooperative multitasking),允許異步任務交出執行權給其他任務,等到其他任務完成,再收回執行權繼續往下執行,這跟 JavaScript 也是一樣的。
由于代碼的執行權在多個任務之間交換,所以看上去好像多個任務同時運行,其實底層只有一個線程,多個任務分享運行時間。
表面上,這是一個不合理的設計,明明有多線程多進程的能力,為什么放著多余的 CPU 核心不用,而只用一個線程呢?但是就像前面說的,單線程簡化了很多問題,使得代碼邏輯變得簡單,寫法符合直覺。
asyncio 模塊在單線程上啟動一個事件循環(event loop),時刻監聽新進入循環的事件,加以處理,并不斷重復這個過程,直到異步任務結束。事件循環的內部機制,可以參考 JavaScript 的模型,兩者是一樣的。
三、asyncio API
下面介紹 asyncio 模塊最主要的幾個API。注意,必須使用 Python 3.7 或更高版本,早期的語法已經變了。
第一步,import 加載 asyncio 模塊。
import asyncio
第二步,函數前面加上 async 關鍵字,就變成了 async 函數。這種函數最大特點是執行可以暫停,交出執行權。
async def main():
第三步,在 async 函數內部的異步任務前面,加上await命令。
await asyncio.sleep(1)
上面代碼中,asyncio.sleep(1) 方法可以生成一個異步任務,休眠1秒鐘然后結束。
執行引擎遇到await命令,就會在異步任務開始執行之后,暫停當前 async 函數的執行,把執行權交給其他任務。等到異步任務結束,再把執行權交回 async 函數,繼續往下執行。
第四步,async.run() 方法加載 async 函數,啟動事件循環。
asyncio.run(main())
上面代碼中,asyncio.run() 在事件循環上監聽 async 函數main的執行。等到 main 執行完了,事件循環才會終止。
四、async 函數的示例
下面是 async 函數的例子,新建一個腳本async.py,代碼如下。
#!/usr/bin/env python3
# async.py
importasyncio
async defcount():
print("One")
await asyncio.sleep(1)
print("Two")
async defmain():
await asyncio.gather(count(), count(), count())
asyncio.run(main())
上面腳本中,在 async 函數main的里面,asyncio.gather() 方法將多個異步任務(三個 count())包裝成一個新的異步任務,必須等到內部的多個異步任務都執行結束,這個新的異步任務才會結束。
腳本的運行結果如下。
$ python3 async.py
One
One
One
Two
Two
Two
上面運行結果的原因是,三個 count() 依次執行,打印完 One,就休眠1秒鐘,把執行權交給下一個 count(),所以先連續打印出三個 One。等到1秒鐘休眠結束,執行權重新交回第一個 count(),開始執行 await 命令下一行的語句,所以會接著打印出三個Two。腳本總的運行時間是1秒。
作為對比,下面是這個例子的同步版本 sync.py。
#!/usr/bin/env python3
# sync.py
importtime
defcount():
print("One")
time.sleep(1)
print("Two")
defmain():
for_inrange(3):
count()
main()
上面腳本的運行結果如下。
$ python3 sync.py
One
Two
One
Two
One
Two
上面運行結果的原因是,三個 count() 都是同步執行,必須等到前一個執行完,才能執行后一個。腳本總的運行時間是3秒。
五、實例:pyppeteer 模塊
最后是一個異步編程的真實例子:操作無頭瀏覽器。異步編程對代碼的簡化,在這個例子體現得淋漓盡致。
我們需要用到 pyppeteer 模塊,它是無頭瀏覽器 Puppeteer 的 Python 移植,API 跟 JavaScript 版本基本一致。下面是安裝命令。
$ python3 -m pip install pyppeteer
然后,寫一個網頁截圖腳本screenshot.py。
#!/usr/bin/env python3
# screenshot.py
importasyncio
frompyppeteerimportlaunch
async defmain():
browser = await launch()
page = await browser.newPage()
await page.goto('http://example.com')
await page.screenshot({'path':'example.png'})
await browser.close()
asyncio.run(main())
上面代碼中,啟動瀏覽器(launch)、打開新 Tab(newPage())、訪問網址(page.goto())、截圖(page.screenshot())、關閉瀏覽器(browser.close()),這一系列操作都是異步任務,使用 await 命令寫起來非常自然簡單。
執行這個腳本,當前目錄下就會生成截圖文件 example.png。
$ python3 screenshot.py
如果腳本執行時報錯 No usable sandbox!,可以參考這里。另外,第一次執行這個腳本,會下載安裝 Puppeteer,可能需要等待較長時間,但是此后的執行就會很快。
Pyppeteer 的官網還有其他實例,比如向網頁注入 JavaScript 代碼,大家可以自己試玩。
六、參考鏈接
創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎總結
以上是生活随笔為你收集整理的python2异步编程_Python 异步编程入门的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: gg修改器怎么用教学
- 下一篇: 欧拉公式cos_对复数,复数平面以及欧拉