pythonasyncio并发编程实战_python异步编程之asyncio(百万并发)
[python異步編程之a(chǎn)syncio(百萬(wàn)并發(fā))]
前言:python由于GIL(全局鎖)的存在,不能發(fā)揮多核的優(yōu)勢(shì),其性能一直飽受詬病。然而在IO密集型的網(wǎng)絡(luò)編程里,異步處理比同步處理能提升成百上千倍的效率,彌補(bǔ)了python性能方面的短板,如最新的微服務(wù)框架japronto,resquests per second可達(dá)百萬(wàn)級(jí)。
python還有一個(gè)優(yōu)勢(shì)是庫(kù)(第三方庫(kù))極為豐富,運(yùn)用十分方便。asyncio是python3.4版本引入到標(biāo)準(zhǔn)庫(kù),python2x沒(méi)有加這個(gè)庫(kù),畢竟python3x才是未來(lái)啊,哈哈!python3.5又加入了async/await特性。
在學(xué)習(xí)asyncio之前,我們先來(lái)理清楚同步/異步的概念:
·同步是指完成事務(wù)的邏輯,先執(zhí)行第一個(gè)事務(wù),如果阻塞了,會(huì)一直等待,直到這個(gè)事務(wù)完成,再執(zhí)行第二個(gè)事務(wù),順序執(zhí)行。。。
·異步是和同步相對(duì)的,異步是指在處理調(diào)用這個(gè)事務(wù)的之后,不會(huì)等待這個(gè)事務(wù)的處理結(jié)果,直接處理第二個(gè)事務(wù)去了,通過(guò)狀態(tài)、通知、回調(diào)來(lái)通知調(diào)用者處理結(jié)果。
一、asyncio
下面通過(guò)舉例來(lái)對(duì)比同步代碼和異步代碼編寫方面的差異,其次看下兩者性能上的差距,我們使用sleep(1)模擬耗時(shí)1秒的io操作。
·****同步代碼:
import time
def hello():
time.sleep(1)
def run():
for i in range(5):
hello()
print('Hello World:%s' % time.time()) # 任何偉大的代碼都是從Hello World 開(kāi)始的!
if __name__ == '__main__':
run()
輸出:(間隔約是1s)
Hello World:1527595175.4728756
Hello World:1527595176.473001
Hello World:1527595177.473494
Hello World:1527595178.4739306
Hello World:1527595179.474482
·****異步代碼:
import time
import asyncio
# 定義異步函數(shù)
async def hello():
asyncio.sleep(1)
print('Hello World:%s' % time.time())
def run():
for i in range(5):
loop.run_until_complete(hello())
loop = asyncio.get_event_loop()
if __name__ =='__main__':
run()
輸出:
Hello World:1527595104.8338501
Hello World:1527595104.8338501
Hello World:1527595104.8338501
Hello World:1527595104.8338501
Hello World:1527595104.8338501
async def 用來(lái)定義異步函數(shù),其內(nèi)部有異步操作。每個(gè)線程有一個(gè)事件循環(huán),主線程調(diào)用asyncio.get_event_loop()時(shí)會(huì)創(chuàng)建事件循環(huán),你需要把異步的任務(wù)丟給這個(gè)循環(huán)的run_until_complete()方法,事件循環(huán)會(huì)安排協(xié)同程序的執(zhí)行。
二、aiohttp
如果需要并發(fā)http請(qǐng)求怎么辦呢,通常是用requests,但requests是同步的庫(kù),如果想異步的話需要引入aiohttp。這里引入一個(gè)類,from aiohttp import ClientSession,首先要建立一個(gè)session對(duì)象,然后用session對(duì)象去打開(kāi)網(wǎng)頁(yè)。session可以進(jìn)行多項(xiàng)操作,比如post, get, put, head等。
基本用法:
async with ClientSession() as session:
async with session.get(url) as response:
aiohttp異步實(shí)現(xiàn)的例子:
import asyncio
from aiohttp import ClientSession
tasks = []
url = "https://www.baidu.com/{}"
async def hello(url):
async with ClientSession() as session:
async with session.get(url) as response:
response = await response.read()
print(response)
if __name__ == '__main__':
loop = asyncio.get_event_loop()
loop.run_until_complete(hello(url))
首先async def 關(guān)鍵字定義了這是個(gè)異步函數(shù),await 關(guān)鍵字加在需要等待的操作前面,response.read()等待request響應(yīng),是個(gè)耗IO操作。然后使用ClientSession類發(fā)起http請(qǐng)求。
多鏈接異步訪問(wèn)
如果我們需要請(qǐng)求多個(gè)URL該怎么辦呢,同步的做法訪問(wèn)多個(gè)URL只需要加個(gè)for循環(huán)就可以了。但異步的實(shí)現(xiàn)方式并沒(méi)那么容易,在之前的基礎(chǔ)上需要將hello()****包裝在asyncio的Future對(duì)象中,然后將Future對(duì)象列表作為任務(wù)傳遞給事件循環(huán)。
import time
import asyncio
from aiohttp import ClientSession
tasks = []
url = "https://www.baidu.com/{}"
async def hello(url):
async with ClientSession() as session:
async with session.get(url) as response:
response = await response.read()
# print(response)
print('Hello World:%s' % time.time())
def run():
for i in range(5):
task = asyncio.ensure_future(hello(url.format(i)))
tasks.append(task)
if __name__ == '__main__':
loop = asyncio.get_event_loop()
run()
loop.run_until_complete(asyncio.wait(tasks))
輸出:
Hello World:1527754874.8915546
Hello World:1527754874.899039
Hello World:1527754874.90004
Hello World:1527754874.9095392
Hello World:1527754874.9190395
收集http響應(yīng)
好了,上面介紹了訪問(wèn)不同鏈接的異步實(shí)現(xiàn)方式,但是我們只是發(fā)出了請(qǐng)求,如果要把響應(yīng)一一收集到一個(gè)列表中,最后保存到本地或者打印出來(lái)要怎么實(shí)現(xiàn)呢,可通過(guò)asyncio.gather(*tasks)將響應(yīng)全部收集起來(lái),具體通過(guò)下面實(shí)例來(lái)演示。
import time
import asyncio
from aiohttp import ClientSession
tasks = []
url = "https://www.baidu.com/{}"
async def hello(url):
async with ClientSession() as session:
async with session.get(url) as response:
# print(response)
print('Hello World:%s' % time.time())
return await response.read()
def run():
for i in range(5):
task = asyncio.ensure_future(hello(url.format(i)))
tasks.append(task)
result = loop.run_until_complete(asyncio.gather(*tasks))
print(result)
if __name__ == '__main__':
loop = asyncio.get_event_loop()
run()
輸出:
Hello World:1527765369.0785167
Hello World:1527765369.0845182
Hello World:1527765369.0910277
Hello World:1527765369.0920424
Hello World:1527765369.097017
[b'\r\n\r\n\r\n
\r\n......異常解決
假如你的并發(fā)達(dá)到2000個(gè),程序會(huì)報(bào)錯(cuò):ValueError: too many file descriptors in select()。報(bào)錯(cuò)的原因字面上看是 Python 調(diào)取的 select 對(duì)打開(kāi)的文件有最大數(shù)量的限制,這個(gè)其實(shí)是操作系統(tǒng)的限制,linux打開(kāi)文件的最大數(shù)默認(rèn)是1024,windows默認(rèn)是509,超過(guò)了這個(gè)值,程序就開(kāi)始報(bào)錯(cuò)。這里我們有三種方法解決這個(gè)問(wèn)題:
1.限制并發(fā)數(shù)量。(一次不要塞那么多任務(wù),或者限制最大并發(fā)數(shù)量)
2.使用回調(diào)的方式。
3.修改操作系統(tǒng)打開(kāi)文件數(shù)的最大限制,在系統(tǒng)里有個(gè)配置文件可以修改默認(rèn)值,具體步驟不再說(shuō)明了。
不修改系統(tǒng)默認(rèn)配置的話,個(gè)人推薦限制并發(fā)數(shù)的方法,設(shè)置并發(fā)數(shù)為500,處理速度更快。
#coding:utf-8
import time,asyncio,aiohttp
url = 'https://www.baidu.com/'
async def hello(url,semaphore):
async with semaphore:
async with aiohttp.ClientSession() as session:
async with session.get(url) as response:
return await response.read()
async def run():
semaphore = asyncio.Semaphore(500) # 限制并發(fā)量為500
to_get = [hello(url.format(),semaphore) for _ in range(1000)] #總共1000任務(wù)
await asyncio.wait(to_get)
if __name__ == '__main__':
# now=lambda :time.time()
loop = asyncio.get_event_loop()
loop.run_until_complete(run())
loop.close()
總結(jié)
以上是生活随笔為你收集整理的pythonasyncio并发编程实战_python异步编程之asyncio(百万并发)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: mysql不能设置密码_mysql不能设
- 下一篇: php ci model条件查询,php