Python中編寫并發程序

_ipo 發布于2019-07-31 11:38 / 3316人閱讀

摘要：在中由于歷史原因使得中多線程的效果非常不理想使得任何時刻只能利用一個核并且它的調度算法簡單粗暴多線程中讓每個線程運行一段時間然后強行掛起該線程繼而去運行其他線程如此周而復始直到所有線程結束這使得無法有效利用計算機系統中的局部性頻繁的線程切換

GIL

在Python中,由于歷史原因(GIL),使得Python中多線程的效果非常不理想.GIL使得任何時刻Python只能利用一個CPU核,并且它的調度算法簡單粗暴:多線程中,讓每個線程運行一段時間t,然后強行掛起該線程,繼而去運行其他線程,如此周而復始,直到所有線程結束.

這使得無法有效利用計算機系統中的"局部性",頻繁的線程切換也對緩存不是很友好,造成資源的浪費.

據說Python官方曾經實現了一個去除GIL的Python解釋器,但是其效果還不如有GIL的解釋器,遂放棄.后來Python官方推出了"利用多進程替代多線程"的方案,在Python3中也有concurrent.futures這樣的包,讓我們的程序編寫可以做到"簡單和性能兼得".

多進程/多線程+Queue

一般來說,在Python中編寫并發程序的經驗是:計算密集型任務使用多進程,IO密集型任務使用多進程或者多線程.另外,因為涉及到資源共享,所以需要同步鎖等一系列麻煩的步驟,代碼編寫不直觀.另外一種好的思路是利用多進程/多線程+Queue的方法,可以避免加鎖這樣麻煩低效的方式.

現在在Python2中利用Queue+多進程的方法來處理一個IO密集型任務.
假設現在需要下載多個網頁內容并進行解析,單進程的方式效率很低,所以使用多進程/多線程勢在必行.
我們可以先初始化一個tasks隊列,里面將要存儲的是一系列dest_url,同時開啟4個進程向tasks中取任務然后執行,處理結果存儲在一個results隊列中,最后對results中的結果進行解析.最后關閉兩個隊列.

下面是一些主要的邏輯代碼.

python# -*- coding:utf-8 -*-

#IO密集型任務
#多個進程同時下載多個網頁
#利用Queue+多進程
#由于是IO密集型,所以同樣可以利用threading模塊

import multiprocessing

def main():
    tasks = multiprocessing.JoinableQueue()
    results = multiprocessing.Queue()
    cpu_count = multiprocessing.cpu_count()  #進程數目==CPU核數目

    create_process(tasks, results, cpu_count)   #主進程馬上創建一系列進程,但是由于阻塞隊列tasks開始為空,副進程全部被阻塞
    add_tasks(tasks)  #開始往tasks中添加任務
    parse(tasks, results)  #最后主進程等待其他線程處理完成結果


def create_process(tasks, results, cpu_count):
    for _ in range(cpu_count):
        p = multiprocessing.Process(target=_worker, args=(tasks, results)) #根據_worker創建對應的進程
        p.daemon = True  #讓所有進程可以隨主進程結束而結束
        p.start() #啟動

def _worker(tasks, results):
    while True:   #因為前面所有線程都設置了daemon=True,故不會無限循環
        try:
            task = tasks.get()   #如果tasks中沒有任務,則阻塞
            result = _download(task)
            results.put(result)   #some exceptions do not handled
        finally:
            tasks.task_done()

def add_tasks(tasks):
    for url in get_urls():  #get_urls() return a urls_list
        tasks.put(url)

def parse(tasks, results):
    try: 
        tasks.join()
    except KeyboardInterrupt as err:
        print "Tasks has been stopped!"
        print err

    while not results.empty():
        _parse(results)



if __name__ == "__main__":
    main()

利用Python3中的concurrent.futures包
在Python3中可以利用concurrent.futures包,編寫更加簡單易用的多線程/多進程代碼.其使用感覺和Java的concurrent框架很相似(借鑒?)
比如下面的簡單代碼示例

pythondef handler():
    futures = set()

    with concurrent.futures.ProcessPoolExecutor(max_workers=cpu_count) as executor:
        for task in get_task(tasks):
            future = executor.submit(task)
            futures.add(future)

def wait_for(futures):
    try:
        for future in concurrent.futures.as_completed(futures):
            err = futures.exception()
            if not err:
                result = future.result()
            else:
                raise err
    except KeyboardInterrupt as e:
        for future in futures:
            future.cancel()
        print "Task has been canceled!"
        print e
    return result

總結
要是一些大型Python項目也這般編寫,那么效率也太低了.在Python中有許多已有的框架使用,使用它們起來更加高效.
但是自己的一些"小打小鬧"的程序這樣來編寫還是不錯的.:)

GPU云服務器云服務器 python程序編寫編寫python程序 python編寫爬蟲程序 python中主程序

文章版權歸作者所有，未經允許請勿轉載,若此文章存在違規行為，您可以聯系管理員刪除。

轉載請注明本文地址：http://specialneedsforspecialkids.com/yun/45376.html

上一篇：[譯] Python 學習 —— __init__() 方法 4

下一篇：ABS介紹-基于Ant的構建插件系統

相關文章

python基礎教程：異步IO 之 API

摘要：具有以下基本同步原語子進程提供了通過創建和管理子進程的。雖然隊列不是線程安全的，但它們被設計為專門用于代碼。表示異步操作的最終結果。 Python的asyncio是使用 async/await 語法編寫并發代碼的標準庫。通過上一節的講解，我們了解了它不斷變化的發展歷史。到了Python最新穩定版 3.7 這個版本，asyncio又做了比較大的調整，把這個庫的API分為了高層級API和...

vboy1010 2019-07-31 10:27 評論0 收藏0

Python中的并發處理之使用asyncio包

摘要：并發用于制定方案，用來解決可能但未必并行的問題。在協程中使用需要注意兩點使用鏈接的多個協程最終必須由不是協程的調用方驅動，調用方顯式或隱式在最外層委派生成器上調用函數或方法。對象可以取消取消后會在協程當前暫停的處拋出異常。導語：本文章記錄了本人在學習Python基礎之控制流程篇的重點知識及個人心得，打算入門Python的朋友們可以來一起學習并交流。本文重點： 1、了解asyncio...

tuniutech 2019-07-31 11:07 評論0 收藏0

Python

摘要：最近看前端都展開了幾場而我大知乎最熱語言還沒有相關。有關書籍的介紹，大部分截取自是官方介紹。但從開始，標準庫為我們提供了模塊，它提供了和兩個類，實現了對和的進一步抽象，對編寫線程池進程池提供了直接的支持。《流暢的python》閱讀筆記《流暢的python》是一本適合python進階的書, 里面介紹的基本都是高級的python用法. 對于初學python的人來說, 基礎大概也就夠用了...

dailybird 2019-07-30 15:13 評論0 收藏0

Python Process/Thread 概念整理

摘要：每個在同一時間只能執行一個線程在單核下的多線程其實都只是并發，不是并行，并發和并行從宏觀上來講都是同時處理多路請求的概念。在多線程下，每個線程的執行方式獲取執行代碼直到或者是虛擬機將其掛起。拿不到通行證的線程，就不允許進入執行。進程與線程并發與并行進程與線程　　首先要理解的是，我們的軟件都是運行在操作系統之上，操作系統再控制硬件，比如處理器、內存、IO設備等。操作系統為了向上...

Youngs 2019-07-31 10:33 評論0 收藏0

編寫一個并發性能測試的小程序

摘要：并發線程測試循環新建線程類，并在線程體內塞入單個的測試用例，以及全局的計數類。為了讓性能測試更充分，我編寫了不同的計算過程，并使用隨機函數隨機獲取并塞入線程執行。 ...

Michael_Lin 2021-09-07 09:59 評論0 收藏0

發表評論

登陸后可評論

0條評論

_ipo

男|高級講師

我要關注我要私信

TA的文章
閱讀更多

#618大促#華納云(hncloud)：CN2 2M平均18元/月，香港云服務器/物理機/高防3折起

閱讀 1993·2021-08-11 11:13

LOCVPS-2021年6月香港便宜vps寬帶升級，充值就送代金券，其它八折優惠！

閱讀 1014·2021-07-25 21:37

挖財 / 有贊電話面試題目分享

閱讀 2577·2019-08-29 18:42

JavaScript中Array類型中的方法

閱讀 2508·2019-08-26 12:18

詳解JS類概念的實現

閱讀 913·2019-08-26 11:29

js對html轉義和反轉義以及編碼和解碼

閱讀 1683·2019-08-23 17:17

前端性能優化--資源合并與壓縮

閱讀 2662·2019-08-23 15:55

elementUI源碼修改的爬坑之旅

閱讀 2597·2019-08-23 14:34

最新活動

国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務器低至59元/年，更有多臺、長期優惠，快來選購！

Python中編寫并發程序

相關文章

python基礎教程：異步IO 之 API

Python中的并發處理之使用asyncio包

Python

Python Process/Thread 概念整理

編寫一個并發性能測試的小程序

發表評論

0條評論

_ipo

男|高級講師

TA的文章

#618大促#華納云(hncloud)：CN2 2M平均18元/月，香港云服務器/物理機/高防3折起

LOCVPS-2021年6月香港便宜vps寬帶升級，充值就送代金券，其它八折優惠！

挖財 / 有贊電話面試題目分享

JavaScript中Array類型中的方法

詳解JS類概念的實現

js對html轉義和反轉義以及編碼和解碼

前端性能優化--資源合并與壓縮

elementUI源碼修改的爬坑之旅

最新活動