ホームページ >バックエンド開発 >Python チュートリアル >Pythonによるマルチプロセス制御のチュートリアル解説(例付き)
この記事では、Python マルチプロセス制御のチュートリアル (例付き) を紹介します。一定の参考価値があります。必要な友人は参照してください。お役に立てば幸いです。
multiprocessing の概要
Multiprocessing は、Python に付属するマルチプロセス モジュールです。大規模なバッチでプロセスを生成できます。サーバーがマルチコア CPU、スレッドモジュールに似ています。マルチプロセスは、マルチスレッドに比べて、専用のメモリ空間があるため、安定性と安全性が高く、運用や保守でバッチ操作を行う場合、マルチプロセスの方がより適用可能なシナリオが豊富です
マルチプロセスパッケージは、ローカルとリモート同時操作では、グローバル解釈ロックを持つスレッドの代わりに子プロセスを使用することが効果的に回避されるため、マルチプロセッシングはマルチコア処理を効果的に利用できます
#プロセス クラス
#Inマルチプロセスでは、プロセスは Process クラス オブジェクトを通じてバッチで生成され、start() メソッドを使用してプロセス#1 が開始されます。 # #2.Process クラスのメソッドとオブジェクト
run()
このメソッドはプロセスの実行プロセスであり、次のことができます。サブクラスで繰り返される このメソッドを作成する場合、通常、再構築されることはほとんどありません。start()
join([timeout])
name
is_alive()プロセスはまだ生きています (True または False)。プロセスの生存とは、start() の開始から子プロセスの終了までを指します
daemon
注: バックグラウンドでの実行が設定されている場合、バックグラウンド プログラムは実行されず、子プロセスが作成されます pid
exitcode
terminate()
以下は簡単です。例:
multiprocessing.Process(group=None,target=None,name=None,args=(),kwargs={},*) group: 这个参数一般为空,它只是为了兼容threading.Tread target: 这个参数就是通过run()可调用对象的方法,默认为空,表示没有方法被调用 name: 表示进程名 args: 传给target调用方法的tuple(元组)参数 kwargs: 传给target调用方法的dict(字典)参数
もちろん各プロセスのIDを表示することもできます
#-*- coding:utf8 -*- import multiprocessing import time def work(x): time.sleep(1) print time.ctime(),'这是子进程[{0}]...'.format(x) if __name__ == '__main__': for i in range(5): p = multiprocessing.Process(target=work,args=(i,)) print '启动进程数:{0}'.format(i) p.start() p.deamon = Trueただし実際の利用プロセスでは、同時実行を完了するだけでは不十分です。たとえば、タスクが 30 個ありますが、サーバーのリソースが限られているため、毎回 5 つのタスクが同時実行されます。この場合、30 個のタスクをどのように取得するかという問題も発生します。さらに、同時処理タスク、特に時間がかかるタスクでは、一貫した実行時間を確保することが困難です。5 つのタスクが同時に実行され、そのうち 3 つは完了し、そのうちの 2 つはまだ時間がかかる場合があります。実行の場合、後続のタスクの実行を続行する前に、これら 2 つのプロセスの実行が完了するまで待つことはできません。そのため、プロセス コントロールの使用シナリオがここにあります。Process メソッドをいくつかのマルチプロセッシング パッケージおよびクラスと組み合わせて使用できます。
プロセス制御と通信の共通クラス
##1. キュー クラス## は、Python に付属する Queue.Queue に似ており、主に ## で使用されます。 # 小さいキューの構文:#-*- coding:utf8 -*- import multiprocessing import time import os def work(x): time.sleep(1) ppid = os.getppid() pid = os.getpid() print time.ctime(),'这是子进程[{0},父进程:{1},子进程:{2}]...'.format(x,ppid,pid) if __name__ == '__main__': for i in range(5): p = multiprocessing.Process(target=work,args=(i,)) print '启动进程数:{0}'.format(i) p.start() p.deamon = Trueクラス メソッド: qsize()
複数のプロセスまたはスレッドがキューを消費しているため、キューのおおよそのサイズを返します。データは必ずしも正しいとは限りません
empty()
full( )
キューがいっぱいかどうかを判断し、いっぱいの場合は True を返し、そうでない場合は Falseを返します
put(obj[, block[, timeout]])
Putオブジェクトをキューに追加し、オプションのパラメータ ブロックは True、タイムアウトは None です
#get()#オブジェクトをキューから削除します#
multiprocessing.Queue([maxsize])
pipe() 関数は、プロセス間でメッセージを送信できるオブジェクト接続のペアを返します。ログやプロセス制御を出力するのに役立ちます。Pip() オブジェクトは戻り値を返します。 2 つのオブジェクトです。Connection は 2 つのチャネルを表します。各接続オブジェクトには send() メソッドと recv() メソッドがあります。2 つ以上のプロセスが同時に同じパイプに対して読み取りまたは書き込みを行うため、データの混乱が生じる可能性があることに注意してください。私はテストしましたそれが、直接カバーされます。さらに、返された 2 つの接続のうち 1 つが send() データである場合、もう 1 つは、recv() でのみデータを受信できます。
#
#-*- coding:utf8 -*- from multiprocessing import Process, Queue def f(q): q.put([42,None,'hi']) if __name__ == '__main__': q = Queue() p = Process(target=f, args=(q,)) p.start() print q.get() #打印内容: [42,None,'hi'] p.join()出力は次のようになります。
#
三、Value,Array
在进行并发编程时,应尽量避免使用共享状态,因为多进程同时修改数据会导致数据破坏。但如果确实需要在多进程间共享数据,multiprocessing也提供了方法Value、Array
from multiprocessing import Process, Value, Array def f(n, a): n.value = 3.1415927 for i in range(len(a)): a[i] = -a[i] if __name__ == '__main__': num = Value('d',0.0) arr = Array('i', range(10)) p = Process(target=f, args=(num, arr)) p.start() p.join() print num.value print arr[:]
*print
3.1415927
[0, -1, -2, -3, -4, -5, -6, -7, -8, -9]*
四、Manager进程管理模块
Manager类管理进程使用得较多,它返回对象可以操控子进程,并且支持很多类型的操作,如: list, dict, Namespace、lock, RLock, Semaphore, BoundedSemaphore, Condition, Event, Barrier, Queue, Value, Array,因此使用Manager基本上就够了
from multiprocessing import Process, Manager def f(d, l): d[1] = '1' d['2'] = 2 d[0.25] = None l.reverse() if __name__ == '__main__': with Manager() as manager: d = manager.dict() l = manager.list(range(10)) p = Process(target=f, args=(d, l)) p.start() p.join() #等待进程结束后往下执行 print d,'\n',l
输出:
{0.25: None, 1: '1', '2': 2}
[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]
可以看到,跟共享数据一样的效果,大部分管理进程的方法都集成到了Manager()模块了
五、对多进程控制的应用实例
#-*- coding:utf8 -*- from multiprocessing import Process, Queue import time def work(pname,q): time.sleep(1) print_some = "{0}|this is process: {1}".format(time.ctime(),pname) print print_some q.put(pname) if __name__ == '__main__': p_manag_num = 2 # 进程并发控制数量2 # 并发的进程名 q_process = ['process_1','process_2','process_3','process_4','process_5'] q_a = Queue() # 将进程名放入队列 q_b = Queue() # 将q_a的进程名放往q_b进程,由子进程完成 for i in q_process: q_a.put(i) p_list = [] # 完成的进程队列 while not q_a.empty(): if len(p_list) <p>执行结果:</p><p><img src="https://img.php.cn//upload/image/167/872/710/1542261551928622.png" title="1542261551928622.png" alt="Pythonによるマルチプロセス制御のチュートリアル解説(例付き)"></p>
以上がPythonによるマルチプロセス制御のチュートリアル解説(例付き)の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。