python3學習筆記:多程序分散式小例子
阿新 • • 發佈:2019-02-05
最近一直跟著廖大在學Python,關於分散式程序的小例子挺有趣的,這裡做個記錄。
分散式程序
Python的multiprocessing模組不但支援多程序,其中managers子模組還支援把多程序分佈到多臺機器上。一個服務程序可以作為排程者,將任務分佈到其他多個程序中,依靠網路通訊。由於managers模組封裝很好,不必瞭解網路通訊的細節,就可以很容易地編寫分散式多程序程式。
master服務端原理:通過managers模組把Queue通過網路暴露出去,其他機器的程序就可以訪問Queue了
服務程序負責啟動Queue,把Queue註冊到網路上,然後往Queue裡面寫入任務,程式碼如下:
#task_master.py
#coding=utf-8
#多程序分散式例子
#伺服器端
from multiprocessing.managers import BaseManager
from multiprocessing import freeze_support #server啟動報錯,提示需要引用此包
import random,time,queue
#傳送任務的佇列
task_queue = queue.Queue()
#接收結果的佇列
result_queue = queue.Queue()
#從BaseManager繼承的QueueManager
class QueueManager (BaseManager):
pass
#win7 64 貌似不支援callable下呼叫匿名函式lambda,這裡封裝一下
def return_task_queue():
global task_queue
return task_queue
def return_result_queue():
global result_queue
return result_queue
def test():
#把兩個Queue註冊到網路上,callable引數關聯了Queue物件
#QueueManager.register('get_task_queue',callable=lambda:task_queue)
#QueueManager.register('get_result_queue',callable=lambda:result_queue)
QueueManager.register('get_task_queue',callable=return_task_queue)
QueueManager.register('get_result_queue',callable=return_result_queue)
#繫結埠5000,設定驗證碼‘abc’
manager = QueueManager(address=('127.0.0.1',5000),authkey=b'abc')#這裡必須加上本地預設ip地址127.0.0.1
#啟動Queue
manager.start()
#server = manager.get_server()
#server.serve_forever()
print('start server master')
#獲得通過網路訪問的Queue物件
task = manager.get_task_queue()
result = manager.get_result_queue()
#放幾個任務進去
for i in range(10):
n = random.randint(0,10000)
print('put task %d...' % n)
task.put(n)
#從result佇列讀取結果
print('try get results...')
for i in range(10):
r = result.get(timeout=10)
print('result:%s' % r)
#關閉
manager.shutdown()
print('master exit')
if __name__ == '__main__':
freeze_support()
test()
執行截圖如下:
在分散式多程序環境下,新增任務到Queue不可以直接對原始的task_queue進行操作,那樣就繞過了QueueManager的封裝,必須通過manager.get_task_queue()獲得的Queue介面新增。
任務程序,程式碼如下:
#task_worker.py
#coding=utf-8
#多程序分散式例子
#非服務端:worker
import time,sys,queue
from multiprocessing.managers import BaseManager
#建立類似的QueueManager
class QueueManager(BaseManager):
pass
#由於這個QueueManager只從網路上獲取Queue,所以註冊時只提供名字即可
QueueManager.register('get_task_queue')
QueueManager.register('get_result_queue')
#連線到伺服器,也就是執行task_master.py的機器
server_addr = '127.0.0.1'
print('connect to server %s...'% server_addr)
#埠和驗證碼注意要保持完全一致
m = QueueManager(address=(server_addr,5000),authkey=b'abc')
#從網路連線
m.connect()
#獲取Queue的物件
task = m.get_task_queue()
result = m.get_result_queue()
#從task佇列獲取任務,並把結果寫入result佇列
for i in range(10):
try:
n = task.get(timeout=1)
print('run task %d * %d...'% (n,n))
r = '%d * %d = %d' % (n,n,n*n)
time.sleep(1)
result.put(r)
except queue.Empty:
print('task queue is empty')
#處理結果
print('worker exit')
執行截圖如下: