ホームページ  >  記事  >  バックエンド開発  >  Python での RabbitMQ の使用についての深い理解

Python での RabbitMQ の使用についての深い理解

高洛峰
高洛峰オリジナル
2017-03-15 14:16:346102ブラウズ

前書き: 今回はrabbitMQについて整理して記事を書いていますが、rabbitMQの方がずっと難しいと感じています。このブログでは一部英語の説明を挿入しますが、理解するのは難しくありません。 RabbitMQ のダウンロードとインストールについては、redis&rabbitMQ のインストールを参照してください。

rabbitMQ はメッセージ queue; キューキューについてこれまでに学んだことを考えてみましょう: スレッドキュー (スレッドキュー、複数のスレッド間のデータ対話)、プロセスキュー (親プロセスが子プロセスと対話するか、同じプロセスに属します)同じ親プロセスの下にある複数の子プロセスが対話します); 2 つの独立したプログラムがキューを介して対話できない場合は、中間エージェントである RabbitMQ が必要です。上の図からわかるように、データはまず Exchange エクスチェンジャー

に送信され、次に Exchange が対応するキューに送信されます。

pika モジュール

は、rabbitMQ への Python の

APIインターフェース

です。受信側には

深入了解python之rabbitMQ使用 コールバック関数

があり、データを受信するとすぐに が呼び出されます。メッセージがコンシューマーによって受信されると、メッセージはキューから 削除されます。上記の知識を理解したら、まず簡単な RabbitMQ キュー通信を見てみましょう。 senend: ~)

import pika
#连上rabbitMQ
connection=pika.BlockingConnection(pika.ConnectionParameters('localhost'))
channel=connection.channel()       #生成管道,在管道里跑不同的队列

#声明queue
channel.queue_declare(queue='hello1')

#n RabbitMQ a message can never be sent directly to the queue,it always needs to go through an exchange.
#向队列里发数据
channel.basic_publish(exchange='',      #先把数据发给exchange交换器,exchage再发给相应队列
                      routing_key='hello1', #向"hello'队列发数据
                      body='HelloWorld!!')  #发的消息
print("[x]Sent'HelloWorld!'")
connection.close()
詳細なテストの結果、次の 2 つの結果が得られました:

データを送信するには、最初に RabbitMQ_1_send.py を実行します。rabbitMQ_2_receive.py は実行されていません。受信が実行されている場合でもデータを受信できることがわかりました。

複数 (例: 3) のクライアントを実行してデータを受信し、次にクライアント 1 を実行してデータを受信し、次にクライアント 2 を実行してデータを受信し、次にクライアント 3 を実行します。データを受信します。

RabbitMQ は、デフォルトで、p によって送信されたメッセージを各コンシューマ (c) に分散します。これは、負荷分散 に似ています。 2. 完全な英語の ack

上記の例を見ると、コード no_ack=False (

消費が完了した後にサーバーに確認を送信します。デフォルトは False です
  1. )

    、CET-4 に合格した私の英語レベルでは、ack についての次の説明を読んだ後、それが非常に素晴らしいと感じたので、それを共有します:

  2. タスクの実行には数秒かかる場合があります。コンシューマの 1 つが長いタスクを開始し、それが部分的にしか完了せずに終了した場合はどうなるのか疑問に思われるかもしれません。この場合、RabbitMQ がメッセージを顧客に配信すると、そのメッセージはすぐにメモリから削除されます。ワーカーが処理していたメッセージも失われます。また、この特定のワーカーにディスパッチされていてもまだ handl されていないメッセージもすべて失われます。ただし、タスクは失いたくないのです。ワーカーが死亡した場合、タスクを別のワーカーに配信したいと考えています。

メッセージが決して失われないように、RabbitMQ はメッセージ確認応答をサポートしています。コンシューマから、特定のメッセージが受信、処理され、RabbitMQ がそれを自由に削除できることを RabbitMQ に伝えます。

ACK を送信せずにコンシューマーが死亡した場合 (チャネルが閉じられている、接続が閉じられている、または TCP 接続が失われた場合)、RabbitMQ はメッセージが完全に処理されなかったことを認識し、メッセージを再度キューに入れます。同時に オンラインに他の消費者がいる場合、すぐに別の消費者に再配信します。そうすることで、たとえワーカーが時折停止したとしても、メッセージが失われないようにすることができます。

メッセージのタイムアウトはありません。 RabbitMQ は、コンシューマが停止したときにメッセージを再配信します。メッセージの処理に非常に長い時間がかかっても問題ありません。

メッセージ確認はデフォルトでオンになっています。前の例では、no_ack=True フラグを使用して明示的にオフにしました。タスクが完了したら、このフラグを削除してワーカーから適切な確認を送信します。

このコードを使用すると、CTRL+C を使用してワーカーを強制終了した場合でも、その間それを確実に行うことができますメッセージを処理していたため、何も失われることはありません。ワーカーが死亡するとすぐに、未確認のメッセージはすべて再配信されます。

私は、送信端と受信端をそれぞれ生成者と消込者と比較します。生成者はタスク A を送信し、受信者はタスク A を受信し、処理され、処理された後に生成されます。ここで問題が発生しました。つまり、消費者がタスク A を受信したにもかかわらず、処理中に突然機械が停止した場合です。この問題を解決するには、 消費者にタスクを受信させ、処理が正常に完了したら ack を送信します。プロデューサーが ack を受信すると、ホワイト タスクが表示されます。 A は正常に処理されました。この時点で、ACK が受信されない場合はメッセージ リストからタスク A が削除されます。タスク A が正常に処理されるまで、タスク A を次のキャンセル者に送信する必要があります。第三に、メッセージの長期化

は、生産者がデータを生成し、消費者が再起動してデータを受信できることをすでに知っています。收データ

例: メッセージは転送中にrabbitMQサーバーマシンが終了しました、送信する前にメッセージリストが存在しません、今のところ私はメッセージを永続化する必要があります、メッセージ永続化会議にはメッセージリストがありませんサーバーマシンが消滅

し、永久に保存されます。デフォルト、無効にする場合は no_ack=True を使用します)。しかし、RabbitMQ サーバーが

最上位s にある場合でも、タスクは失われます。

RabbitMQ が終了またはクラッシュすると、あなたが指示しない限り、キューとメッセージを忘れます。メッセージが失われないようにするには 2 つのことが必要です: キューとメッセージの両方を耐久性としてマークする必要があります

まず、RabbitMQ がキューを決して失わないことを確認する必要があります。そのためには、これを durable:

1 channel.queue_declare(queue='hello', durtable=True)

として宣言する必要があります。このコマンドはそれ自体は正しいですが、私たちのセットアップでは動作しません。これは、耐久性のない hello というキューがすでに定義されているためです。 RabbitMQ では、異なるパラメーターを使用して既存のキューを再定義することはできず、それを実行しようとするプログラムにはエラー (会暴露错) を返します

。しかし、簡単な回避策があります。別の名前でキューを宣言しましょう。たとえば、task_queue:

1 channel.queue_declare(queue='task_queue', durtable=True)

この queue_declare の変更は両方に適用する必要があります。プロデューサとコンシューマのコード

At that point we're sure that the task_queue queue won't be lost even if RabbitMQ restarts. Now we need to mark our messages as persistent - by supplying a delivery_mode property with a value 2.

      1 channel.basic_publish(exchange='',
      2                       routing_key="task_queue",
      3                       body=message,
      4                       properties=pika.BasicProperties(
      5                          delivery_mode = 2,      # make message persistent
      6                       ))

上面的英文对消息持久化讲得很好。消息持久化分为两步:

  • 持久化队列。通过代码实现持久化hello队列:channel.queue_declare(queue='hello', durable=True)

  • 持久化队列中的消息。通过代码实现:properties=pika.BasicProperties( delivery_mode = 2, )

这里有个点要注意下:

如果你在代码中已实现持久化hello队列与队列中的消息。那么你重启rabbitMQ后再次运行代码可能会爆错!

因为: RabbitMQ doesn't allow you to redefine an existing queue with different parameters and will return an error.

为了解决这个问题,可以声明一个与重启rabbitMQ之前不同的队列名(queue_name).

 

四、消息公平分发

如果Rabbit只管按顺序把消息发到各个消费者身上,不考虑消费者负载的话,很可能出现,一个机器配置不高的消费者那里堆积了很多消息处理不完,同时配置高的消费者却一直很轻松。为解决此问题,可以在各个消费者端,配置perfetch=1,意思就是告诉RabbitMQ在我这个消费者当前消息还没处理完的时候就不要再给我发新消息了

深入了解python之rabbitMQ使用

 

带消息持久化+公平分发的完整代码

生产者端:

import pika
import sys
 
connection =pika.BlockingConnection(pika.ConnectionParameters(
        host='localhost'))
channel = connection.channel()
 
channel.queue_declare(queue='task_queue', durable=True)  #队列持久化
 
message = ' '.join(sys.argv[1:]) or"Hello World!"
channel.basic_publish(exchange='',
                      routing_key='task_queue',
                      body=message,
                      properties=pika.BasicProperties(
                         delivery_mode = 2, # make message persistent消息持久化
                      ))
print(" [x] Sent %r" % message)
connection.close()


消费者端:

#!/usr/bin/env python
import pika
import time
 
connection =pika.BlockingConnection(pika.ConnectionParameters(
        host='localhost'))
channel = connection.channel()
 
channel.queue_declare(queue='task_queue', durable=True)
print(' [*] Waiting for messages. To exit press CTRL+C')
 
def callback(ch, method, properties, body):
    print(" [x] Received %r" % body)
    time.sleep(body.count(b'.'))
    print(" [x] Done")
    ch.basic_ack(delivery_tag =method.delivery_tag)   
 
channel.basic_qos(prefetch_count=1)
channel.basic_consume(callback,
                      queue='task_queue')
 
channel.start_consuming()

我在运行上面程序时对消费者端里回调函数的一句代码(ch.basic_ack(delivery_tag =method.delivery_tag))十分困惑。这句代码去掉消费者端也能照样收到消息啊。这句代码有毛线用处??

生产者端消息持久后,需要在消费者端加上(ch.basic_ack(delivery_tag =method.delivery_tag)): 保证消息被消费后,消费端发送一个ack,然后服务端从队列删除该消息.

 

五、消息发布与订阅

之前的例子都基本都是1对1的消息发送和接收,即消息只能发送到指定的queue里,但有些时候你想让你的消息被所有的queue收到,类似广播的效果,这时候就要用到exchange了。PS:有兴趣的了解redis的发布与订阅,可以看看我写的博客python之redis。

An exchange is a very simple thing. On one side it receives messages from producers and the other side it pushes them to queues. The exchange must know exactly what to do with a message it receives. Should it be appended to a particular queue? Should it be appended to many queues? Or should it get discarded(丢弃). The rules for that are defined by the exchange type.

Exchange在定义的时候是有类型的,以决定到底是哪些Queue符合条件,可以接收消息

 

fanout: 所有bind到此exchange的queue都可以接收消息

direct: 通过routingKey和exchange决定的那个唯一的queue可以接收消息

topic:所有符合routingKey(此时可以是一个表达式)的routingKey所bind的queue可以接收消息

 

表达式符号说明: #代表一个或多个字符,*代表任何字符
          例:#.a会匹配a.a,aa.a,aaa.a等
                *.a会匹配a.a,b.a,c.a等
            注:使用RoutingKey为#,Exchange Type为topic的时候相当于使用fanout

 

下面我分别讲下fanout,direct,topic:

1、fanout

fanout: 所有bind到此exchange的queue都可以接收消息

深入了解python之rabbitMQ使用

send端:

import pika
import sys

connection=pika.BlockingConnection(pika.ConnectionParameters(host='localhost'))
channel=connection.channel()

channel.exchange_declare(exchange='logs',
                      type='fanout')

message=''.join(sys.argv[1:])or"info:HelloWorld!"
channel.basic_publish(exchange='logs',
                      routing_key='',  #fanout的话为空(默认)
                      body=message)
print("[x]Sent%r"%message)
connection.close()


receive端:

import pika

connection=pika.BlockingConnection(pika.ConnectionParameters(host='localhost'))
channel=connection.channel()

channel.exchange_declare(exchange='logs',type='fanout')

#不指定queue名字(为了收广播),rabbit会随机分配一个queue名字,
#exclusive=True会在使用此queue的消费者断开后,自动将queue删除
result=channel.queue_declare(exclusive=True)
queue_name=result.method.queue

#把声明的queue绑定到交换器exchange上
channel.queue_bind(exchange='logs',
                queue=queue_name)

print('[*]Waitingforlogs.ToexitpressCTRL+C')

def callback(ch,method,properties,body):
    print("[x]%r"%body)


channel.basic_consume(callback,
                      queue=queue_name,
                      no_ack=True)

channel.start_consuming()

有两个点要注意下:

  • fanout-广播,send端的routing_key='', #fanout的话为空(默认)

  • receive端有一句代码:result=channel.queue_declare(exclusive=True),作用:不指定queue名字(为了收广播),rabbitMQ会随机分配一个queue名字,exclusive=True会在使用此queue的消费者断开后,自动将queue删除。

 

2、有选择的接收消息(exchange type=direct)

RabbitMQ还支持根据关键字发送,即:队列绑定关键字,发送者将数据根据关键字发送到消息exchange,exchange根据 关键字 判定应该将数据发送至指定队列。

深入了解python之rabbitMQ使用

send端:

import pika
import sys
 
connection =pika.BlockingConnection(pika.ConnectionParameters(
        host='localh'))ost
channel = connection.channel()
 
channel.exchange_declare(exchange='direct_logs',
                         type='direct')
 
severity = sys.argv[1] iflen(sys.argv) > 1 else 'info'
message = ' '.join(sys.argv[2:]) or'Hello World!'
channel.basic_publish(exchange='direct_logs',
                      routing_key=severity, #关键字不为空,告知消息发送到哪里(info,error~)
                      body=message)
print(" [x] Sent %r:%r" % (severity, message))
connection.close()


receive端:

import pika
import sys
 
connection =pika.BlockingConnection(pika.ConnectionParameters(
        host='localhost'))
channel = connection.channel()
 
channel.exchange_declare(exchange='direct_logs',
                         type='direct')
 
result =channel.queue_declare(exclusive=True)
queue_name = result.method.queue
 
severities = sys.argv[1:]
if not severities:
    sys.stderr.write("Usage: %s [info] [warning] [error]\n" %sys.argv[0])
    sys.exit(1)
 
for severity in severities:
    channel.queue_bind(exchange='direct_logs',
                       queue=queue_name,
                       routing_key=severity)
 
print(' [*] Waiting for logs. To exit press CTRL+C')
 
def callback(ch, method, properties, body):
    print(" [x] %r:%r" %(method.routing_key, body))
 
channel.basic_consume(callback,
                      queue=queue_name,
                      no_ack=True)
 
channel.start_consuming()


其实最开始我看代码是一脸懵逼的~ 下面是我在cmd进行测试的截图(配合着截图看会容易理解些),一个send端,两个receive端(先起receive端,再起receive端):

send端:

深入了解python之rabbitMQ使用

receive端-1:

深入了解python之rabbitMQ使用

receive端-2:

深入了解python之rabbitMQ使用

 

3、更细致的消息过滤topic(供参考)

Although using the direct exchange improved our system, it still has limitations - it can't do routing based on multiple criteria.

In our logging system we might want to subscribe to not only logs based on severity, but also based on the source which emitted the log. You might know this concept from the syslog unix tool, which routes logs based on both severity (info/warn/crit...) and facility (auth/cron/kern...).

That would give us a lot of flexibility - we may want to listen to just critical errors coming from 'cron' but also all logs from 'kern'.

感觉我英文水平不高啊~,我对照着垃圾有道翻译,加上自己的理解,大概知道上面在讲什么。

举例: 如果是系统的错误,就把信息发送到A,如果是MySQL的错误,就把信息发送到B。但是对B来说,想实现接收MySQL错误信息,可以用有选择的接收消息(exchange type=direct),让关键字为error就实现了啊!现在B有个需求:不是所有的错误信息都接收,只接收指定的错误。在某种信息再进行过滤,这就是更细致的消息过滤topic。

 

send端:

import pika
import sys
 
connection = pika.BlockingConnection(pika.ConnectionParameters(
        host='localhost'))
channel = connection.channel()
 
channel.exchange_declare(exchange='topic_logs',
                         type='topic')  #类型为topic
 
routing_key = sys.argv[1] if len(sys.argv) > 1 else 'anonymous.info'
message = ' '.join(sys.argv[2:]) or 'Hello World!'
channel.basic_publish(exchange='topic_logs',
                      routing_key=routing_key,
                      body=message)
print(" [x] Sent %r:%r" % (routing_key, message))
connection.close()

receive端:

import pika
import sys
 
connection = pika.BlockingConnection(pika.ConnectionParameters(
        host='localhost'))
channel = connection.channel()
 
channel.exchange_declare(exchange='topic_logs',
                         type='topic')
 
result = channel.queue_declare(exclusive=True)
queue_name = result.method.queue
 
binding_keys = sys.argv[1:]
if not binding_keys:
    sys.stderr.write("Usage: %s [binding_key]...\n" % sys.argv[0])
    sys.exit(1)
 
for binding_key in binding_keys:
    channel.queue_bind(exchange='topic_logs',
                       queue=queue_name,
                       routing_key=binding_key)
 
print(' [*] Waiting for logs. To exit press CTRL+C')
 
def callback(ch, method, properties, body):
    print(" [x] %r:%r" % (method.routing_key, body))
 
channel.basic_consume(callback,
                      queue=queue_name,
                      no_ack=True)
 
channel.start_consuming()

六、RPC(Remote Procedure Call)

RPC的概念可看我百度的(其实就类似我之前做的FTP,我从客户端发一个指令,服务端返回相关信息):

RPC采用客户机/服务器模式。请求程序就是一个客户机,而服务提供程序就是一个服务器。首先,客户机调用进程发送一个有进程参数的调用信息到服务进程,然后等待应答信息。在服务器端,进程保持睡眠状态直到调用信息的到达为止。当一个调用信息到达,服务器获得进程参数,计算结果,发送答复信息,然后等待下一个调用信息,最后,客户端调用进程接收答复信息,获得进程结果,然后调用执行继续进行。

下面重点讲下RPC通信,我刚开始学挺难的,学完之后感觉RPC通信的思想很有启发性,代码的例子写得也很牛!!

深入了解python之rabbitMQ使用

client端发的消息被server端接收后,server端会调用callback函数,执行任务后,还需要把相应的信息发送到client,但是server如何将信息发还给client?如果有多个client连接server,server又怎么知道是要发给哪个client??

RPC-server默认监听rpc_queue.肯定不能把要发给client端的信息发到rpc_queue吧(rpc_queue是监听client端发到server端的数据)。

合理的方案是server端另起一个queue,通过queue将信息返回给对应client。但问题又来了,queue是server端起的,故client端肯定不知道queue_name,连queue_name都不知道,client端接收毛线的数据??

解决方法:

客户端在发送指令的同时告诉服务端:任务执行完后,数据通过某队列返回结果。客户端监听该队列就OK了。

client端:

import pika
import uuid


class FibonacciRpcClient(object):
    def init(self):
        self.connection = pika.BlockingConnection(pika.ConnectionParameters(host='localhost'))

        self.channel = self.connection.channel()
        #随机建立一个queue,为了监听返回的结果
        result = self.channel.queue_declare(exclusive=True)
        self.callback_queue = result.method.queue   ##队列名

        self.channel.basic_consume(self.on_response,  #一接收客户端发来的指令就调用回调函数on_response
                                   no_ack=True,
                                   queue=self.callback_queue)

    def on_response(self, ch, method, props, body):  #回调
        #每条指令执行的速度可能不一样,指令1比指令2先发送,但可能指令2的执行结果比指令1先返回到客户端,
        #此时如果没有下面的判断,客户端就会把指令2的结果误认为指令1执行的结果
        if self.corr_id == props.correlation_id:
            self.response = body

    def call(self, n):
        self.response = None    ##指令执行后返回的消息
        self.corr_id = str(uuid.uuid4())   ##可用来标识指令(顺序)
        self.channel.basic_publish(exchange='',
                                   routing_key='rpc_queue', #client发送指令,发到rpc_queue
                                   properties=pika.BasicProperties(
                                       reply_to=self.callback_queue, #将指令执行结果返回到reply_to队列
                                       correlation_id=self.corr_id,
                                   ),
                                   body=str(n))
        while self.response is None:
            self.connection.process_data_events() #去queue接收数据(不阻塞)
        return int(self.response)


fibonacci_rpc = FibonacciRpcClient()

print(" [x] Requesting fib(30)")
response = fibonacci_rpc.call(30)
print(" [.] Got %r" % response)

server端:

import pika
import time

connection = pika.BlockingConnection(pika.ConnectionParameters(
    host='localhost'))

channel = connection.channel()

channel.queue_declare(queue='rpc_queue')


def fib(n):
    if n == 0:
        return 0
    elif n == 1:
        return 1
    else:
        return fib(n - 1) + fib(n - 2)


def on_request(ch, method, props, body):
    n = int(body)

    print(" [.] fib(%s)" % n)
    response = fib(n)  #从客户端收到的消息

    ch.basic_publish(exchange='',   ##服务端发送返回的数据到props.reply_to队列(客户端发送指令时声明)
                     routing_key=props.reply_to,  #correlation_id (随机数)每条指令都有随机独立的标识符
                     properties=pika.BasicProperties(correlation_id= \
                                                         props.correlation_id),
                     body=str(response))
    ch.basic_ack(delivery_tag=method.delivery_tag)  #客户端持久化


channel.basic_qos(prefetch_count=1)  #公平分发
channel.basic_consume(on_request,    #一接收到消息就调用on_request
                      queue='rpc_queue')

print(" [x] Awaiting RPC requests")
channel.start_consuming()


以上がPython での RabbitMQ の使用についての深い理解の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。