ホームページ >データベース >Redis >Redis6.0 でマルチスレッドが導入されるのはなぜですか?

Redis6.0 でマルチスレッドが導入されるのはなぜですか?

藏色散人転載: 2020-10-19 14:45:433049ブラウズ

次のコラムでは、#Redis チュートリアルコラムで Redis6.0 でマルチスレッドが導入される理由を紹介します。 , 困っている友達のお役に立てれば幸いです！

著者について: かつてはアリババ、デイリーフレッシュ、その他のインターネット企業でテクニカルディレクターとして働いていました。インターネット電子商取引で 15 年の経験。

100 日前、Redis 作者の antirez が自身のブログ (antirez.com) でニュースを発表し、Redis 6.0 が正式にリリースされました。最も目を引く変更の 1 つは、Redis 6.0 でマルチスレッドが導入されたことです。

この記事は主に 2 つの部分に分かれています。まず、Redis が 6.0 より前にシングルスレッドモデルを採用した理由について話しましょう。それではRedis6.0のマルチスレッドについて詳しく説明していきます。

Redis6.0 でマルチスレッドが導入されるのはなぜですか?

なぜ Redis は 6.0 より前にシングルスレッドモデルを使用したのですか?

厳密に言えば、Redis 4.0 以降はシングルスレッドモデルです。シングルスレッドモデルではありません。メインスレッドに加えて、不要な接続の解放、大きなキーの削除など、低速の操作を処理するバックグラウンドスレッドもいくつかあります。

シングルスレッドモデルのパフォーマンスがこれほど高いのはなぜですか?

Redis の作成者は、設計の最初から多くの側面を検討してきました。最終的には、コマンド処理にシングルスレッドモデルを使用することが選択されました。シングルスレッドモデルを選択する重要な理由はいくつかあります。

パフォーマンスのボトルネックは CPU にありません

次の図は、Redis のシングルスレッドモデルの説明です。公式ウェブサイト。一般的な意味は、Redis のボトルネックは CPU ではなく、主なボトルネックはメモリとネットワークであるということです。 Linux 環境では、Redis は 1 秒あたり 100 万件のリクエストを送信することもできます。

Redis6.0 でマルチスレッドが導入されるのはなぜですか?

#Redis のボトルネックは CPU ではないと言われるのはなぜですか?

まず、Redis のほとんどの操作はメモリに基づいており、純粋な kv (キーと値) 操作であるため、コマンドの実行速度は非常に高速です。 Redis 上のデータは大きな HashMap に格納されていることが大まかに理解できますが、HashMap の利点は、検索と書き込みの時間計算量が O(1) であることです。 Redis はこの構造を使用してデータを内部に保存し、Redis の高いパフォーマンスの基盤を築きます。 Redis 公式 Web サイトの説明によると、理想的な状況下では、Redis は 1 秒あたり 100 万件のリクエストを送信でき、各リクエストの送信に必要な時間はナノ秒のオーダーです。 Redis のすべての操作は非常に高速で、単一のスレッドで完全に処理できるため、わざわざマルチスレッドを使用する必要はありません。

スレッドコンテキストの切り替えの問題

さらに、マルチスレッドシナリオでは、スレッドコンテキストの切り替えが発生します。スレッドは CPU によってスケジュールされます。CPU の 1 つのコアは、タイムスライス内で同時に 1 つのスレッドのみを実行できます。一連の操作は、CPU がスレッド A からスレッド B に切り替わるときに発生します。メインプロセスには実行の保存が含まれますスレッドAの実行シーンを読み込み、スレッドBの実行シーンを読み込みます。この処理が「スレッドコンテキストの切り替え」です。これには、スレッド関連の命令の保存と復元が含まれます。

スレッドコンテキストの切り替えが頻繁に行われると、パフォーマンスが急激に低下する可能性があり、その結果、リクエストの処理速度が向上しないだけでなく、パフォーマンスも低下することになります。これが、Redis が慎重な理由の 1 つです。マルチスレッド技術。

Linux システムでは、vmstat コマンドを使用してコンテキストスイッチの数を確認できます。次に、vmstat を使用してコンテキストスイッチの数を確認する例を示します:

vmstat 1 は 1 秒あたり 1 回カウントすることを意味し、cs 列はコンテキストスイッチの数を示します。一般に、アイドルシステムのコンテキストスイッチは 1 秒あたり 1500 未満です。

Redis6.0 でマルチスレッドが導入されるのはなぜですか?

クライアントリクエストの並列処理 (I/O 多重化)

前述したように、Redis のボトルネックは CPU ではありません。主なボトルネックはメモリとネットワークです。いわゆるメモリのボトルネックは理解しやすいです。Redis をキャッシュとして使用する場合、多くのシナリオでは大量のデータをキャッシュする必要があるため、大量のメモリ領域が必要になります。これは、クラスターシャーディングなどによって解決できます。 Redis 独自のセンターレスクラスターシャーディングソリューションとエージェント用の Codis ベースのクラスターシャーディングスキーム。

ネットワークボトルネックの場合、Redis はネットワーク I/O モデルで多重化テクノロジを使用して、ネットワークボトルネックの影響を軽減します。多くのシナリオでシングルスレッドモデルが使用されているからといって、プログラムがタスクを同時に処理できないわけではありません。 Redis はシングルスレッドモデルを使用してユーザーリクエストを処理しますが、I/O 多重化テクノロジを使用して、複数の接続から送信されるリクエストを待機しながら、クライアントからの複数の接続を「並列」処理します。 I/O 多重化テクノロジを使用すると、システムのオーバーヘッドが大幅に削減され、システムは接続ごとに専用のリスニングスレッドを作成する必要がなくなり、多数のスレッドの作成によって引き起こされる膨大なパフォーマンスのオーバーヘッドを回避できます。

Redis6.0 でマルチスレッドが導入されるのはなぜですか?

多重化 I/O モデルについて詳しく説明します。これをより完全に理解するには、まずいくつかの基本概念を理解します。

ソケット (ソケット): ソケットは、2 つのアプリケーションがネットワーク上で通信するときの 2 つのアプリケーションの通信エンドポイントとして理解できます。通信中、あるアプリケーションはソケットにデータを書き込み、そのデータをネットワークカード経由で別のアプリケーションのソケットに送信します。私たちが通常 HTTP および TCP プロトコルと呼ぶリモート通信は、最下層の Socket に基づいて実装されます。 5 つのネットワーク IO モデルもすべて、Socket に基づいたネットワーク通信を実装しています。

ブロッキングと非ブロッキング: いわゆるブロッキングとは、すべてのロジックが処理されるまでリクエストをすぐに返すことができず、応答を返すことができないことを意味します。逆に、ノンブロッキングでは、すべてのロジックが処理されるのを待たずに、リクエストを送信し、すぐにレスポンスを返します。

カーネル空間とユーザー空間: Linux では、アプリケーションプログラムの安定性はオペレーティングシステムプログラムの安定性よりもはるかに劣るため、オペレーティングシステムの安定性を確保するために、Linux はカーネル空間とユーザー空間を区別します。カーネル空間ではオペレーティングシステムプログラムとドライバーが実行され、ユーザー空間ではアプリケーションが実行されることが理解できます。このようにして、Linux はオペレーティングシステムのプログラムとアプリケーションを分離し、アプリケーションがオペレーティングシステム自体の安定性に影響を与えるのを防ぎます。これは、Linux システムが非常に安定している主な理由でもあります。ディスクファイルの読み取りと書き込み、メモリの割り当てとリサイクル、ネットワークインターフェイスの呼び出しなど、すべてのシステムリソース操作はカーネル空間で実行されます。したがって、ネットワーク IO 読み取りプロセス中、データはネットワークカードからユーザー空間のアプリケーションバッファーに直接読み取られるのではなく、まずネットワークカードからカーネル空間バッファーにコピーされ、次にカーネルからユーザーにコピーされます。スペース、アプリケーションバッファ。ネットワーク IO 書き込みプロセスの場合はその逆で、まずユーザー空間のアプリケーションバッファからカーネルバッファにデータがコピーされ、次にカーネルバッファからネットワークカードを介してデータが送信されます。

多重化 I/O モデルは、マルチチャネルイベント分離関数 select、poll、および epoll に基づいて構築されています。 Redis で使用される epoll を例にとると、読み取りリクエストを開始する前に、まず epoll のソケット監視リストが更新され、その後 epoll 関数が戻るのを待ちます (このプロセスはブロックしているため、多重化 IO は本質的にブロッキング IO モデルです)。。特定のソケットからデータが到着すると、epoll 関数が戻ります。この時点で、ユーザースレッドはデータを読み取って処理するための読み取りリクエストを正式に開始します。このモードでは、専用の監視スレッドを使用して複数のソケットをチェックし、特定のソケットにデータが到着すると、ワーカースレッドに引き渡されて処理されます。 Socket データの到着を待つプロセスは非常に時間がかかるため、この方法は、ブロッキング IO モデルの 1 つの Socket 接続に 1 つのスレッドが必要であるという問題を解決し、非ブロック IO モデルでのビジーポーリングによる CPU パフォーマンスの損失の問題も発生しません。 -ブロッキングIOモデル。多重 IO モデルには多くの実用的なアプリケーションシナリオがあり、よく知られている Redis、Java NIO、Dubbo が使用する通信フレームワークである Netty はすべてこのモデルを使用しています。

Redis6.0 でマルチスレッドが導入されるのはなぜですか?

#次の図は、epoll 関数に基づくソケットプログラミングの詳細なプロセスです。

Redis6.0 でマルチスレッドが導入されるのはなぜですか?

保守性

マルチスレッドによりマルチコア CPU を最大限に活用できることがわかっています。高い同時実行性の実現このシナリオでは、I/O 待機による CPU の損失が軽減され、良好なパフォーマンスがもたらされます。ただし、マルチスレッドは諸刃の剣であり、利点がある一方で、コードのメンテナンス、オンラインの問題の特定とデバッグの困難、デッドロックなどの問題も引き起こします。マルチスレッドモデルにおけるコードの実行プロセスはシリアルではなくなり、複数のスレッドによって同時にアクセスされる共有変数も、適切に処理されないと奇妙な問題を引き起こす可能性があります。

Redis6.0 でマルチスレッドが導入されるのはなぜですか?

# 例を使用して、マルチスレッドシナリオで発生する奇妙な現象を見てみましょう。以下のコードを見てください。

class MemoryReordering {
  int num = 0;
  boolean flag = false;
  
  public void set() {
    num = 1;     //语句1
    flag = true; //语句2
  }
  
  public int cal() {
    if( flag == true) {    //语句3
      return num + num; //语句4
    }
   
    return -1；
  }
  
}

flag が true の場合、cal() メソッドの戻り値は何ですか?多くの人はこう言うだろう：そもそも聞く必要があるのか？必ず 2

を返します

结果可能会让你大吃一惊！上面的这段代码，由于语句1和语句2没有数据依赖性，可能会发生指令重排序，有可能编译器会把flag=true放到num=1的前面。此时set和cal方法分别在不同线程中执行，没有先后关系。cal方法，只要flag为true，就会进入if的代码块执行相加的操作。可能的顺序是：

语句1先于语句2执行，这时的执行顺序可能是：语句1->语句2->语句3->语句4。执行语句4前，num = 1，所以cal的返回值是2
语句2先于语句1执行，这时的执行顺序可能是：语句2->语句3->语句4->语句1。执行语句4前，num = 0，所以cal的返回值是0

我们可以看到，在多线程环境下如果发生了指令重排序，会对结果造成严重影响。

当然可以在第三行处，给flag加上关键字volatile来避免指令重排。即在flag处加上了内存栅栏，来阻隔flag（栅栏）前后的代码的重排序。当然多线程还会带来可见性问题，死锁问题以及共享资源安全等问题。

boolean volatile flag = false;

Redis6.0为何引入多线程？

Redis6.0引入的多线程部分，实际上只是用来处理网络数据的读写和协议解析，执行命令仍然是单一工作线程。

Redis6.0 でマルチスレッドが導入されるのはなぜですか?

从上图我们可以看到Redis在处理网络数据时，调用epoll的过程是阻塞的，也就是说这个过程会阻塞线程，如果并发量很高，达到几万的QPS，此处可能会成为瓶颈。一般我们遇到此类网络IO瓶颈的问题，可以增加线程数来解决。开启多线程除了可以减少由于网络I/O等待造成的影响，还可以充分利用CPU的多核优势。Redis6.0也不例外，在此处增加了多线程来处理网络数据，以此来提高Redis的吞吐量。当然相关的命令处理还是单线程运行，不存在多线程下并发访问带来的种种问题。

Redis6.0 でマルチスレッドが導入されるのはなぜですか?

性能对比

压测配置:

Redis Server: 阿里云 Ubuntu 18.04，8 CPU 2.5 GHZ, 8G 内存，主机型号 ecs.ic5.2xlarge
Redis Benchmark Client: 阿里云 Ubuntu 18.04，8 2.5 GHZ CPU, 8G 内存，主机型号 ecs.ic5.2xlarge

多线程版本Redis 6.0，单线程版本是 Redis 5.0.5。多线程版本需要新增以下配置:

io-threads 4 # 开启 4 个 IO 线程
io-threads-do-reads yes # 请求解析也是用 IO 线程

压测命令: redis-benchmark -h 192.168.0.49 -a foobared -t set,get -n 1000000 -r 100000000 --threads 4 -d ${datasize} -c 256

Redis6.0 でマルチスレッドが導入されるのはなぜですか?

图二

图片来源于网络 Redis6.0 でマルチスレッドが導入されるのはなぜですか?

图三

图片来源于网络

从上面可以看到 GET/SET 命令在多线程版本中性能相比单线程几乎翻了一倍。另外，这些数据只是为了简单验证多线程 I/O 是否真正带来性能优化，并没有针对具体的场景进行压测，数据仅供参考。本次性能测试基于 unstble 分支，不排除后续发布的正式版本的性能会更好。

Redis6.0 でマルチスレッドが導入されるのはなぜですか?

最后

可见单线程有单线程的好处，多线程有多线程的优势，只有充分理解其中的本质原理，才能灵活运用于生产实践当中。

以上がRedis6.0 でマルチスレッドが導入されるのはなぜですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

Java nio dubbo if select volatile 接口线程多线程主线程并发事件 redis http linux 性能优化

声明：

この記事はcsdn.netで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

前の記事：Redisデータベースの数量設定、データベースの切り替え、指定について次の記事：Redisデータベースの数量設定、データベースの切り替え、指定について

続きを見る