検索
ホームページバックエンド開発GolangGo Crawler Framework Collyでは、スレッドカウントのキューとリクエストの遅延がリクエストの同時処理にどのように影響しますか?

Go Crawler Framework Collyでは、スレッドカウントのキューとリクエストの遅延がリクエストの同時処理にどのように影響しますか?

キュースレッドの数とGo言語クローラーフレームワークのリクエスト遅延

Go Crawler Framework Collyを使用する場合、効率的な同時リクエスト処理が重要です。この記事では、スレッドが設定をカウントし、Collyのqueueのリクエストの遅延が同時処理に影響し、一般的な質問に答える方法を掘り下げます。

問題:スレッド数と要求遅延間の相互作用

queueのスレッド数を2に設定するとします。

 Q、_:= queue.new(2、ストレージ)

3つのリクエストを追加しました。一方、 colly.Limit()各要求の遅延を5秒に設定するために使用されます。ほぼ同時に2つのリクエストが発行され、5秒後に応答することが予想され、3番目の要求はさらに5秒遅れます。ただし、実際の結果は次のとおりです。

  1. 2つのリクエストが作成されます。
  2. 5秒後、最初のリクエストが応答し、3番目の要求が作成されます。
  3. 5秒後、2番目の要求が応答します。
  4. 5秒後、3番目の要求が応答します。

これは並行して処理されません。 queueのスレッドの数が失敗したように見えるのはなぜですか? colly.Limit()queueの並行性に影響しますか? onrequestコールバック関数は、実際にリクエストを作成していないリクエストを作成するだけですか?

分析:スレッド数と要求遅延間の独立性

Collyのqueue同時リクエストの数を管理し、 colly.Limit()は各リクエストの遅延を設定します。 2つは独立したメカニズムです。

queueのスレッドの数は、同時に処理されるリクエストの数を制限します。 colly.Limit()各リクエストが発行される前に遅延を適用します。

上記の場合:

  1. queue 2つのリクエストを作成しますが、 colly.Limit()両方とも5秒間待機します。
  2. 最初のリクエストは、遅延が終了した後に発行されます。応答後、 queueスレッドをリリースし、3番目のリクエストを作成します。
  3. 2番目のリクエストも送信され、5秒間待った後に応答します。
  4. 3番目のリクエストも送信され、5秒間待った後に応答します。

したがって、リクエスト遅延はqueueの並行性をマスクします。

onrequestコールバックとリクエストの発行時間

リクエストが実際に発行されたときではなく、リクエストがqueueに追加されると、 onrequestコールバック関数が起動されます。リクエストが発行される前に、いくつかの前処理操作を実行するために使用されます。

結論:スレッドの数とリクエストの遅延を調整します

colly.Limit()の遅延は、 queueスレッドの数の並行効果に影響します。真の並行性を実現するには、スレッドカウントとリクエストの遅延設定の慎重な調整が必要です。高い並行性が必要な場合、 colly.Limit()によって設定された遅延を最小化または削除する必要があります。または、より細かい並行性制御メカニズムを考慮する必要があります。クロール速度を制御する必要がある場合は、 colly.Limit()に依存する代わりに、より細かい粒状制御方法を使用することをお勧めします。

以上がGo Crawler Framework Collyでは、スレッドカウントのキューとリクエストの遅延がリクエストの同時処理にどのように影響しますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
go语言有没有缩进go语言有没有缩进Dec 01, 2022 pm 06:54 PM

go语言有缩进。在go语言中,缩进直接使用gofmt工具格式化即可(gofmt使用tab进行缩进);gofmt工具会以标准样式的缩进和垂直对齐方式对源代码进行格式化,甚至必要情况下注释也会重新格式化。

go语言为什么叫gogo语言为什么叫goNov 28, 2022 pm 06:19 PM

go语言叫go的原因:想表达这门语言的运行速度、开发速度、学习速度(develop)都像gopher一样快。gopher是一种生活在加拿大的小动物,go的吉祥物就是这个小动物,它的中文名叫做囊地鼠,它们最大的特点就是挖洞速度特别快,当然可能不止是挖洞啦。

一文详解Go中的并发【20 张动图演示】一文详解Go中的并发【20 张动图演示】Sep 08, 2022 am 10:48 AM

Go语言中各种并发模式看起来是怎样的?下面本篇文章就通过20 张动图为你演示 Go 并发,希望对大家有所帮助!

【整理分享】一些GO面试题(附答案解析)【整理分享】一些GO面试题(附答案解析)Oct 25, 2022 am 10:45 AM

本篇文章给大家整理分享一些GO面试题集锦快答,希望对大家有所帮助!

tidb是go语言么tidb是go语言么Dec 02, 2022 pm 06:24 PM

是,TiDB采用go语言编写。TiDB是一个分布式NewSQL数据库;它支持水平弹性扩展、ACID事务、标准SQL、MySQL语法和MySQL协议,具有数据强一致的高可用特性。TiDB架构中的PD储存了集群的元信息,如key在哪个TiKV节点;PD还负责集群的负载均衡以及数据分片等。PD通过内嵌etcd来支持数据分布和容错;PD采用go语言编写。

go语言是否需要编译go语言是否需要编译Dec 01, 2022 pm 07:06 PM

go语言需要编译。Go语言是编译型的静态语言,是一门需要编译才能运行的编程语言,也就说Go语言程序在运行之前需要通过编译器生成二进制机器码(二进制的可执行文件),随后二进制文件才能在目标机器上运行。

go语言能不能编译go语言能不能编译Dec 09, 2022 pm 06:20 PM

go语言能编译。Go语言是编译型的静态语言,是一门需要编译才能运行的编程语言。对Go语言程序进行编译的命令有两种:1、“go build”命令,可以将Go语言程序代码编译成二进制的可执行文件,但该二进制文件需要手动运行;2、“go run”命令,会在编译后直接运行Go语言程序,编译过程中会产生一个临时文件,但不会生成可执行文件。

golang map怎么删除元素golang map怎么删除元素Dec 08, 2022 pm 06:26 PM

删除map元素的两种方法:1、使用delete()函数从map中删除指定键值对,语法“delete(map, 键名)”;2、重新创建一个新的map对象,可以清空map中的所有元素,语法“var mapname map[keytype]valuetype”。

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

EditPlus 中国語クラック版

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser は、オンライン試験を安全に受験するための安全なブラウザ環境です。このソフトウェアは、あらゆるコンピュータを安全なワークステーションに変えます。あらゆるユーティリティへのアクセスを制御し、学生が無許可のリソースを使用するのを防ぎます。

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Linux 新バージョン

SublimeText3 Linux 新バージョン

SublimeText3 Linux 最新バージョン

mPDF

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。