


Die Anzahl der Warteschlangen und Anforderungsverzögerungen von Go Language Crawler Framework Colly
Eine effiziente gleichzeitige Anfrageverarbeitung ist bei der Verwendung des GO -Crawler -Framework -Colly von entscheidender Bedeutung. In diesem Artikel werden die Einstellungen der Thread -Zähler bewertet und Verzögerungen in queue
in Colly anfordern, die die gleichzeitige Verarbeitung beeinflussen und eine gemeinsame Frage beantworten.
Problem: Interaktion zwischen der Anzahl der Threads und der Anforderungsverzögerung
Angenommen, wir setzen queue
auf 2:
q, _: = queue.new (2, Speicher)
Und fügte 3 Anfragen hinzu. In der Zwischenzeit wird colly.Limit()
verwendet, um die Verzögerung jeder Anfrage auf 5 Sekunden festzulegen. Es wird erwartet, dass zwei Anfragen fast gleichzeitig ausgestellt werden und nach 5 Sekunden reagieren und die dritte Anfrage um weitere 5 Sekunden verzögert wird. Das tatsächliche Ergebnis ist jedoch:
- Es werden zwei Anfragen erstellt.
- Nach 5 Sekunden antwortet die erste Anfrage und es wird eine dritte Anfrage erstellt.
- Nach 5 Sekunden antwortet die zweite Anfrage.
- Nach 5 Sekunden antwortet die dritte Anfrage.
Dies wird nicht parallel verarbeitet. Warum scheint die Anzahl der queue
zu scheitern? Beeinflusst colly.Limit()
die Parallelität der queue
? Erstellt onrequest
-Rückruffunktion nur eine Anfrage, ohne tatsächlich eine Anfrage zu stellen?
Analyse: Unabhängigkeit zwischen Anzahl der Threads und Anforderungsverzögerung
queue
von Colly verwaltet die Anzahl der gleichzeitigen Anforderungen, während colly.Limit()
die Verzögerung für jede Anforderung festlegt. Die beiden sind unabhängige Mechanismen.
Die Anzahl der Threads queue
begrenzt die Anzahl der gleichzeitig verarbeiteten Anforderungen. colly.Limit()
wendet eine Verzögerung an , bevor jede Anfrage ausgestellt wird.
Im obigen Fall:
-
queue
erstellt zwei Anfragen, abercolly.Limit()
lässt sie beide 5 Sekunden warten. - Die erste Anfrage wird nach Ablauf der Verzögerung ausgestellt. Nach der Antwort veröffentlicht
queue
einen Thread und erstellt eine dritte Anfrage. - Die zweite Anfrage wird ebenfalls gesendet und beantwortet, nachdem er 5 Sekunden lang gewartet wurde.
- Die dritte Anfrage wird ebenfalls gesendet und beantwortet, nachdem er 5 Sekunden lang gewartet wurde.
Daher maskiert die Anforderung Verzögerung die Parallelität queue
.
onrequest
-Rückruf und Anfrage zur Ausgabezeit
onrequest
-Rückruffunktion wird abgefeuert, wenn die Anforderung zur queue
hinzugefügt wird, nicht wenn die Anfrage tatsächlich ausgestellt wird. Es wird verwendet, um einige Vorverarbeitungsvorgänge durchzuführen, bevor die Anfrage ausgestellt wird.
Schlussfolgerung: Koordinieren Sie die Anzahl der Threads und fordern Sie Verzögerungen an
Die Verzögerung von colly.Limit()
wirkt sich auf den Gleichzeitigkeitseffekt der Anzahl der queue
aus. Um eine echte Parallelität zu erreichen, ist eine sorgfältige Koordination der Thread -Anzahl und Anforderungsverzögerungseinstellungen erforderlich. Wenn eine hohe Parallelität erforderlich ist, sollte die von colly.Limit()
festgelegte Verzögerung minimiert oder entfernt werden, oder ein feinerer Parallelitätskontrollmechanismus sollte berücksichtigt werden. Wenn Sie die Crawl -Geschwindigkeit steuern müssen, wird empfohlen, eine feinere Granularkontrollmethode zu verwenden, anstatt sich auf colly.Limit()
zu verlassen.
Das obige ist der detaillierte Inhalt vonWie wirkt sich die Einstellung von Warteschlangen und Anforderungsverzögerungen von Threads von GO Crawler Framework auf die gleichzeitige Verarbeitung von Anforderungen aus?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

go语言有缩进。在go语言中,缩进直接使用gofmt工具格式化即可(gofmt使用tab进行缩进);gofmt工具会以标准样式的缩进和垂直对齐方式对源代码进行格式化,甚至必要情况下注释也会重新格式化。

go语言叫go的原因:想表达这门语言的运行速度、开发速度、学习速度(develop)都像gopher一样快。gopher是一种生活在加拿大的小动物,go的吉祥物就是这个小动物,它的中文名叫做囊地鼠,它们最大的特点就是挖洞速度特别快,当然可能不止是挖洞啦。

是,TiDB采用go语言编写。TiDB是一个分布式NewSQL数据库;它支持水平弹性扩展、ACID事务、标准SQL、MySQL语法和MySQL协议,具有数据强一致的高可用特性。TiDB架构中的PD储存了集群的元信息,如key在哪个TiKV节点;PD还负责集群的负载均衡以及数据分片等。PD通过内嵌etcd来支持数据分布和容错;PD采用go语言编写。

go语言需要编译。Go语言是编译型的静态语言,是一门需要编译才能运行的编程语言,也就说Go语言程序在运行之前需要通过编译器生成二进制机器码(二进制的可执行文件),随后二进制文件才能在目标机器上运行。

go语言能编译。Go语言是编译型的静态语言,是一门需要编译才能运行的编程语言。对Go语言程序进行编译的命令有两种:1、“go build”命令,可以将Go语言程序代码编译成二进制的可执行文件,但该二进制文件需要手动运行;2、“go run”命令,会在编译后直接运行Go语言程序,编译过程中会产生一个临时文件,但不会生成可执行文件。

删除map元素的两种方法:1、使用delete()函数从map中删除指定键值对,语法“delete(map, 键名)”;2、重新创建一个新的map对象,可以清空map中的所有元素,语法“var mapname map[keytype]valuetype”。


Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Herunterladen der Mac-Version des Atom-Editors
Der beliebteste Open-Source-Editor

Dreamweaver Mac
Visuelle Webentwicklungstools

Sicherer Prüfungsbrowser
Safe Exam Browser ist eine sichere Browserumgebung für die sichere Teilnahme an Online-Prüfungen. Diese Software verwandelt jeden Computer in einen sicheren Arbeitsplatz. Es kontrolliert den Zugriff auf alle Dienstprogramme und verhindert, dass Schüler nicht autorisierte Ressourcen nutzen.

DVWA
Damn Vulnerable Web App (DVWA) ist eine PHP/MySQL-Webanwendung, die sehr anfällig ist. Seine Hauptziele bestehen darin, Sicherheitsexperten dabei zu helfen, ihre Fähigkeiten und Tools in einem rechtlichen Umfeld zu testen, Webentwicklern dabei zu helfen, den Prozess der Sicherung von Webanwendungen besser zu verstehen, und Lehrern/Schülern dabei zu helfen, in einer Unterrichtsumgebung Webanwendungen zu lehren/lernen Sicherheit. Das Ziel von DVWA besteht darin, einige der häufigsten Web-Schwachstellen über eine einfache und unkomplizierte Benutzeroberfläche mit unterschiedlichen Schwierigkeitsgraden zu üben. Bitte beachten Sie, dass diese Software

mPDF
mPDF ist eine PHP-Bibliothek, die PDF-Dateien aus UTF-8-codiertem HTML generieren kann. Der ursprüngliche Autor, Ian Back, hat mPDF geschrieben, um PDF-Dateien „on the fly“ von seiner Website auszugeben und verschiedene Sprachen zu verarbeiten. Es ist langsamer und erzeugt bei der Verwendung von Unicode-Schriftarten größere Dateien als Originalskripte wie HTML2FPDF, unterstützt aber CSS-Stile usw. und verfügt über viele Verbesserungen. Unterstützt fast alle Sprachen, einschließlich RTL (Arabisch und Hebräisch) und CJK (Chinesisch, Japanisch und Koreanisch). Unterstützt verschachtelte Elemente auf Blockebene (wie P, DIV),