


Verwenden Sie die Crawler-Komponente, um HTML in Laravel zu analysieren
In diesem Artikel wird hauptsächlich die Verwendung der Crawler-Komponente von Symfony zum Analysieren von HTML in Laravel vorgestellt.
Crawlers vollständiger Name ist DomCrawler, eine Komponente des Symfony-Frameworks. Was empörend ist, ist, dass DomCrawler keine chinesische Dokumentation hat und Symfony diesen Teil nicht übersetzt hat, sodass die Entwicklung mit DomCrawler nur Stück für Stück erkundet werden kann. Jetzt werde ich die Erfahrungen im Verwendungsprozess zusammenfassen.
Zuerst installieren Sie
composer require symfony/dom-crawler composer require symfony/css-selector
css-seelctor ist ein CSS-Selektor. Einige Funktionen werden bei der Auswahl von Knoten verwendet css. Das im
-Handbuch verwendete Beispiel ist
use Symfony\Component\DomCrawler\Crawler; $html = <<<‘HTML‘ Hello World! Hello Crawler! HTML; $crawler = new Crawler($html); foreach ($crawler as $domElement) { var_dump($domElement->nodeName); }
und das gedruckte Ergebnis ist
string ‘html‘ (length=4)
Da der Knotenname dieses HTML-Codes html ist und mein Englisch nicht gut ist, dachte ich, das Programm sei falsch, als ich anfing, es zu verwenden. . .
Wenn im tatsächlichen Verwendungsprozess der neue Crawler ($html) verstümmelte Zeichen aufweist, sollte dies mit der Seitencodierung zusammenhängen. Sie können also die folgende Methode verwenden: Initialisieren Sie zuerst den Crawler und fügen Sie dann den Knoten
$crawler = new Crawler(); $crawler->addHtmlContent($html);Der zweite Parameter von addHtmlContent ist der Zeichensatz und der Standardwert ist utf-8. Weitere Beispiele finden Sie in der offiziellen Dokumentation: http://symfony.com/doc/current/components/dom_crawler.htmlNotieren Sie die Verwendungen, die Sie bei der Arbeit ausprobierenfilterXPath(string $xpath) Methode, laut Handbuch ist der Parameter dieser Methode $xpath, und p, p und andere Blöcke werden häufig verwendet.
echo $crawler->filterXPath(‘//body/p‘)->text(); echo $crawler->filterXPath(‘//body/p‘)->last()->text();Die Ausgabe ist der Text des ersten und nächsten p-Tag-Blocks
var_dump($crawler->filterXPath(‘//body‘)->html());Der Ausgabe Der HTML-
foreach ($crawler->filterXPath(‘//body/p‘) as $i => $node) { $c = new Crawler($node); echo $c->filter(‘p‘)->text(); }filterXPath im Körper erhält ein Array von DOMElement-Blöcken. Jeder DOMElement-Block kann ein neues Crawler-Objekt verwenden, um mit der Analyse fortzufahren
$nodeValues = $crawler->filterXPath(‘//body/p‘)->each(function (Crawler $node, $i) { return $node->text(); });Crawler stellt jede Schleife bereit und verwendet Abschlussfunktionen, um den Code zu vereinfachen. Bitte beachten Sie jedoch, dass diese Art des Schreibens von $nodeValues zu einem Array führt, das eine weitere Verarbeitung erfordert.
Andere Verwendungen
echo $crawler->filterXPath(‘//body/p‘)->attr(‘class‘);können den Wert des Klassenattributs erhalten, das dem ersten entspricht p-Tag „Nachricht“
$crawler->filterXPath(‘//p[@class="样式"]‘)->filter(‘a‘)->attr(‘href‘); $crawler->filterXPath(‘//p[@class="样式"]‘)->filter(‘a>img‘)->extract(array(‘alt‘, ‘href‘))Die oben genannten Methoden zum Abrufen von Tag-Attributenfilter unterscheidet sich von filterXPath Im Handbuch heißt es CSS-Selektor, Ich verstehe nicht, dass es sich um ein im XPath-Knoten enthaltenes Element wie p handelt. Die spezifische Situation muss in der tatsächlichen Entwicklung ausprobiert werden. Generell habe ich das Gefühl, dass DomCrawler einfacher zu verwenden ist als einfaches HTML-Dom, vielleicht liegt es daran, dass ich es einfacher verwende. Die oben genannten sind nur die Grundfunktionen von Crawler. Weitere Informationen zur Verwendung finden Sie in den Funktionen im Crawler-Teil des Symfony-Handbuchs http://api.symfony.com/3.2 /Symfony/Component/DomCrawler/Crawler .htmlDas Hauptproblem bei Crawler besteht darin, dass es zu wenige Anwendungsbeispiele im Funktionshandbuch gibt, sodass Sie es nur in der tatsächlichen Verwendung erkunden können. . . . Symfonys Dokumentation zu DomCrawler, die einige Beispiele enthält http://symfony.com/doc/current/components/dom_crawler.html
Das obige ist der detaillierte Inhalt vonVerwenden Sie die Crawler-Komponente, um HTML in Laravel zu analysieren. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

PHP ist hauptsächlich prozedurale Programmierung, unterstützt aber auch die objektorientierte Programmierung (OOP). Python unterstützt eine Vielzahl von Paradigmen, einschließlich OOP, funktionaler und prozeduraler Programmierung. PHP ist für die Webentwicklung geeignet, und Python eignet sich für eine Vielzahl von Anwendungen wie Datenanalyse und maschinelles Lernen.

PHP entstand 1994 und wurde von Rasmuslerdorf entwickelt. Es wurde ursprünglich verwendet, um Website-Besucher zu verfolgen und sich nach und nach zu einer serverseitigen Skriptsprache entwickelt und in der Webentwicklung häufig verwendet. Python wurde Ende der 1980er Jahre von Guidovan Rossum entwickelt und erstmals 1991 veröffentlicht. Es betont die Lesbarkeit und Einfachheit der Code und ist für wissenschaftliche Computer, Datenanalysen und andere Bereiche geeignet.

PHP eignet sich für Webentwicklung und schnelles Prototyping, und Python eignet sich für Datenwissenschaft und maschinelles Lernen. 1.PHP wird für die dynamische Webentwicklung verwendet, mit einfacher Syntax und für schnelle Entwicklung geeignet. 2. Python hat eine kurze Syntax, ist für mehrere Felder geeignet und ein starkes Bibliotheksökosystem.

PHP bleibt im Modernisierungsprozess wichtig, da es eine große Anzahl von Websites und Anwendungen unterstützt und sich den Entwicklungsbedürfnissen durch Frameworks anpasst. 1.PHP7 verbessert die Leistung und führt neue Funktionen ein. 2. Moderne Frameworks wie Laravel, Symfony und Codesigniter vereinfachen die Entwicklung und verbessern die Codequalität. 3.. Leistungsoptimierung und Best Practices verbessern die Anwendungseffizienz weiter.

PhPhas significantantyPactedWebDevelopmentAndendendsbeyondit.1) iTpowersMAjorPlatforms-LikewordpressandExcelsInDatabaseInteractions.2) php'SadaptabilityAllowStoscaleForLargeApplicationsfraMe-Linien-Linien-Linien-Linienkripte

PHP -Typ -Eingabeaufforderungen zur Verbesserung der Codequalität und der Lesbarkeit. 1) Tipps zum Skalartyp: Da Php7.0 in den Funktionsparametern wie int, float usw. angegeben werden dürfen. 3) Eingabeaufforderung für Gewerkschaftstyp: Da Php8.0 in Funktionsparametern oder Rückgabetypen angegeben werden dürfen. 4) Nullierstyp Eingabeaufforderung: Ermöglicht die Einbeziehung von Nullwerten und Handlungsfunktionen, die Nullwerte zurückgeben können.

Verwenden Sie in PHP das Klonschlüsselwort, um eine Kopie des Objekts zu erstellen und das Klonierungsverhalten über die \ _ \ _ Clone Magic -Methode anzupassen. 1. Verwenden Sie das Klonschlüsselwort, um eine flache Kopie zu erstellen und die Eigenschaften des Objekts, nicht die Eigenschaften des Objekts zu klonen. 2. Die \ _ \ _ Klonmethode kann verschachtelte Objekte tief kopieren, um flache Kopierprobleme zu vermeiden. 3. achten Sie darauf, dass kreisförmige Referenzen und Leistungsprobleme beim Klonen vermieden werden, und optimieren Sie die Klonierungsvorgänge, um die Effizienz zu verbessern.

PHP eignet sich für Webentwicklungs- und Content -Management -Systeme, und Python eignet sich für Datenwissenschafts-, maschinelles Lernen- und Automatisierungsskripte. 1.PHP hat eine gute Leistung beim Erstellen von schnellen und skalierbaren Websites und Anwendungen und wird üblicherweise in CMS wie WordPress verwendet. 2. Python hat sich in den Bereichen Datenwissenschaft und maschinelles Lernen mit reichen Bibliotheken wie Numpy und TensorFlow übertrifft.


Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

WebStorm-Mac-Version
Nützliche JavaScript-Entwicklungstools

Herunterladen der Mac-Version des Atom-Editors
Der beliebteste Open-Source-Editor

DVWA
Damn Vulnerable Web App (DVWA) ist eine PHP/MySQL-Webanwendung, die sehr anfällig ist. Seine Hauptziele bestehen darin, Sicherheitsexperten dabei zu helfen, ihre Fähigkeiten und Tools in einem rechtlichen Umfeld zu testen, Webentwicklern dabei zu helfen, den Prozess der Sicherung von Webanwendungen besser zu verstehen, und Lehrern/Schülern dabei zu helfen, in einer Unterrichtsumgebung Webanwendungen zu lehren/lernen Sicherheit. Das Ziel von DVWA besteht darin, einige der häufigsten Web-Schwachstellen über eine einfache und unkomplizierte Benutzeroberfläche mit unterschiedlichen Schwierigkeitsgraden zu üben. Bitte beachten Sie, dass diese Software

SublimeText3 Englische Version
Empfohlen: Win-Version, unterstützt Code-Eingabeaufforderungen!

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)