この記事では、laravel で HTML を解析するための Symfony の Crawler コンポーネントの使用法を主に紹介します。必要な友人は参照してください。
Crawler の正式名は DomCrawler で、Symfony フレームワークのコンポーネントです。とんでもないのは、DomCrawler には中国語のドキュメントがなく、Symfony はこの部分を翻訳していないため、DomCrawler を使用した開発は少しずつしか探索できないことです。ここで使用プロセスの経験をまとめます。
まず、CSSセレクターである
composer require symfony/dom-crawler composer require symfony/css-selector
css-seelctorをインストールします。cssでノードを選択する際にいくつかの機能が使用されます
マニュアルで使用されている例は
use Symfony\Component\DomCrawler\Crawler; $html = <<<‘HTML‘ Hello World! Hello Crawler! HTML; $crawler = new Crawler($html); foreach ($crawler as $domElement) { var_dump($domElement->nodeName); }
出力結果です。は
string ‘html‘ (length=4)
このHTMLコードのnodeNameがhtmlで、私の英語が苦手なので、使い始めたときはプログラムが間違っているのかと思いました。 。 。
実際の使用過程で、新しいクローラ($html)が文字化けしている場合は、ページのエンコーディングが関係しているはずなので、以下の方法でクローラを初期化してから、ノード
の2番目のノードを追加します。
$crawler = new Crawler(); $crawler->addHtmlContent($html);
addHtmlContent パラメータは charset で、デフォルトは utf-8 です。
他の例については、公式ドキュメント http://symfony.com/doc/current/components/dom_crawler.html を参照してください
仕事で少しずつ試した使用法を記録してください
filterXPath(string $ xpath) メソッドはマニュアルに従ってください 上でも述べたように、このメソッドのパラメータは $xpath であり、p や p などのブロックがよく使用されます。フィルターの出力 新しいクローラー オブジェクトを使用して解析を続行します
echo $crawler->filterXPath(‘//body/p‘)->text(); echo $crawler->filterXPath(‘//body/p‘)->last()->text();
クローラーは各ループを提供し、コードを簡素化するためにクロージャー関数を使用します。 ただし、この方法で $nodeValues を記述すると、結果は配列になることに注意してください。さらに処理が必要になります。
var_dump($crawler->filterXPath(‘//body‘)->html());最初のpタグに対応するclass属性の値「message」を取得できます
foreach ($crawler->filterXPath(‘//body/p‘) as $i => $node) { $c = new Crawler($node); echo $c->filter(‘p‘)->text(); }上記はタグ属性を取得するいくつかの方法です
filter と filterXPath は異なります。マニュアルには css セレクターと書かれていますが、p のような XPath ノードに含まれる要素であると理解しています。具体的な状況は実際の開発で試す必要があります。 一般的に、単純な HTML dom よりも DomCrawler の方が使いやすいと感じます。
上記は Crawler の基本的な機能です。さらに詳しい使用方法については、symfony マニュアルの Crawler 部分の機能を参照してください
http://api.symfony.com/3.2/Symfony/Component/DomCrawler/Crawler .html
Crawler の主な問題は、やはり使用例が少なすぎ、機能マニュアルにも使用例がないため、実際に使用して調べるしかありません。 。 。 。
DomCrawler に関する symfony のドキュメント。いくつかの例があります
以上がCrawlerコンポーネントを使用してlaravelでHTMLを分析するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

本篇文章给大家带来了关于laravel的相关知识,其中主要介绍了关于单点登录的相关问题,单点登录是指在多个应用系统中,用户只需要登录一次就可以访问所有相互信任的应用系统,下面一起来看一下,希望对大家有帮助。

本篇文章给大家带来了关于laravel的相关知识,其中主要介绍了关于Laravel的生命周期相关问题,Laravel 的生命周期从public\index.php开始,从public\index.php结束,希望对大家有帮助。

在laravel中,guard是一个用于用户认证的插件;guard的作用就是处理认证判断每一个请求,从数据库中读取数据和用户输入的对比,调用是否登录过或者允许通过的,并且Guard能非常灵活的构建一套自己的认证体系。

laravel中asset()方法的用法:1、用于引入静态文件,语法为“src="{{asset(‘需要引入的文件路径’)}}"”;2、用于给当前请求的scheme前端资源生成一个url,语法为“$url = asset('前端资源')”。

本篇文章给大家带来了关于laravel的相关知识,其中主要介绍了关于使用中间件记录用户请求日志的相关问题,包括了创建中间件、注册中间件、记录用户访问等等内容,下面一起来看一下,希望对大家有帮助。

本篇文章给大家带来了关于laravel的相关知识,其中主要介绍了关于中间件的相关问题,包括了什么是中间件、自定义中间件等等,中间件为过滤进入应用的 HTTP 请求提供了一套便利的机制,下面一起来看一下,希望对大家有帮助。

laravel路由文件在“routes”目录里。Laravel中所有的路由文件定义在routes目录下,它里面的内容会自动被框架加载;该目录下默认有四个路由文件用于给不同的入口使用:web.php、api.php、console.php等。

ThinkPHP vs Laravel 当下国内最流行的两款PHP框架,孰好孰坏,争议最多!做为初学者,也很纠结,到底学哪个好呢?本文PHP中文网来认真盘点一下,不吹不黑,更不便偏颇哪一方。


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

SublimeText3 英語版
推奨: Win バージョン、コードプロンプトをサポート!

SublimeText3 中国語版
中国語版、とても使いやすい

WebStorm Mac版
便利なJavaScript開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

SublimeText3 Linux 新バージョン
SublimeText3 Linux 最新バージョン

ホットトピック



