Maison >développement back-end >tutoriel php >Exemple d'analyse et de traitement HTML/XML pour le filtrage de contenu à l'aide de PHP

Exemple d'analyse et de traitement HTML/XML pour le filtrage de contenu à l'aide de PHP

WBOY
WBOYoriginal
2023-09-12 10:19:41767parcourir

Exemple danalyse et de traitement HTML/XML pour le filtrage de contenu à laide de PHP

Exemple d'utilisation de PHP pour analyser et traiter HTML/XML pour le filtrage de contenu

Introduction :
Dans le développement Web, nous devons souvent extraire du contenu spécifique de fichiers HTML ou XML, ou filtrer et filtrer le contenu de ceux-ci. . En tant que puissant langage de script côté serveur, PHP possède de nombreuses fonctions et classes intégrées pour le traitement HTML/XML, nous permettant d'analyser et de traiter facilement les fichiers HTML/XML. Cet article va vous montrer un exemple de la façon d'analyser et de traiter HTML/XML pour le filtrage de contenu à l'aide de PHP.

1. Analyse HTML/XML
En PHP, nous pouvons utiliser certaines fonctions et classes intégrées pour analyser les fichiers HTML/XML, telles que la fonction file_get_contents(), SimpleXMLElement code > Classe etc. <code>file_get_contents()函数、SimpleXMLElement类等。

示例一:解析HTML
我们假设有一个名为example.html的HTML文件,内容如下:

<html>
<body>
  <h1>欢迎来到我的网站</h1>
  <p>这是一个演示HTML解析的示例页面。</p>
  <ul>
    <li>列表项1</li>
    <li>列表项2</li>
    <li>列表项3</li>
  </ul>
</body>
</html>

现在,我们希望从该HTML文件中提取<h1></h1>标签和<ul></ul>标签下的所有<li>标签。

<?php
$html = file_get_contents('example.html');

$dom = new DOMDocument();
$dom->loadHTML($html);

$h1 = $dom->getElementsByTagName('h1')->item(0)->nodeValue; // 提取<h1>标签内容

$liList = $dom->getElementsByTagName('li');
foreach ($liList as $li) {
    echo $li->nodeValue . "<br>"; // 遍历输出所有<li>标签内容
}
?>

运行上述PHP代码,我们可以得到以下输出:

欢迎来到我的网站
列表项1
列表项2
列表项3

示例二:解析XML
假设有一个名为example.xml

Exemple 1 : Analyse HTML

Nous supposons qu'il existe un fichier HTML nommé example.html avec le contenu suivant :

<books>
  <book>
    <title>PHP教程</title>
    <author>张三</author>
  </book>
  <book>
    <title>JavaScript教程</title>
    <author>李四</author>
  </book>
  <book>
    <title>Python教程</title>
    <author>王五</author>
  </book>
</books>

Maintenant, nous voulons extraire le

et toutes les balises <li> sous la balise <ul></ul>.

<?php
$xml = file_get_contents('example.xml');

$dom = new SimpleXMLElement($xml);

foreach ($dom->book as $book) {
    $title = $book->title;
    $author = $book->author;
    
    echo "书名:$title,作者:$author<br>";
}
?>

En exécutant le code PHP ci-dessus, nous pouvons obtenir le résultat suivant :

书名:PHP教程,作者:张三
书名:JavaScript教程,作者:李四
书名:Python教程,作者:王五

Exemple 2 : Analyse XML

Supposons qu'il existe un fichier XML nommé example.xml avec le contenu suivant :

<?php
$input = "<p><strong>欢迎访问我们的网站!</strong></p>";
$output = strip_tags($input); // 过滤HTML标签
$output = htmlspecialchars($output); // 转义特殊字符

echo $output;
?>

Maintenant, nous voulons extraire tous les titres de livres et auteurs de ce fichier XML.

欢迎访问我们的网站!

Exécutez le code PHP ci-dessus, nous pouvons obtenir le résultat suivant :

rrreee
2. Filtrage de contenu

En plus d'analyser les fichiers HTML/XML, nous pouvons également utiliser PHP pour le filtrage de contenu. Ceci est souvent utilisé dans le développement Web pour filtrer les données soumises par les utilisateurs afin de prévenir les risques de sécurité potentiels.

Exemple 3 : Filtrage des balises HTML et des caractères spéciaux🎜Supposons que nous ayons un contenu texte soumis par l'utilisateur qui contient des balises HTML et des caractères spéciaux, et que nous souhaitons supprimer ou échapper ces balises et caractères. 🎜rrreee🎜Exécutez le code PHP ci-dessus, nous pouvons obtenir le résultat suivant : 🎜rrreee🎜 3. Résumé🎜Grâce aux exemples ci-dessus, nous avons appris comment utiliser PHP pour analyser et traiter HTML/XML, et comment effectuer un filtrage de contenu. Ces techniques sont très pratiques dans le développement Web et peuvent nous aider à extraire et traiter rapidement un contenu spécifique, ainsi qu'à garantir la sécurité des saisies des utilisateurs. 🎜🎜J'espère que cet article vous aidera à comprendre comment PHP analyse et traite le HTML/XML pour le filtrage de contenu ! Si vous avez des questions ou des suggestions, n'hésitez pas à nous contacter. Merci d'avoir lu! 🎜

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Articles Liés

Voir plus