ホームページ  >  記事  >  バックエンド開発  >  HTML をテキストに変換するための PHP 実装コード、_PHP チュートリアル

HTML をテキストに変換するための PHP 実装コード、_PHP チュートリアル

WBOY
WBOYオリジナル
2016-07-13 10:09:30889ブラウズ

PHP将HTML转换成文本的实现代码,

核心代码:

<&#63;php
// $document 应包含一个 HTML 文档。
// 本例将去掉 HTML 标记,javascript 代码
// 和空白字符。还会将一些通用的
// HTML 实体转换成相应的文本。

$search = array ("'<script[^>]*&#63;>.*&#63;</script>'si", // 去掉 javascript
         "'<[\/\!]*&#63;[^<>]*&#63;>'si",      // 去掉 HTML 标记
         "'([\r\n])[\s]+'",         // 去掉空白字符
         "'&(quot|#34);'i",         // 替换 HTML 实体
         "'&(amp|#38);'i",
         "'&(lt|#60);'i",
         "'&(gt|#62);'i",
         "'&(nbsp|#160);'i",
         "'&(iexcl|#161);'i",
         "'&(cent|#162);'i",
         "'&(pound|#163);'i",
         "'&(copy|#169);'i",
         "'&#(\d+);'e");          // 作为 PHP 代码运行

$replace = array ("",
         "",
         "\\1",
         "\"",
         "&",
         "<",
         ">",
         " ",
         chr(161),
         chr(162),
         chr(163),
         chr(169),
         "chr(\\1)");

$text = preg_replace ($search, $replace, $document);
&#63;>

www.bkjia.comtruehttp://www.bkjia.com/PHPjc/945695.htmlTechArticlePHP将HTML转换成文本的实现代码, 核心代码: php// $document 应包含一个 HTML 文档。// 本例将去掉 HTML 标记,javascript 代码// 和空白字符。还会...
声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。