ホームページ  >  記事  >  バックエンド開発  >  PHPでHTMLをテキストに変換する方法

PHPでHTMLをテキストに変換する方法

藏色散人
藏色散人オリジナル
2020-08-20 09:13:102158ブラウズ

php将html转文本的方法:首先创建一个PHP示例文件;然后创建一个“HtmlToText”方法;接着使用“preg_replace”等方法将HTML转为TXT文本即可。

PHPでHTMLをテキストに変換する方法

推荐:《PHP视频教程

PHP将HTML转为TXT文本 

需要将HTML转换为TXT文本的内容。

于是翻了翻W3C的PHP手册,因为对PHP的函数库不太熟悉,只找到htmlspecialchar(不对转义字符进行转换)函数和nl2br(将字符串转换成HTML的标签)函数。这显然不是我现在想要的,于是我在自己平时积累下来的PHP函数库中,使用中文进行了一翻搜索,终于发现了一个函数——strip_tags(功能:从字符串中去除HTML和PHP标记)

<?php
$mystr=<<<SATO
此处省略几十行HTML代码^_^
SATO;
$str=strip_tags($mystr);
//到这里就已经达到我的HTML转为TXT文本的目的了,哈哈,使用这个函数真方便
//下面是插件的一些切词等操作,这里就不多说了
?>

后来我从网上看到了一个使用PHP写的方法,使用这个方法也可以实现将HTML转为TXT文本,个人觉得也还蛮实用的,在这里分享一下,代码如下:

function HtmlToText($str){
  $str=preg_replace("/<sty(.*)\/style>|<scr(.*)\/script>|<!--(.*)-->/isU","",$str);//去除CSS样式、JS脚本、HTML注释
  $alltext="";//用于保存TXT文本的变量
  $start=1;//用于检测<左、>右标签的控制开关
  for($i=0;$i<strlen($str);$i++){//遍历经过处理后的字符串中的每一个字符
    if(($start==0)&&($str[$i]==">")){//如果检测到>右标签,则使用$start=1;开启截取功能
      $start=1;
    }else if($start==1){//截取功能
      if($str[$i]=="<"){//如果字符是<左标签,则使用<font color=&#39;red&#39;>|</font>替换
        $start=0;
        $alltext.="<font color=&#39;red&#39;>|</font>";
      }else if(ord($str[$i])>31){//如果字符是ASCII大于31的有效字符,则将字符添加到$alltext变量中
        $alltext.=$str[$i];
      }
    }
}
//下方是去除空格和一些特殊字符的操作
$alltext = str_replace(" "," ",$alltext);
$alltext = preg_replace("/&([^;&]*)(;|&)/","",$alltext);
$alltext = preg_replace("/[ ]+/s"," ",$alltext);
return $alltext;
}

使用上面这个方法也可以实现将简答的HTML代码转换为TXT文本。

最后说一下htmlspecialchars、nl2br这两个与HTML相关的PHP函数:

htmlspecialchars(不对转义字符进行转换):

  实例:echo htmlspecialchars("ca7efbbefc21c8e62596ba66ec729efbbaidu5db79b134e9f6b82c0b36e0489ee08ed");//<a href="#">baidu</a>

nl2br(将字符串转换成HTML的标签):

  实例:echo nl2br("a4b561c25d9afb9ac8dc4d70affff419PHP0d36329ec37a2cc24d42c7229b69747a");//PHP

以上がPHPでHTMLをテキストに変換する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。