Home >Backend Development >PHP Problem >How to convert html to text in php

How to convert html to text in php

藏色散人
藏色散人Original
2020-08-20 09:13:102318browse

php将html转文本的方法:首先创建一个PHP示例文件;然后创建一个“HtmlToText”方法;接着使用“preg_replace”等方法将HTML转为TXT文本即可。

How to convert html to text in php

推荐:《PHP视频教程

PHP将HTML转为TXT文本 

需要将HTML转换为TXT文本的内容。

于是翻了翻W3C的PHP手册,因为对PHP的函数库不太熟悉,只找到htmlspecialchar(不对转义字符进行转换)函数和nl2br(将字符串转换成HTML的标签)函数。这显然不是我现在想要的,于是我在自己平时积累下来的PHP函数库中,使用中文进行了一翻搜索,终于发现了一个函数——strip_tags(功能:从字符串中去除HTML和PHP标记)

<?php
$mystr=<<<SATO
此处省略几十行HTML代码^_^
SATO;
$str=strip_tags($mystr);
//到这里就已经达到我的HTML转为TXT文本的目的了,哈哈,使用这个函数真方便
//下面是插件的一些切词等操作,这里就不多说了
?>

后来我从网上看到了一个使用PHP写的方法,使用这个方法也可以实现将HTML转为TXT文本,个人觉得也还蛮实用的,在这里分享一下,代码如下:

function HtmlToText($str){
  $str=preg_replace("/<sty(.*)\/style>|<scr(.*)\/script>|<!--(.*)-->/isU","",$str);//去除CSS样式、JS脚本、HTML注释
  $alltext="";//用于保存TXT文本的变量
  $start=1;//用于检测<左、>右标签的控制开关
  for($i=0;$i<strlen($str);$i++){//遍历经过处理后的字符串中的每一个字符
    if(($start==0)&&($str[$i]==">")){//如果检测到>右标签,则使用$start=1;开启截取功能
      $start=1;
    }else if($start==1){//截取功能
      if($str[$i]=="<"){//如果字符是<左标签,则使用<font color=&#39;red&#39;>|</font>替换
        $start=0;
        $alltext.="<font color=&#39;red&#39;>|</font>";
      }else if(ord($str[$i])>31){//如果字符是ASCII大于31的有效字符,则将字符添加到$alltext变量中
        $alltext.=$str[$i];
      }
    }
}
//下方是去除空格和一些特殊字符的操作
$alltext = str_replace(" "," ",$alltext);
$alltext = preg_replace("/&([^;&]*)(;|&)/","",$alltext);
$alltext = preg_replace("/[ ]+/s"," ",$alltext);
return $alltext;
}

使用上面这个方法也可以实现将简答的HTML代码转换为TXT文本。

最后说一下htmlspecialchars、nl2br这两个与HTML相关的PHP函数:

htmlspecialchars(不对转义字符进行转换):

  实例:echo htmlspecialchars("ca7efbbefc21c8e62596ba66ec729efbbaidu5db79b134e9f6b82c0b36e0489ee08ed");//<a href="#">baidu</a>

nl2br(将字符串转换成HTML的标签):

  实例:echo nl2br("a4b561c25d9afb9ac8dc4d70affff419PHP0d36329ec37a2cc24d42c7229b69747a");//PHP

The above is the detailed content of How to convert html to text in php. For more information, please follow other related articles on the PHP Chinese website!

Statement:
The content of this article is voluntarily contributed by netizens, and the copyright belongs to the original author. This site does not assume corresponding legal responsibility. If you find any content suspected of plagiarism or infringement, please contact admin@php.cn