>  기사  >  백엔드 개발  >  PHP将HTML转换成文本一些方法总结_PHP教程

PHP将HTML转换成文本一些方法总结_PHP教程

WBOY
WBOY원래의
2016-07-13 16:57:38980검색

在php中html转换成文本提供了自带的函数strip_tags了,但有时此函数不够用,下面总结了一些用户自定的函数,各位可参考。

最常用的使用php函数strip_tags

 代码如下 复制代码


$mystr= 此处省略几十行HTML代码^_^
SATO;
$str=strip_tags($mystr);
//到这里就已经达到我的HTML转为TXT文本的目的了,哈哈,使用这个函数真方便
//下面是插件的一些切词等操作,这里就不多说了
?>


自定义函数

 代码如下 复制代码

// $document 应包含一个 HTML 文档。
// 本例将去掉 HTML 标记,javascript 代码
// 和空白字符。还会将一些通用的
// HTML 实体转换成相应的文本。

$search = array ("'<script>]*?>.*?</script>'si",  // 去掉 javascript
                 "']*?>'si",           // 去掉 HTML 标记
                 "'([rn])[s]+'",                 // 去掉空白字符
                 "'&(quot|#34);'i",                 // 替换 HTML 实体
                 "'&(amp|#38);'i",
                 "'&(lt|#60);'i",
                 "'&(gt|#62);'i",
                 "'&(nbsp|#160);'i",
                 "'&(iexcl|#161);'i",
                 "'&(cent|#162);'i",
                 "'&(pound|#163);'i",
                 "'&(copy|#169);'i",
                 "'(d+);'e");                    // 作为 PHP 代码运行

$replace = array ("",
                  "",
                  "\1",
                  """,
                  "&",
                  "                   ">",
                  " ",
                  chr(161),
                  chr(162),
                  chr(163),
                  chr(169),
                  "chr(\1)");

$text = preg_replace ($search, $replace, $document);
?>

后来我从网上看到了一个使用PHP写的方法,使用这个方法也可以实现将HTML转为TXT文本,个人觉得也还蛮实用的,在这里分享一下,代码如下:

 代码如下 复制代码
function HtmlToText($str){
  $str=preg_replace("/||/isU","",$str);//去除CSS样式、JS脚本、HTML注释
  $alltext="";//用于保存TXT文本的变量
  $start=1;//用于检测右标签的控制开关
  for($i=0;$i     if(($start==0)&&($str[$i]==">")){//如果检测到>右标签,则使用$start=1;开启截取功能
      $start=1;
    }else if($start==1){//截取功能
      if($str[$i]=="|替换
        $start=0;
        $alltext.="|";
      }else if(ord($str[$i])>31){//如果字符是ASCII大于31的有效字符,则将字符添加到$alltext变量中
        $alltext.=$str[$i];
      }
    }
}
//下方是去除空格和一些特殊字符的操作
$alltext = str_replace(" "," ",$alltext);
$alltext = preg_replace("/&([^;&]*)(;|&)/","",$alltext);
$alltext = preg_replace("/[ ]+/s"," ",$alltext);
return $alltext;
}

使用上面这个方法也可以实现将简答的HTML代码转换为TXT文本。

例3

 代码如下 复制代码

function html2text($str,$encode = 'GB2312')
{

  $str = preg_replace("/

  $str = preg_replace("/ /i", " ", $str);
  $str = preg_replace("/ /i", " ", $str);

  $str = preg_replace("/&/i", "&", $str);
  $str = preg_replace("/&/i", "&", $str);

  $str = preg_replace("/ $str = preg_replace("/</i", "<", $str);

$str = preg_replace("/“/i", '"', $str);
$str = preg_replace("/&ldquo/i", '"', $str);

$str = preg_replace("/‘/i", "'", $str);
$str = preg_replace("/&lsquo/i", "'", $str);

$str = preg_replace("/’/i", "'", $str);
$str = preg_replace("/&rsquo/i", "'", $str);

$str = preg_replace("/>/i", ">", $str);
  $str = preg_replace("/>/i", ">", $str);

  $str = preg_replace("/”/i", '"', $str);
  $str = preg_replace("/&rdquo/i", '"', $str);

  $str = strip_tags($str);
  $str = html_entity_decode($str, ENT_QUOTES, $encode);
  $str = preg_replace("/.*?;/i", "", $str);
    
  return $str;
}

www.bkjia.comtruehttp://www.bkjia.com/PHPjc/631506.htmlTechArticle在php中html转换成文本提供了自带的函数strip_tags了,但有时此函数不够用,下面总结了一些用户自定的函数,各位可参考。 最常用的使用p...
성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.