首页  >  文章  >  后端开发  >  去除 HTML 标记,javascript 代码的小函数

去除 HTML 标记,javascript 代码的小函数

WBOY
WBOY原创
2016-07-25 09:02:48853浏览
  1. function trip_html( $html, $len ) {
  2. // $html 应包含一个 HTML 文档。
  3. // 本例将去掉 HTML 标记,javascript 代码
  4. // 和空白字符。还会将一些通用的
  5. // HTML 实体转换成相应的文本。
  6. $search = array (“‘<script>]*?>.*?</script>’si”, // 去掉 javascript
  7. “‘]*?>’si”, // 去掉 HTML 标记
  8. “‘([\r\n])[\s]+’”, // 去掉空白字符
  9. “‘&(quot|#34);’i”, // 替换 HTML 实体
  10. “‘&(amp|#38);’i”,
  11. “‘&(lt|#60);’i”,
  12. “‘&(gt|#62);’i”,
  13. “‘&(nbsp|#160);’i”,
  14. “‘&(iexcl|#161);’i”,
  15. “‘&(cent|#162);’i”,
  16. “‘&(pound|#163);’i”,
  17. “‘&(copy|#169);’i”,
  18. “‘(\d+);’e”); // 作为 PHP 代码运行
  19. $replace = array (“”,
  20. “”,
  21. “\\1″,
  22. “\”",
  23. “&”,
  24. ““>”,
  25. “ ”,
  26. chr(161),
  27. chr(162),
  28. chr(163),
  29. chr(169),
  30. “chr(\\1)”);
  31. $text = preg_replace ($search, $replace, $html);
  32. $text = trim($text);
  33. return mb_strlen($text) >= $len ? mb_substr($text, 0, $len) : ”;
  34. }
  35. ?>
复制代码


声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn