首頁  >  文章  >  後端開發  >  去除 HTML 標記,javascript 程式碼的小函數

去除 HTML 標記,javascript 程式碼的小函數

WBOY
WBOY原創
2016-07-25 09:02:48853瀏覽
  1. function trip_html( $html, $len ) {
  2. // $html 应包含一个 HTML 文档。
  3. // 本例将去掉 HTML 标记,javascript 代码
  4. // 和空白字符。还会将一些通用的
  5. // HTML 实体转换成相应的文本。
  6. $search = array (“‘]*?>.*?’si”, // 去掉 javascript
  7. “‘<[/!]*?[^<>]*?>’si”, // 去掉 HTML 标记
  8. “‘([rn])[s]+’”, // 去掉空白字符
  9. “‘&(quot|#34);’i”, // 替换 HTML 实体
  10. “‘&(amp|#38);’i”,
  11. “‘&(lt|#60);’i”,
  12. “‘&(gt|#62);’i”,
  13. “‘&(nbsp|#160);’i”,
  14. “‘&(iexcl|#161);’i”,
  15. “‘&(cent|#162);’i”,
  16. “‘&(pound|#163);’i”,
  17. “‘&(copy|#169);’i”,
  18. “‘&#(d+);’e”); // 作为 PHP 代码运行
  19. $replace = array (“”,
  20. “”,
  21. “″,
  22. “”",
  23. “&”,
  24. “<”,
  25. “>”,
  26. “ ”,
  27. chr(161),
  28. chr(162),
  29. chr(163),
  30. chr(169),
  31. “chr()”);
  32. $text = preg_replace ($search, $replace, $html);
  33. $text = trim($text);
  34. return mb_strlen($text) >= $len ? mb_substr($text, 0, $len) : ”;
  35. }
  36. ?>
复制代码


陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn