>  기사  >  백엔드 개발  >  一个比较全面的截取函数(多用于采集内容的分析)

一个比较全面的截取函数(多用于采集内容的分析)

WBOY
WBOY원래의
2016-07-25 09:07:09868검색
  1. /*

  2. 采集截取函数,主要用于分析采集的内容
  3. getcon - 截取后去掉html字符,并去掉空格
  4. getcon2 - 单纯截取,直接返回截取内容。
  5. 参数:
  6. $par可接受两种格式:
  7. 1.前面字符{DATA}后面字符
  8. 2.正则表达式
  9. */
  10. function getcon($pat,$str){

  11. $title_var=explode("{DATA}",$pat);
  12. if(count($title_var)>1){
  13. $title_1=explode($title_var[0],$str);
  14. $title_2=explode($title_var[1],$title_1[1]);
  15. return strip_s(strip_tags($title_2[0]));
  16. }else{
  17. preg_match_all($pat,$str,$res);
  18. return strip_s(strip_tags($res[1][0]));
  19. }
  20. }
  21. function getcon2($pat,$str){
  22. $title_var=explode ("{DATA}",$pat);
  23. if(count($title_var)>1){
  24. $title_1=explode($title_var[0],$str);
  25. $title_2=explode($title_var[1],$title_1[1]);
  26. return $title_2[0];
  27. }else{
  28. preg_match_all($pat,$str,$res);
  29. return $res[1][0];
  30. }
  31. }
  32. function strip_s($str){
  33. $str = preg_replace ("/(\s+)/", ' ', $str);
  34. $str = str_replace(chr(13),'',$str);
  35. $str = str_replace(chr(10),'
    ',$str);
  36. $str = ltrim($str);
  37. $str = trim($str);
  38. return $str;
  39. }
  40. ?>
复制代码


성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.