首頁  >  文章  >  後端開發  >  一個比較全面的截取函數(多用於採集內容的分析)

一個比較全面的截取函數(多用於採集內容的分析)

WBOY
WBOY原創
2016-07-25 09:07:09901瀏覽
  1. /*

  2. 采集截取函数,主要用于分析采集的内容
  3. getcon - 截取后去掉html字符,并去掉空格
  4. getcon2 - 单纯截取,直接返回截取内容。
  5. 参数:
  6. $par可接受两种格式:
  7. 1.前面字符{DATA}后面字符
  8. 2.正则表达式
  9. */

  10. function getcon($pat,$str){

  11. $title_var=explode("{DATA}",$pat);
  12. if(count($title_var)>1){
  13. $title_1=explode($title_var[0],$str);
  14. $title_2=explode($title_var[1],$title_1[1]);
  15. return strip_s(strip_tags($title_2[0]));
  16. }else{
  17. preg_match_all($pat,$str,$res);
  18. return strip_s(strip_tags($res[1][0]));
  19. }
  20. }
  21. function getcon2($pat,$str){
  22. $title_var=explode ("{DATA}",$pat);
  23. if(count($title_var)>1){
  24. $title_1=explode($title_var[0],$str);
  25. $title_2=explode($title_var[1],$title_1[1]);
  26. return $title_2[0];
  27. }else{
  28. preg_match_all($pat,$str,$res);
  29. return $res[1][0];
  30. }
  31. }
  32. function strip_s($str){
  33. $str = preg_replace ("/(s+)/", ' ', $str);
  34. $str = str_replace(chr(13),'',$str);
  35. $str = str_replace(chr(10),'
    ',$str);
  36. $str = ltrim($str);
  37. $str = trim($str);
  38. return $str;
  39. }
  40. ?>

复制代码


陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn