PHP プログラミングでは、file_get_contents を使用して Web ページを取得した後、echo を使用して直接出力すると、ブラウザーの出力は自動的に解析され、出力は Web ページのままになります。
htmlspecialcharsを使用して取得したコンテンツを変換し、すべてのリンクを取得します。インターセプト。
インターセプト時に問題が発生する可能性があります、
htmlspecialchars、インターセプトメソッドを使用して変換されたコンテンツをインターセプトします:
-
- $word = substr($str,strpos($str,'>',5)+4,strpos($str,"<",10)-strpos($str,'>',5 )-4);
- function CaptureKeyArray($url)
- {
- $content=file_get_contents($url);
- $pattern="//imsU";
- $match = array();
- preg_match_all($pattern,$content,$match);
- $matchFilter = array();
- foreach($match[0] as $key=>$val)
- {
- $str= htmlspecialchars ($val);
- if(strpos($str,"img"))
- {
- }
- else
- {
- //なぜ < を除外できないのですか、代わりに <
- $word = substr($str ,strpos ($str,'>',5)+4,strpos($str,"<",10)-strpos($str,'>',5)-4);
- if($word!= ")
- {
- array_push($matchFilter,$word);
- }
- }
- }
- return $matchFilter;
- }
コードをコピー
|