ホームページ >バックエンド開発 >PHPチュートリアル >jsoup を使用して HTML からすべてのリンクを抽出する例

jsoup を使用して HTML からすべてのリンクを抽出する例

WBOY
WBOYオリジナル
2016-07-25 09:08:051278ブラウズ
バイト オーダー マーク (BOM) は、コード ポイント U+FEFF にある Unicode 文字 (「ゼロ幅の非改行空白」) です。この文字は、UCS/Unicode 文字の文字列を UTF-16 または UTF-32 としてエンコードするときにバイト順序を示すために使用されます。ファイルが UTF-8、UTF-16、または UTF-32 でエンコードされていることを示すマーカーとしてよく使用されます。
  1. クラス暗号化 {
  2. function en($str,$key) {
  3. $ret='';
  4. $str =base64_encode ($str);
  5. for ($i=0; $i< ;=strlen($str)-1; $i++){
  6. $d_str=substr($str, $i, 1);
  7. $int =ord($d_str);
  8. $int=$int^$key;
  9. $hex=strtoupper(dechex($int));
  10. $ret.=$hex;
  11. }
  12. return $ret;
  13. }
  14. function de($str,$key) {
  15. $ret='';
  16. for ($i=0; $i<=strlen($str)-1; 0){
  17. $hex=substr($str, $i, 2);
  18. $dec=hexdec($hex);
  19. $dec= $dec^$key;
  20. $ret.=chr($dec);
  21. $i=$i+2;
  22. }
  23. returnbase64_decode($ret);
  24. }
  25. }
  26. $cryption=新しい暗号化;
  27. ?>
コードをコピー
  1. /*
  2. * 2012-3-23 に作成
  3. *
  4. * この生成されたファイルのテンプレートを変更するには、
  5. * ウィンドウ - 設定 - PHPeclipse - PHP - コード テンプレート
  6. */
  7. $content = '
    ';
  8. preg_match('/]*src=["']Butt[/]?(.+?)["']Butt[^>]* > /si', $content, $matches);
  9. print_r($matches);
  10. echo '
    ';
  11. preg_match('/]*src=[ "' ]Butt[/]?(.+?)["']Butt[^>]*>/si', $content, $matches);
  12. print_r($matches);
  13. define( 'HTTP_PATH', 'http://'.$_SERVER['HTTP_HOST']);
  14. $img = getimagesize(HTTP_PATH.$matches[1]);
  15. print_r($img);
  16. mb_internal_encoding('UTF-8 ');
  17. $a = '愛しています愛しています';
  18. echo mb_strlen($a);
  19. echo '
    ';
  20. echo mb_substr($a,1,2);
  21. ?>
コードをコピー
  1. // +-------------------------------------- -- --------------------------------
  2. // | ThinkPHP [ 考えるだけでできる ]
  3. / / + ------------------------------------------------ -- --------------------
  4. // | 著作権 (c) 2009 http://thinkphp.cn 無断複写・転載を禁じます。
  5. // +---- -------------------------------------------------- -- ---------------
  6. // ライセンス済み ( http://www.apache.org/licenses/LICENSE-2.0 )
  7. // +------ --- --------------------------------------------------- --- ----------
  8. // | 著者: liu21st
  9. // +------ --- --------------------------------------------------- ---
  10. //ThinkPHP フレームワークのパスを定義します
  11. define('THINK_PATH', 'ThinkPHP');
  12. //プロジェクト名とパスを定義します
  13. define('APP_NAME', 'Home');
  14. define(' APP_PATH', 'Home' );
  15. define('NO_CACHE_RUNTIME', true);
  16. //define('RUNTIME_ALLINONE', true);
  17. // フレームワークエントリーファイルをロードする
  18. require(THINK_PATH."/ThinkPHP) .php");
  19. //ウェブサイトアプリケーションインスタンスをインスタンス化します
  20. App::run();
  21. ?>
コードをコピー
jsoup を使用して HTML からすべてのリンクを抽出する例


声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。