ホームページ  >  記事  >  php教程  >  PHP の学習 - URL の解析

PHP の学習 - URL の解析

WBOY
WBOYオリジナル
2016-06-21 08:47:141021ブラウズ

PHP には、URL の解析に使用できるメソッドが 2 つあり、parse_url と parse_str です。

parse_url

URL を解析し、その構成部分を返します

mixed parse_url ( string $url [, int $component = -1 ] )

この関数は URL を解析し、URL に含まれるさまざまなコンポーネントを含む連想配列を返します。

この関数は、指定された URL の有効性を検証するために使用されるのではなく、URL を以下にリストされている部分に分割するために使用されます。不完全な URL も受け入れられ、parse_url() はそれらをできるだけ正確に解析しようとします。

パラメータ

url 解析する URL。無効な文字は_に置き換えられます。

コンポーネント PHP_URL_SCHEME、PHP_URL_HOST、PHP_URL_PORT、PHP_URL_USER、PHP_URL_PASS、PHP_URL_PATH、PHP_URL_QUERY、または PHP_URL_FRAGMENT のいずれかを指定して、URL の指定された部分の文字列を取得します。 (PHP_URL_PORT として指定された場合を除き、整数値が返されます)。

戻り値

著しく修飾されていない URL の場合、parse_url() は FALSE を返す場合があります。

コンポーネントパラメータが省略された場合、連想配列配列が返され、現在少なくとも 1 つの要素が配列内に存在します。配列内で使用できるキーは次のとおりです:

スキーム - http のような

ホスト

ポート

ユーザー

パス

パス

クエリ - 疑問符の後?

フラグメント - ハッシュ記号 #

の後

component 引数が指定されている場合、parse_url() は配列の代わりに文字列 (または PHP_URL_PORT として指定されている場合は整数) を返します。 URL 内に指定されたコンポーネントが存在しない場合は、NULL が返されます。

$url = 'http://ユーザー名:パスワード@ホスト名/パス?arg=値#アンカー';

print_r(parse_url($url));

echo parse_url($url, PHP_URL_PATH);

?>

上記のルーチンは次のように出力します:

コードをコピー

配列

(

[スキーム] => http

[ホスト] => ホスト名

[ユーザー] => ユーザー名

[パス] => パスワード

[パス] => /パス

[クエリ] => 引数=値

[フラグメント] => アンカー

)

/パス

コードをコピー

parse_str

文字列を複数の変数に解析します

void parse_str ( string $str [, array &$arr ] )

str が URL によって渡されたクエリ文字列である場合、それを変数に解析し、現在のスコープに設定します。

現在の QUERY_STRING を取得するには、$_SERVER['QUERY_STRING'] 変数を使用できます。

パラメータ

str 入力文字列。

arr 2 番目の変数 arr が設定されている場合、変数は代わりに配列要素としてこの配列に格納されます。 、

コードをコピー

$str = "first=value&arr[]=foo+bar&arr[]=baz";

parse_str($str);

echo $first // 値

echo $arr[0] // foo bar

echo $arr[1] // baz

;

parse_str($str, $output);

echo $output['first'] // 値

echo $output['arr'][0] // foo bar

;

echo $output['arr'][1] // baz

;

?>

コードをコピー

少し前に php-resque のソース コードを読んでいたところ、これら 2 つのメソッドが Redis リンクの設定を解析するために非常にうまく使用されていることがわかりました。

redis リンクの形式は、redis://user:pass@host:port/db?option1=val1&option2=val2 です。URL と同じなので、上記の 2 つの方法を使用して簡単に解析できます。 。

アドレス: https://github.com/chrisboulton/php-resque/blob/master/lib/Resque/Redis.php

コードは次のとおりです:

コードをコピー

/**

* DSN 文字列を解析します。次のいずれかの形式になります。

*

* - ホスト:ポート

* - redis://user:pass@host:port/db?option1=val1&option2=val2

* - tcp://user:pass@host:port/db?option1=val1&option2=val2

*

* 注: DSN の「ユーザー」部分は使用されません。

*

* @param string $dsn DSN 文字列

* @return array DSN コンポーネントの配列。不明なコンポーネントには「false」値が含まれます。例:

* [ホスト、ポート、データベース、ユーザー、パス、オプション]

     */

パブリック静的関数 parseDsn($dsn)

{

if ($dsn == '') {

// 空の DNS 文字列には適切なデフォルトを使用します

$dsn = 'redis://' 。 self::DEFAULT_HOST;

}

$parts = parse_url($dsn);

// URI スキームを確認します

$validSchemes = array('redis', 'tcp');

if (isset($parts['scheme']) && ! in_array($parts['scheme'], $validSchemes)) {

throw new InvalidArgumentException("無効な DSN。サポートされているスキームは " .implode(', ', $validSchemes));

}

// `parse_url` がホストではなくパスとして扱う単純な 'hostname' 形式を許可します。

if ( ! isset($parts['host']) && isset($parts['path'])) {

$parts['host'] = $parts['path'];

unset($parts['path']);

}

// ポート番号を整数として抽出します

$port = isset($parts['port']) ? intval($parts['port']) : self::DEFAULT_PORT;

// URI の「パス」部分からデータベースを取得します

$database = false;

if (isset($parts['path'])) {

// パスから数字以外の文字を削除します

$database = intval(preg_replace('/[^0-9]/', '', $parts['path']));

}

// 'user' 値と 'pass' 値を抽出します

$user = isset($parts['user']) ? $parts['user'] : false;

$pass = isset($parts['pass']) ? $parts['pass'] : false;

// クエリ文字列を連想配列に変換します

$options = array();

if (isset($parts['query'])) {

// クエリ文字列を配列に解析します

parse_str($parts['query'], $options);

}

return array(

$parts['host'],

$port,

$database,

$user,

$pass、

$options,

);

}



声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。