PHP에는 URL을 구문 분석하는 데 사용할 수 있는 두 가지 메소드(parse_url 및parse_str)가 있습니다.
parse_url
URL을 구문 분석하여 해당 구성 요소를 반환합니다.
혼합된 구문 분석 URL( string $url [, int $comComponent = -1 ] )
이 함수는 URL을 구문 분석하고 URL에 나타나는 다양한 구성 요소가 포함된 연관 배열을 반환합니다.
이 기능은 제공된 URL의 유효성을 확인하는 데 사용되는 것이 아니라 URL을 아래 나열된 부분으로 분류하는 데 사용됩니다. 불완전한 URL도 허용되며,parse_url()은 이를 가능한 한 정확하게 구문 분석하려고 시도합니다.
매개변수
url 구문 분석할 URL입니다. 유효하지 않은 문자는 _로 대체됩니다.
구성요소 PHP_URL_SCHEME, PHP_URL_HOST, PHP_URL_PORT, PHP_URL_USER, PHP_URL_PASS, PHP_URL_PATH, PHP_URL_QUERY 또는 PHP_URL_FRAGMENT 중 하나를 지정하여 URL의 지정된 부분에 대한 문자열을 가져옵니다. (PHP_URL_PORT로 지정한 경우를 제외하면 정수값이 반환됩니다.)
반환값
심각하게 자격이 없는 URL의 경우,parse_url()이 FALSE를 반환할 수 있습니다.
구성요소 매개변수를 생략하면 연관 배열 배열이 반환되며, 현재 배열에 최소한 하나의 요소가 포함됩니다. 배열에 가능한 키는 다음과 같습니다:
구성표 - http와 유사
호스트
항구
사용자
합격
경로
쿼리 - 물음표 뒤
조각 - 해시 기호 #
뒤
구성 요소 인수가 지정된 경우,parse_url()은 배열 대신 문자열(또는 PHP_URL_PORT로 지정된 경우 정수)을 반환합니다. URL에 지정된 구성 요소가 없으면 NULL이 반환됩니다.
예
$url = 'http://username:password@hostname/path?arg=value#anchor';
print_r(parse_url($url));
echo pars_url($url, PHP_URL_PATH);
?>
위 루틴은 다음을 출력합니다:
배열
(
[구성표] =>http
[호스트] => 호스트 이름
[사용자] => 사용자 이름
[통과] => 비밀번호
[경로] => /경로
[쿼리] => 인수=값
[조각] => 앵커
)
/경로
parse_str
문자열을 여러 변수로 구문 분석
voidpars_str(문자열 $str [, array &$arr ] )
str이 URL로 전달된 쿼리 문자열인 경우 이를 변수로 구문 분석하고 현재 범위로 설정합니다.
현재 QUERY_STRING을 얻으려면 $_SERVER['QUERY_STRING'] 변수를 사용할 수 있습니다.
매개변수
str 입력 문자열입니다.
arr 두 번째 변수 arr이 설정되면 변수는 대신 이 배열에 배열 요소로 저장됩니다. ,
예
$str = "first=value&arr[]=foo bar&arr[]=baz";
pars_str($str);
에코 $first; //값
echo $arr[0]; // foo 바
echo $arr[1] // baz
pars_str($str, $output);
echo $output['first'] // 값
echo $output['arr'][0] // foo 바
echo $output['arr'][1] // baz
?>
얼마 전에 php-resque의 소스 코드를 읽다가 이 두 가지 방법을 적용한 것을 보니 redis 링크의 설정을 파싱하는 데 매우 잘 사용되는 것 같습니다.
redis 링크 형식은 redis://user:pass@host:port/db?option1=val1&option2=val2 URL과 같으니 위의 두 가지 방법을 이용하면 쉽게 파싱할 수 있습니다. .
주소:
https://github.com/chrisboulton/php-resque/blob/master/lib/Resque/Redis.php
코드는 다음과 같습니다.
코드 복사 코드는 다음과 같습니다.
/**
* 다음 형식 중 하나를 가질 수 있는 DSN 문자열을 구문 분석합니다.
*
* - 호스트:포트
* - redis://user:pass@host:port/db?option1=val1&option2=val2
* - tcp://user:pass@host:port/db?option1=val1&option2=val2
*
* 참고: DSN의 '사용자' 부분은 사용되지 않습니다.
*
* @param string $dsn DSN 문자열
* @return array 알 수 없는 구성 요소에 대해 'false' 값을 갖는 DSN 구성 요소의 배열입니다. 예:
* [호스트, 포트, DB, 사용자, 패스, 옵션]
*/
공개 정적 함수parseDsn($dsn)
{
if ($dsn == '') {
// 빈 DNS 문자열에 합리적인 기본값을 사용하세요
$dsn = 'redis://' . self::DEFAULT_HOST;
}
$parts=parse_url($dsn);
// URI 체계를 확인하세요
$validSchemes = array('redis', 'tcp');
if (isset($parts['scheme']) && ! in_array($parts['scheme'], $validSchemes)) {
throw new InvalidArgumentException("잘못된 DSN. 지원되는 구성표는 " . implode(', ', $validSchemes));
}
// `parse_url`이 호스트가 아닌 경로로 처리하는 간단한 '호스트 이름' 형식을 허용합니다.
if ( ! isset($parts['host']) && isset($parts['path'])) {
$parts['host'] = $parts['path'];
unset($parts['path']);
}
// 포트번호를 정수로 추출
$port = isset($parts['port']) ? intval($parts['port']) : self::DEFAULT_PORT;
// URI의 '경로' 부분에서 데이터베이스를 가져옵니다
$database = 거짓;
if (isset($parts['path'])) {
// 경로에서 숫자가 아닌 문자를 제거합니다
$database = intval(preg_replace('/[^0-9]/', '', $parts['path']));
}
// 'user' 및 'pass' 값을 추출합니다
$user = isset($parts['user']) ? $parts['사용자'] : 거짓;
$pass = isset($parts['pass']) ? $parts['pass'] : 거짓;
// 쿼리 문자열을 연관 배열로 변환
$옵션 = 배열();
if (isset($parts['query'])) {
// 쿼리 문자열을 배열로 구문 분석합니다
pars_str($parts['query'], $options);
}
배열 반환(
$parts['호스트'],
$포트,
$데이터베이스,
$user
$패스
$옵션
);
}