HTML URLエンコーディング

PHPz
PHPzオリジナル
2024-09-04 16:41:27677ブラウズ

この記事では、HTML URL エンコーディングについて詳しく学びます。 HTML URL は、World Wide Web 上のグローバルまたは IP アドレスへの Uniform Resource Locator の頭字語です。 Web サーバーは、Web ブラウザの URL を使用してページを取得します。

例: https://www.google.com は URL の 1 つです。

ASCII 文字セットは HTML URL エンコーディングにとって重要です。 URL は ASCII 文字セットを使用してインターネットに送信されます。非 ASCII 文字は、サーバーへのページ パスを見つける際に競合が発生する可能性があるため、制限されています。この問題のため、HTML では URL エンコーディングが使用されます。

HTML URL エンコーディングは、非 ASCII 文字をインターネットに送信できる形式に変換します。ユーザーは「%」を使用して 2 つの 16 進数を継続して変換できます。

HTML で URL エンコーディングを実行するには?

HTML URLエンコーディング

フォームにスペースを入れると、URL エンコーディングは HTML+CSS になります。

<a href="my file.html">

URL にスペースを指定すると、URL エンコードは my%20file.html として行われます。

  1. 予約文字: URL アドレスには何らかの意味を持つ文字がいくつかあり、命名目的に使用できます。別の URL 部分にプラス (/) 記号を使用するなど、両方の方法を使用できます。また、アドレス名に意味を持たせることなく、%2f で / エンコードすることもできます。
  2. 安全でない文字: URL 名のスペースなど、多くの文字が URL アドレスを誤解します。 URL アドレス名 にスペースを入れる代わりに、 と記述します。するとURL名は「pa ge.html」のようです。
  3. 非 ASCII 制御文字: これらの文字には 80-Ff の 16 進値のセットが含まれており、形式を変換する必要があります。
  4. ASCII 制御文字: URL 内では機能しません。

HTML URL エンコーディングの例

次に、HTML URL エンコーディングの例を詳しく説明します。

1.予約文字のエンコーディング

以下は、予約文字のエンコードに使用されるテーブルです。

Characters $ & + , / : ; = ? @
URL Encode 24% 26% %2b %2c %2f %3a %3b %3d %3f 40%
キャラクター

$ & + , / : ; = ? @ URL エンコード

24% 26% %2b %2c %2f %3a %3b %3d %3f 40% テーブル> 2.安全でない文字
Characters space < > # % { } | ^ ~ [ ]
URL Encode 20% 22% %3c %3e 23% 25% %7b %7d %7c %5c %5e %7e %5b %5d
以下は、安全でない文字をエンコードするために使用されるテーブルです。 キャラクター スペース 「」 < > # % { } | ^ ~ [ ] URL エンコード 20% 22% %3c %3e 23% 25% %7b %7d %7c %5c %5e %7e %5b %5d テーブル>

3. 非 ASCII 制御文字

以下は、非 ASCII 文字のエンコードに使用されるテーブルです。

Character URL Encode Character URL Encode Character URL Encode Character URL Encode
%80 ˜ %98 « %ab ¿ %bf
%82 %99 ¬ %ac À %c0
ƒ %83 š %9a ­ ª %aa Á %c1
%84 %9b ® %ae  %c2
%85 œ %9c ¯ %af à %c3
%86  %9d ° %b0 Ä %c4
%87 ž %9e ± %b1 Å %c5
ˆ %88 Ÿ %9f ² %b2 Æ %v6
%89  × %d7 ³ %b3 Ç %c7
Š %8a ¡ %a1 ´ %b4 È %c8
%8b ¢ %a2 µ %b5 É %c9
Œ %8c £ %a3 %b6 Ê %ca
Ž %8e ¤ %a4 · %b7 Ë %cb
%91 ¥ %a5 ¸ %b8 Ì %cc
%92 ¦ %a6 ¹ %b9 Í %cd
%93 § %a7 º %ba Î %ce
%94 ¨ %a8 » %bb Ï %cf
%95 © %a9 ¼ %bc Ð %d0
%96 %97 ½ %bd Ñ %d1
ã %e3 Þ %de ¾ %be Ò %d2
æ %e6 ß %df Ø %d8 Ó %d3
ä %e4 à %e0 Ý %dd Ô %d4

4. ASCII 制御文字

以下は、ASCII 文字のエンコードに使用されるテーブルです。

ASCII Character URL-Encoding
NUL – null character %00
SOH – the start of the header %01
STX – the start of the text %02
ETX – end of the text %03
EOT – end of the transmission %04
ENQ – enquiry %05
ACK – acknowledge %06
BEL – bell (ring) %07
BS – backspace %08
HT- horizontal tab %09
LF- line feed %0A
VT- vertical tab %0B
FF- form feed %0C
CR- carriage return %0D
SO- shift out %0E
SI- shift in %0F
DLE- data link escape %10
DC1- device control 1 %11
DC2- device control 2 %12
DC3- device control 3 %13
DC4- device control 4 %14
NAK- negative acknowledge %15
SYN- synchronize %16
ETB- end transmission block %17
CAN- cancel %18
EM – end of medium %19
SUB- substitute %1A
ESC- escape %1B
FS -file separator %1C
GS- group separator %1D
RS- record separator %1E
US- unit separator %1F

HTML における URL エンコーディングの重要性

URL が予約されており、安全ではなく、ASCII 文字ではない場合、URL アドレスはさらに複雑になり、理解できなくなります。 Web ブラウザが URL アドレスを検索すると、Web サーバーは URL の名前またはパスを検索します。 URL 名が ASCII でない場合、HTML での URL エンコーディングの URL の重要性を見つけるのは困難です。

URL アドレスは、見つけやすく、広く受け入れられ、すべての Web ブラウザーとサーバーで理解できるものでなければなりません。一部の文字は、何の目的にも使用されない場合、何らかの目的で使用されるため、URL を誤解します。そのとき競合が発生した可能性があり、パスがユーザーに届きません。

すべての困難を克服し、% を使用して 2 つの 16 進数を計算して ASCII コードに変換された非 ASCII 文字を簡単に使用できるようにするためです。

結論

HTML の URL エンコーディングは、非 ASCII 文字セットを有効な ASCII 形式セットに変換する方法を認識しています。これは広く受け入れられており、Web ブラウザはエラーなく動作します。 URL のエンコードは迅速かつ安全に実行できます。名前と名前の目的の矛盾を避けるために、URL エンコードが必要です。

以上がHTML URLエンコーディングの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。