ホームページ  >  記事  >  バックエンド開発  >  Unicode と UTF-8、ISO8859-1 などの関係は何ですか?

Unicode と UTF-8、ISO8859-1 などの関係は何ですか?

WBOY
WBOYオリジナル
2016-08-04 09:21:121124ブラウズ

まず、この二人の関係はどうなっているのでしょうか?また、コーディングと実装にはどのような関係があるのでしょうか?これらの概念がわかりません = =

返信内容:

まず、この二人の関係はどうなっているのでしょうか?また、コーディングと実装にはどのような関係があるのでしょうか?これらの概念がわかりません = =

誰かが再びこの質問をしたので、リンクを投稿する必要がありました。
https://segmentfault.com/q/1010000004240543/a-1020000004241029

http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html

Ruan Yifeng さんのブログ投稿に感謝します http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html

要約すると、おそらく違いは、Unicode は単なるシンボル セットであるということです。シンボルのバイナリ コードを指定するだけで、バイナリ コードを格納する方法は指定しません。 UTF-8などは文字セットの格納方法の名称です。 1 つはシンボル セット、もう 1 つは保存方法です。これが違いです。

ANSI と Unicode は、文字を表現するための 2 つの異なる標準システムです。

ISO8859-1 と GBK はすべて ANSI から派生したもので、このタイプのエンコーディングは特定のタイプのテキスト用に確立された標準であり、通常は ASCII とのみ互換性があります。

UTF-8、UTF-16 これらは、世界中のすべての言語と文字を含めるように設計された Unicode 標準エンコーディングであり、さまざまな言語環境のコンピュータでも文字化けせずにテキストを正常に表示できるように設計されています。エンコーディングに含まれる文字数が多いため、占有スペースが比較的大きくなります。

つまり、私たちがよく触れるものの本質には、Unicodeの一種のパッケージであるUTF-8が含まれているため、エンコーディング間の変換は、まずUnicodeに変換してから変換する必要があります。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。