検索
ホームページウェブフロントエンドhtmlチュートリアルhtmlにおける文字セットの言語エンコードについて詳しく解説

HTMLの言語エンコーディングの重要性に注意してください

  • Directory


  1. charsetエンコーディングの重要性

  2. HTML の文字セットはどこですか

  3. charsetタグ

  4. エンコーディングタイプ

  5. charset utf-8の概要

  6. charset GB2312の概要

  7. エンコーディング、Webページの互換性のため

1.コーディングの -

TOP

視聴者が IE を使用している場合、エンコーディングは Web ページの文字化けを引き起こす可能性があり、また、p+css 互換性ハックにつながる可能性があります。

2. エンコード位置 -

TOP

3. HTML エンコードスタイル -

TOP
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

charset=utf-8 の utf-8 を変更することで、Web ページのエンコードを変更できます。
通常、CSS ファイルを作成するときは、CSS ファイルの先頭で
@charset "utf-8"; を使用して、この CSS ファイルのエンコード タイプを定義する必要もあります。一般に、HTML ソース コードと CSS ファイルのエンコーディングは統一する必要があります。統一されていないと、CSS ハック、ページの文字化け、ページ レイアウトの混乱などの互換性の問題が発生します。

4. 一般的に使用される HTML エンコード タイプ -

TOP

中国で一般的に使用される 2 つの一般的なタイプは、utf-8 と gb2312 です。一般に、これら 2 つのタイプは国内の Web ページのエンコードのニーズを満たすことができます。もちろん、これら 2 つのエンコーディング タイプは、Web ページを処理したりデータ型を保存したりするためにプログラムやデータベースでも使用されます。

5. UTF-8 には次の特徴があります: -

TOP

    UCS 文字 U+0000 から U+007F (ASCII) はバイト 0x00 から 0x7F (ASCII 互換) としてエンコードされます。これは 7 つのファイルのみを含むことを意味します。 ASCII 文字の場合は、ASCII と UTF-8 の両方のエンコード方式で同じです。
  1. U+007F を超えるすべての UCS 文字はマルチバイト文字列としてエンコードされ、各バイトにはフラグ ビットが設定されます。したがって、ASCII バイト (0x00- 0x7F) は他の文字の一部にすることはできません
  2. 非 ASCII 文字を表すマルチバイト文字列の最初のバイトは常に 0xC0 から 0xFD の範囲内にあり、この文字に含まれるバイト数を示します。マルチバイト文字列の範囲は 0x80 から 0xBF です。これにより、再同期が非常に簡単になり、エンコーディングがボーダレスになり、欠落バイトの影響が少なくなります。
  3. 可能なすべての 231 UCS コードをエンコードできます
  4. UTF-8 でエンコードされた文字を使用できます。理論的には最大 6 バイトの長さですが、16 ビット BMP 文字の長さは最大 3 バイトまでです。
  5. Bigendian UCS-4 バイト文字列の配置順序は事前に決定されています
  6. バイト 0xFE と 0xFF は決して存在しません。 UTF-8 エンコーディングで使用されます。
  7. 6. GB2312 には次の特徴があります -
TOP

GB2312 標準には、3755 の第 1 レベルの中国語文字と 3008 の第 2 レベルの中国語文字を含む、合計 6763 の中国語文字が含まれています。同時に、GB2312 には、ラテン文字、ギリシャ文字、日本語のひらがなおよびカタカナ文字、および 682 個の全角ロシア文字が含まれています。

GB2312 の登場は、基本的に漢字のコンピュータ処理ニーズを満たしており、それに含まれる漢字は使用頻度の 99.75% をカバーしています。 GB2312 では、収集された漢字が「分割」され、各ゾーンには 94 個の漢字/記号が含まれます。この表現は位置コードとも呼ばれます。

01-09 エリアは特別なシンボルです。

エリア 16 ~ 55 は、ピンインでソートされた第 1 レベルの漢字です。

領域56〜87は、部首/画数ごとに分類された第2レベルの漢字です。

地区 10 ~ 15 および 88 ~ 94 はコード化されていません。

たとえば、「あ」という文字は GB2312 の最初の漢字であり、その位置コードは 1601 です。 GB2312 を使用するプログラムでは、通常、バイト構造は EUC 格納方式を使用するため、 アスキーと互換性があります。各漢字と記号は 2 バイトで表されます。最初のバイトは「上位バイト」と呼ばれ、2 番目のバイトは「下位バイト」と呼ばれます。 「上位バイト」は0xA1~0xF7(エリアコード01~87に0xA0を加算)、「下位バイト」は0xA1~0xFE(0xA0に01~94を加算)を使用します。例えば 単語「ah」は、ほとんどのプログラムで 0xB0A1 として保存されます。 (ロケーション コードと比較してください: 0xB0=0xA0+16、0xA1=0xA0+1)。

GB2312エンコードにおける漢字市外局番の10進法は176から247、ビットコードは161から255となります。 6763が格納される理由は、市外局番が215であるため、82*94=6768より小さくなります。ビット コードは 250 です。254 の間にはコードが 5 つあり、漢字コードがないため、6768-5=6763 となります。

GB2312 エンコードは、中国の共通言語として簡単に理解できます。

7. 推奨される文字セット エンコーディング -

TOP

UTF-8 は、台湾や中国本土などの簡体字中国語と繁体字中国語で簡単に理解できます。

8. エンコーディングによって引き起こされる Web ページの互換性エラー: - TOP

エンコーディングが混在している場合、Web ページは文字化けします。これは、特に CSS コメントにエンコーディングが混在している場合に発生します。 CSSハック。

今後Webページを作成する際には、Webページのエンコーディングの宣言を忘れないようにしていただければ幸いです。

このページを閲覧したユーザーは次のコンテンツも閲覧しています:
1. UTF-8 GBK UTF8 GB2312 の違いと関係
2. HTML エンコード設定の選択方法
3.

以上がhtmlにおける文字セットの言語エンコードについて詳しく解説の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
HTML超文本标记语言--超在那里?(文档分析)HTML超文本标记语言--超在那里?(文档分析)Aug 02, 2022 pm 06:04 PM

本篇文章带大家了解一下HTML(超文本标记语言),介绍一下HTML的本质,HTML文档的结构、HTML文档的基本标签和图像标签、列表、表格标签、媒体元素、表单,希望对大家有所帮助!

html和css算编程语言吗html和css算编程语言吗Sep 21, 2022 pm 04:09 PM

不算。html是一种用来告知浏览器如何组织页面的标记语言,而CSS是一种用来表现HTML或XML等文件样式的样式设计语言;html和css不具备很强的逻辑性和流程控制功能,缺乏灵活性,且html和css不能按照人类的设计对一件工作进行重复的循环,直至得到让人类满意的答案。

web前端笔试题库之HTML篇web前端笔试题库之HTML篇Apr 21, 2022 am 11:56 AM

总结了一些web前端面试(笔试)题分享给大家,本篇文章就先给大家分享HTML部分的笔试题(附答案),大家可以自己做做,看看能答对几个!

总结HTML中a标签的使用方法及跳转方式总结HTML中a标签的使用方法及跳转方式Aug 05, 2022 am 09:18 AM

本文给大家总结介绍a标签使用方法和跳转方式,希望对大家有所帮助!

html中document是什么html中document是什么Jun 17, 2022 pm 04:18 PM

在html中,document是文档对象的意思,代表浏览器窗口的文档;document对象是window对象的子对象,所以可通过“window.document”属性对其进行访问,每个载入浏览器的HTML文档都会成为Document对象。

HTML5中画布标签是什么HTML5中画布标签是什么May 18, 2022 pm 04:55 PM

HTML5中画布标签是“<canvas>”。canvas标签用于图形的绘制,它只是一个矩形的图形容器,绘制图形必须通过脚本(通常是JavaScript)来完成;开发者可利用多种js方法来在canvas中绘制路径、盒、圆、字符以及添加图像等。

html5废弃了哪个列表标签html5废弃了哪个列表标签Jun 01, 2022 pm 06:32 PM

html5废弃了dir列表标签。dir标签被用来定义目录列表,一般和li标签配合使用,在dir标签对中通过li标签来设置列表项,语法“<dir><li>列表项值</li>...</dir>”。HTML5已经不支持dir,可使用ul标签取代。

Html5怎么取消td边框Html5怎么取消td边框May 18, 2022 pm 06:57 PM

3种取消方法:1、给td元素添加“border:none”无边框样式即可,语法“td{border:none}”。2、给td元素添加“border:0”样式,语法“td{border:0;}”,将td边框的宽度设置为0即可。3、给td元素添加“border:transparent”样式,语法“td{border:transparent;}”,将td边框的颜色设置为透明即可。

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

SublimeText3 英語版

SublimeText3 英語版

推奨: Win バージョン、コードプロンプトをサポート!

MantisBT

MantisBT

Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティング サービスをチェックしてください。

mPDF

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

SublimeText3 Linux 新バージョン

SublimeText3 Linux 新バージョン

SublimeText3 Linux 最新バージョン