XMLドキュメントにはノルウェー語やフランス語などの外国文字を含めることができます(中国語も可能です!この部分はまだ原文に従って翻訳できません。以下の内容の一部は私が書いたものです)
パーサーを作成するためにこれらの文字を理解するには、XML ドキュメント全体で一貫した文字エンコード標準を使用する必要があります。
------------------------------------------------ --------------------------------
Windows 95/98のメモ帳
Windows 95/98のメモ帳はUnicodeで記述できませんファイルをエンコード形式で保存します。
外国語文字 (ノルウェー語、フランス語、中国語など) を含む XML ドキュメントを編集して保存するには、メモ帳を使用できます
<?xml version="1.0"?> <note> <from>小奀</from> <to>小林</to> <message>晚上一起去火锅呀</message> </note>
しかし、メモ帳で編集したこの XML ドキュメントをブラウザを使用して開くと、エラーのメッセージが表示されます。
------------------------------------------------ --------------------------------
Windows 95/98 メモ帳でのエンコーディングの使用
Windows 95/98 メモ帳これは編集されましたXML ファイルはエンコードされ、属性が設定されている必要があります。
エラーを回避するために、XML ドキュメント宣言にエンコーディング属性を追加して、この XML ドキュメントのエンコーディング タイプを示すことができますが、Unicode エンコーディングは使用しないでください。
次のエンコード タイプではエラーは発生せず、中国語の文字は正常に表示されます:
<?xml version="1.0" encoding="gb2312"?>
次のエンコード タイプではエラーは発生せず、中国語の文字は正常に表示されます:
<?xml version="1.0" encoding="gbk"?>
次のエンコード タイプではエラーは発生しませんエラー、、中国語の文字が異常に表示される (コード化け):
<?xml version="1.0" encoding="windows-1252"?>
次のエンコード タイプではエラーは発生せず、中国語の文字が異常に表示されます (コード化け):
<?xml version="1.0" encoding="ISO-8859-1"?>
次のエンコード タイプではエラーは発生しません、中国語の文字は正常に表示されます:
<?xml version="1.0" encoding="UTF-8"?>
次のエンコード タイプではエラーが発生します。:
<?xml version="1.0" encoding="UTF-16"?>
-------------------------------------- -------- -------------------------------------- --------
Windows 2000 メモ帳の使用
Windows 2000 メモ帳は、Unicode エンコード形式でファイルを保存できます。
Windows 2000 のメモ帳は Unicode文字セット をサポートしています。 Win2000 メモ帳を使用して XML ドキュメントを Unicode エンコード形式で保存する場合 (XML 宣言にはエンコード情報がないことに注意してください):
<?xml version="1.0"?> <note><from>小奀</from><to>小林</to><message>晚上一起去火锅呀</message></note>
------ -------------------------------------------------- -- ----------
Windows 2000 メモ帳のエンコード
Windows 2000 メモ帳は、ファイルを「UTF-16」エンコード形式で保存することもできます。
XML文書内でencoding属性を宣言し、Unicodeエンコード形式でファイルを保存するとエラーが発生する場合があります。
次のコードはエラーを引き起こします:
<?xml version="1.0" encoding="windows-1252"?>
次のコードはエラーを引き起こします:
<?xml version="1.0" encoding="ISO-8859-1"?>
次のコードはエラーを引き起こします:
<?xml version="1.0" encoding="UTF-8"?>
次のファイル; note_encode_utf16_u.xml は IE5 で動作します。 0+では正常に表示されますが、Netscape 6.2ブラウザではエラーが発生します。
-------------------------------------------- -- --------------------------------
エラーメッセージ
IE5.0またはXML ドキュメントを操作するときに、次の 2 つの異なるエンコード エラーが発生する可能性があります。
テキスト コンテンツに無効な文字が見つかりました。
XML ドキュメントが XML ドキュメントのエンコード形式と一致しない場合、エラーが発生する可能性があります。通常、XML 文書には「英語以外の」文字が含まれており、シングルバイトのエンコード Editor が使用されており、XML 文書のエンコード形式は XML 文書の宣言で設定されていません。
現在のエンコード形式から別のエンコード形式への変換はサポートされていません (現在のエンコードから仕様のifエンコードへの切り替えはサポートされていません)。 XML ドキュメントが Unicode/UTF-16 エンコード形式で保存されているが、XML ドキュメントの宣言でエンコード形式がシングルバイト エンコード (Windows-1252、ISO-8859-1、UTF など) に設定されている場合8); または、XML ドキュメントはシングルバイトのエンコード形式で保存されますが、XML ドキュメントの宣言によりエンコード形式が Unicode/UTF-16 エンコード形式に設定されます。どちらの場合もエラーが発生します。
------------------------------------------------ --------------------------------
結論
結論: XML ドキュメントを保存する前に、その宣言に設定します。ドキュメントのエンコード形式、エラーを回避するためのいくつかの提案:
Unicode エンコード形式をサポートするエディタを使用します。
属性宣言を使用して、XML ドキュメントのエンコード形式を設定します。
以上がXMLファイルの編集方法を詳しく紹介の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。