>  기사  >  백엔드 개발  >  UTF-16에 대한 질문과 해결 방법

UTF-16에 대한 질문과 해결 방법

零下一度
零下一度원래의
2017-06-12 13:08:313222검색

Google의 사이트맵 서비스를 사용하려면 게시된 모든 사이트맵이 유니코드 UTF-8로 인코딩되어야 합니다. Google은 ISO-8859-1과 같은 비유니코드 인코딩은 물론 UTF-16과 같은 다른 유니코드 인코딩도 허용하지 않습니다. 기술적으로 이는 XML 권장사항에서 "모든 XML 핸들러는 유니코드 3.1의 UTF-8 및 UTF-16 인코딩을 허용해야 합니다"라고 구체적으로 요구하므로 Google이 비표준 XML 파서를 사용하고 있음을 의미하지만 이것이 실제로 큰 문제입니까? UTF-8은 모든 사람이 사용할 수 있습니다. Ubiquity는 UTF-8을 선택하는 첫 번째이자 가장 강력한 이유입니다. 현재 전 세계에서 사용되는 모든 스크립트를 처리할 수 있습니다. 아직 약간의 공백이 있지만 점점 덜 명확해지고 점차 채워지고 있습니다. 포함되지 않은 리터럴은 일반적으로 다른 문자 집합에서 구현되지 않으며, 구현되어 있더라도 XML에서는 사용할 수 없습니다. 가장 좋은 경우 이러한 스크립트는 글꼴 차용을 통해 Latin-1과 같은 단일 바이트 문자 집합으로 전달됩니다. 이러한 희귀한 텍스트에 대한 실제 지원은 Unico

1에서 먼저 이루어질 수 있습니다. UTF-8을 사용한 XML 문서 인코딩에 대한 자세한 소개

UTF-16에 대한 질문과 해결 방법

소개: Google의 Sitemap 서비스를 사용하려면 게시된 모든 Sitemap을 UTF-8로 인코딩해야 합니다. 유니코드의 UTF-8. Google은 ISO-8859-1과 같은 비유니코드 인코딩은 물론 UTF-16과 같은 다른 유니코드 인코딩도 허용하지 않습니다. 기술적으로 이는 XML 권장사항에서 "모든 XML 핸들러는 유니코드 3.1의 UTF-8 및 UTF-16 인코딩을 허용해야 합니다"라고 구체적으로 요구하므로 Google이 비표준 XML 파서를 사용하고 있음을 의미하지만 이것이 실제로 큰 문제입니까?

2 Java

UTF-16에 대한 질문과 해결 방법

서론: 유니코드와 UTF-8/UTF-16/UTF-32 유니코드의 관계 및 UTF -8/UTF-16/UTF-32 간의 관계는 문자 집합과 인코딩입니다. 문자 집합의 개념에는 실제로 두 가지 측면이 포함됩니다. 하나는 문자 집합이고 다른 하나는 인코딩 체계입니다. 문자 세트는 포함된 모든 기호를 정의합니다. 좁은 의미의 문자 세트는 인코딩 체계를 포함하지 않고 이 문자 세트에 속하는 모든 기호를 정의합니다. 그러나 일반적으로 문자 집합은 문자 모음을 정의할 뿐만 아니라 각 기호에 대한 이진 인코딩도 정의합니다. GB2312 또는 ASCII를 언급하면...

3. java 8 업데이트 20의 새로운 기능 - 문자열 중복 제거

UTF-16에 대한 질문과 해결 방법

소개: 모든 응용 프로그램의 문자열은 많은 메모리를 차지합니다. . 특히, 개별 UTF-16 문자를 포함하는 char[] 배열은 JVM 메모리 소비에 가장 큰 영향을 미칩니다. 각 문자가 2비트를 차지하기 때문입니다. 실제로 메모리의 30%가 문자열에 의해 소모되는 것은 매우 흔한 일입니다. 아니요

4. php 페이지는 헤더를 삽입하기 위해 include를 사용합니다. php는 헤더 위에 빈 줄이 나타납니다. php include include 사용법 html include

Introduction: include, header:php 페이지는 headerphp를 소개하기 위해 include를 사용하고 헤더 위에 빈 줄이 있습니다: 이 문제는 오랫동안 나를 괴롭혔습니다. 이 문제는 여기서 해결되었습니다. 코드 인코딩에 문제가 있습니다. 내 페이지의 header.php에 사용된 인코딩 형식은 BOM이 있는 UTF-8입니다. BOM이 있는 코드를 BOM이 없는 코드로 수정하여 헤더의 빈 줄이 사라지도록 하세요. UTF-8 BOM은 UTF-8 서명이라고도 합니다. 실제로 UTF-8 BOM은 UTF-16 및 UTF-32를 지원하기 위해 추가되었습니다. 어떤 종류의 코딩을 사용해야 할까요?

5. 영지 포자 분말의 효과, 기능 및 소비 방법 2 웹 페이지를 어떤 문자 세트에서도 정상적으로 표시합니다(계속)

소개 : 영지버섯 포자분말의 효능과 기능 및 섭취방법 : 영지버섯 포자분말의 효능과 역할 및 섭취방법 웹페이지를 임의의 문자 집합에서 정상적으로 표시하는 방법 2 (계속) : :coolcode.cn 며칠 전에 쓴 글인데 어떤 문자 집합에서든 웹 페이지를 정상적으로 표시하는 방법에 대한 글입니다. 소개는 아주 간단합니다. 즉, 처음 128자 이외의 문자 집합은 NCR로 표현합니다. 당시에는 너무 단순하다고 생각해서 구체적인 변환 방법을 소개하지 않았습니다. 그런데 나중에 이런 질문을 하시는 분이 계셔서 여기서 자세히 설명드리겠습니다. 첫 번째 단계는 소스 문자 집합의 문자열을 UTF-16 문자 집합으로 변환하는 것입니다. 이 단계는 UTF-16 문자 집합의 각 문자가 2바이트이고 나중에 처리하기 쉽기 때문입니다. 6. PHP는 BOM 헤더 코드를 제거합니다

소개: PHP는 BOM 헤더 코드를 제거합니다. UTF-8 BOM은 UTF-8 서명이라고도 합니다. 실제로 UTF-8 BOM은 UTF-16 및 UTF-32를 지원하기 위해 추가되었습니다. 현재 파일. 편집기가 파일을 더 쉽게 식별할 수 있도록 어떤 인코딩이 사용됩니까? 그러나 BOM이 편집기에 표시되지 않더라도 추가 빈 줄처럼 출력이 생성됩니다. PHP 파일을 수정한 후에 이런 일이 발생하는 경우: * 로그인 또는 로그아웃할 수 없습니다. * 페이지 상단에 빈 줄이 나타납니다. * 페이지 맨 위로

7. php

php

php

로 XML 노드 데이터를 얻는 작은 문제를 해결하도록 도와주세요. 정말 안타깝습니다. =express,=530000일 때 값을 얻고 싶습니다. 데이터 코드는 다음과 같습니다.< ;?xml version="1.0" 인코딩= "UTF-16" sta

8 편집 ​ ​ ​ $msg=“중국” 이제 이 메시지를 다른 애플리케이션으로 보내서 수신하려고 합니다. 애플리케이션이 정상적으로 표시할 수 있도록 메시지를 utf-16으로 인코딩된 와이드 바이트로 변환하는 방법은 무엇입니까? 지금 바로 보내보니 1바이트였습니다.                                                      -----

9. php

utf16be 인코딩을 utf8로 변환하는 것이 가능합니까? 소개: php에서 utf16be 인코딩을 utf8로 변환하는 것이 가능합니까? utf16be의 데이터를 utf8 데이터로 변환해야 합니다(utf-8 중국어를 gbk로 직접 변환하는 것은 정상인데 문자가 정상적이지 않습니다). 온라인으로 확인했는데 찾을 수 없었어요. ------해결책---------$text = iconv('utf-16be', 'utf-8', $t

【관련 Q&A 추천】:

java - UTF-16 인코딩 문제

c++ 프로그래밍 ascll 버전 또는 유니코드 버전 문제, 어떤 인코딩이 유니코드 버전인지

char 및 String의 코드 포인트에 대한 질문 그리고 코드 단위

위 내용은 UTF-16에 대한 질문과 해결 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.