>웹 프론트엔드 >HTML 튜토리얼 >HTML 해석: 네임스페이스 및 문자 인코딩

HTML 해석: 네임스페이스 및 문자 인코딩

黄舟
黄舟원래의
2016-12-17 14:10:201250검색

프로젝트를 진행하는 과정에서 팀 간의 협력을 촉진하고 프로젝트를 더 잘 완료하기 위해 다양한 사양을 설정하는 경우가 많습니다. 마찬가지로 다양한 합의를 듣는 경우도 있습니다. 예를 들어 Google의 IM 소프트웨어 Gtalk는 개방형 XMPP 프로토콜을 사용합니다. 다른 IM 소프트웨어도 XMPP 프로토콜을 따르기 때문에 Gtalk와 상호 작용할 수 있습니다. 그러나 정보 자체는 독립적으로 존재합니다. 이를 어떻게 직렬로 연결하고 결합할 수 있습니까? 사용자는 HTTP 프로토콜을 사용해야 합니다.

같은 이유로 브라우저마다 커널이 다르고 기본 스타일을 다르게 렌더링하기 때문에 동일한 웹 페이지 문서가 다른 브라우저에 표시되도록 하려면 각 브라우저에서 따르는 일련의 규칙이 필요합니다. 서버에 제시된 규칙은 DOCTYPE 문입니다.

인터넷은 서로 연결되어 있기 때문에 두 개 이상의 웹 페이지 문서가 데이터 교환을 수반할 수 있고, XML 언어를 사용하면 사용자가 태그를 맞춤 설정할 수 있으므로 교환된 두 문서에 동일한 태그가 나타나 충돌이 발생할 수 있습니다. 동일한 태그이므로 교환 문서에 존재할 수 있는 동일한 태그를 구별하려면 네임스페이스가 필요합니다.

XHTML은 HTML에서 XML로 전환하는 언어로서 XML 언어로 사용자 정의 태그를 구현할 수 없으므로 XHMTL 문서의 네임스페이스는 동일합니다.

xmlns는 XHTML입니다. 네임스페이스의 약어는 소위 "네임스페이스"입니다. DOCTYPE 선언과 마찬가지로 xmlns도 선언 유형입니다. HTML 문서에 여전히 존재하는 DOCTYPE 문과 달리 xmlns는 HTML 문서에 존재하지 않습니다. 우리가 일반적으로 보는 xmlns는 XHTML 문서에 나타납니다.

웹 페이지를 만들 때 처음에 DOCTYPE(문서 유형)을 선언하는 것 외에 XHTML 문서인 경우 네임스페이스도 선언해야 하며 세 번째로 선언해야 하는 것은 웹 페이지 문서 유형의 문자 인코딩:

브라우저에서 올바르게 해석되고 W3C에서 확인하려면 모든 XHTML 문서에서 사용된 문자 인코딩을 선언해야 합니다. 웹 문서에서 문자가 왜곡되는 경우는 대부분 잘못된 문자 인코딩으로 인해 발생하는 경우가 많습니다.

utf-8은 유니코드의 가변 길이 인코딩 표현으로, utf-8 문자 인코딩을 사용하는 웹 페이지에서 점점 더 많이 사용되고 있습니다. 다른 지역의 사용자가 동일한 웹 페이지에 액세스할 때 다른 문자 인코딩으로 인해 문자가 왜곡되는 경우가 가장 많습니다.

그런데 국내 대부분의 웹사이트, 특히 대형 포털 사이트를 열면 문자 인코딩에 대한 설명이 utf-8이 아니고 gb2312입니다.

물론 gb2312 외에 gb2312도 있습니다. 또한 gbk 또는 gb18030 인코딩을 사용하는 일부 웹사이트는 중국어 간체 문자 세트에 속합니다. 즉, 컴퓨터에 중국어 간체 문자 집합이 설치되어 있지 않은 경우 문자 인코딩이 gb2312인 중국어 웹 페이지에 액세스하면 문자가 깨져서 표시됩니다.

gb2312 문자 인코딩은 다른 지역의 사용자 액세스로 인해 문자가 깨질 수 있으므로 utf-8을 사용하는 것은 어떨까요?

이유 중 하나는 역사적 이유일 수 있으며, 다른 더 중요한 이유는 두 인코딩의 서로 다른 저장 방법으로 인해 문서 크기가 다르기 때문일 것입니다.

gb2312 문자 인코딩 세트를 사용할 때 한자는 2바이트를 차지하는 반면, UTF-8 인코딩에서 한자가 차지하는 바이트 수는 3바이트이거나 심지어 3바이트를 초과하는 경우가 많습니다. 따라서 동일한 중국어 문서의 경우 gb2312 문자 인코딩을 사용하는 저장 볼륨은 utf-8 인코딩으로 저장된 문서 크기보다 작습니다.

텍스트가 많고 트래픽이 많은 중국 웹사이트의 경우 gb2312로 인코딩된 웹 문서를 사용하면 다운로드 및 전송 시 많은 트래픽을 절약할 수 있습니다. 또한 중국 웹사이트의 사용자 그룹은 기본적으로 잠겨 있습니다. 이것이 바로 많은 웹사이트가 utf-8 인코딩 대신 gb2312 인코딩을 사용하는 이유입니다.

그러나 중국에는 텍스트가 많고 트래픽이 많은 웹사이트가 많지 않습니다. 또한 문자 쌍이 깨져 문제가 발생할 수 있으므로 웹 제작 시 UTF-8 인코딩을 사용하는 것이 좋습니다. 페이지.

물론, 어떤 인코딩을 사용하든 가장 중요한 것은 전체 사이트에서 사용되는 인코딩이 일관되어야 한다는 것입니다.

위의 문자 인코딩 선언 방법 외에도 다른 선언 방법도 볼 수 있습니다.


이런 종류의 선언 이 방법은 이전 버전의 브라우저용입니다. 현재 브라우저가 전반적으로 업데이트되면 이 선언 방법은 더 이상 권장되지 않습니다.

위 내용은 HTML 해석: 네임스페이스 및 문자 인코딩에 대한 자세한 내용은 PHP 중국어 홈페이지(www.php.cn)를 참고해주세요!


성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
이전 기사:HTML 구성 요소 11다음 기사:HTML 구성 요소 11