집 >백엔드 개발 >XML/RSS 튜토리얼 >XML 시작에 관해 자주 묻는 질문(3)
외국어, 특수문자가 포함된 문서는 어떻게 불러오나요?
문서에는 다음과 같은 외국 문자가 포함될 수 있습니다.
외국 문자(úóí?)
예를 들어, 磲와 같은 외국 문자는 다음과 같아야 합니다. 이스케이프 시퀀스가 앞에 옵니다. 외국 문자는 UTF-8로 인코딩되거나 다음과 같이 다른 인코딩으로 지정할 수 있습니다.
외국 문자(磲)
이제 xml이 올바르게 로드됩니다.
다른 문자는 XML에 예약되어 있으므로 다르게 처리해야 합니다. 다음 XML:
This & that
은 다음 오류를 생성합니다.
여기에는 공백이 허용되지 않습니다.
행 0000001: 이것과 저것
위치 0000012: ----------^
여기서 &는 방금 배치된 경우 XML 구문 구조의 일부입니다. XML 데이터 소스 내에서는 &로 해석될 수 없습니다. "엔티티"라는 특수 문자 시퀀스를 바꿔야 합니다.
This & that
다음 문자에는 해당 엔터티가 필요합니다.
< <
& &
> >
따옴표 문자는 마크업에서 속성 값에 대한 구분 기호로 사용되므로 일반적으로 속성 값 내에서 사용할 수 없습니다. 예를 들어 다음은 오류를 반환합니다.
여기서 작은따옴표는 속성 구분 기호와 속성 값 자체 내에서 모두 사용됩니다. 이 문제를 해결하려면 속성 구분 기호를 큰따옴표로 변경할 수 있습니다.
" 엔터티를 사용할 수 있습니다.
CDATA 섹션에 텍스트를 배치하여 요소 콘텐츠의 특수 문자를 처리할 수도 있습니다. 올바른 내용은 다음과 같습니다.
예를 들어, XML 개체 모델은 CDATA 노드를 xml 노드의 하위 노드로 표시하고
as nodeValue > 문자열을 반환합니다. Visual Studio 6.0 C++의 COM 구성 요소
Visual C++ 6.0에서 MSXML COM 구성 요소를 사용하는 가장 쉬운 방법은 #import 지시문을 사용하는 것입니다.
모든 IXML* 인터페이스와 인터페이스 ID를 정의하여 응용 프로그램에서 사용할 수 있도록 합니다. INETSDK(영어) 및 uuid.lib에서 MSXML 형식 라이브러리와 헤더 파일을 가져올 수도 있습니다. 클래스 IID가 포함되어 있습니다.
다음 XML에는 HTML 엔터티가 포함되어 있습니다.
Copyright? 2000, Microsoft Inc, All Rights Reserved.
정의되지 않은 엔터티 '복사본'에 대한 참조 줄: 1, 위치: 23, 오류 코드: 0xC00CE002
Copyright ? 2000, ...
Copyright ? 2000, Microsoft Inc, All Rights Reserved
IXMLDOMDocument 인터페이스의 verifyOnParse 속성을 해제합니다. 유효성 검사기 테스트 페이지에 붙여넣고 DTD 유효성 검사를 끈 다음 유효성 검사를 클릭하세요. 문서가 로드되고 유효성 검사기 페이지 끝에 있는 DOM 트리에 저작권 문자가 표시됩니다.
%HTMLENT;
% HTMLENT;
속성 동작
Data NodeValue와 동일
Text 지정된 하위 트리의 여러 TEXT 및 CDATA 노드를 반복적으로 연결하고 결합된 결과를 반환합니다.
참고: 공백 문자에는 새 줄, 탭 및 공백이 포함됩니다.
nodeValue 속성은 일반적으로 문서가 로드된 방식과 현재 xml:space 범위에 관계없이 원본 문서의 콘텐츠를 반환합니다.
text 속성은 지정된 하위 트리의 모든 텍스트를 연결하고 엔터티를 확장합니다. 이는 문서가 로드되는 방식, PReserveWhiteSpace 스위치의 현재 상태 및 현재 xml:space 범위와 관련이 있습니다. 아래를 참조하세요.
PRESERVEWHITESPACE = TRUE 문서가 로드될 때
PreserVewhiteSpace = True PreservedSpace = True PreservewhiteSpace = FA LSE PRESERVEWHITESPACE = FALSE
XML: Space = XML 유지: Space = DEFAULT XML : space=preserve 🎜>preserveWhiteSpace=true PreserveWhiteSpace=true PreserveWhiteSpace=false
xml:space=preserve xml:space=default xml:space=preserve xml:space=default
절반 예약됨 세미 -reserved And truncate Half-preserved Half-preserved and truncated
예약된 "nt JanentSmith n"
예약되고 잘린 "JanentSmith"
예약됨 " Jane Smith "
CDATA 및 xml:space="preserve" 하위 트리 경계
아래 예에서 CDATA 노드 또는 "preserve" 노드의 콘텐츠는 중요하지 않은 공백 문자의 정규화에 참여하지 않기 때문에 연결됩니다. 예:
n
t Smith ]>n
이 경우 CDATA 노드 내부의 공백 문자는 no입니다. "중요하지 않은" 공백 문자와 더 긴 "병합"을 수행하고 잘리지 않습니다. 따라서 "절반 보존 및 잘림" 사례는 다음을 반환합니다. 콘텐츠가 관련이 없습니다. CDATA를 다음으로 바꾸면 동일한 결과가 반환됩니다.
Smith
엔터티는 특별합니다.
Jane n
tn
]>
태그 범위), 엔터티를 구문 분석할 때 중요하지 않은 공백 문자는 손실됩니다. 트리는 like:
ENTITY: Jane
ELEMENT: 직원
TEXT: Jane
ELEMENT: titleTEXT>:Software Design Engineer
ELEMENT: foo ATTRIBUTE: xml:space="preserve" > ENTITYREF: Jane
DOCTYPE 내부의 ENTITY 노드 아래에 노출된 DOM 트리에는 다음이 포함되지 않습니다. 모든 WHITESPACE 노드. 이는 엔터티 참조가 xml에 있더라도 ENTITYREF 노드의 하위 노드에 WHITESPACE 노드가 없음을 의미합니다. ENTITY의 각 인스턴스에도 마찬가지입니다. 특정 문서에서 참조되는 항목은 일반적으로 동일한 트리를 갖습니다. 엔터티가 공백 문자를 절대적으로 유지해야 하는 경우 내부적으로 자체 xml:space 속성을 지정하거나 문서 presentsWhiteSpace 스위치를 true로 설정해야 합니다.
속성에 액세스하는 방법에는 여러 가지가 있습니다. IXMLDOMAttribute 인터페이스에는 Microsoft 확장과 같은 nodeValue 속성이 반환됩니다. 속성에서 반환한 텍스트입니다.
attrNode.nodeValue
attrNode.value
getAttribute("name")는 원본 문서와 정확히 동일한 콘텐츠(및 확장 엔터티)를 반환합니다.
attrNode.nodeTypedValue Null
attrNode.text는 앞뒤 공백 문자가 잘린 점을 제외하면 nodeValue와 동일합니다.
"XML 언어" 사양은 XML 애플리케이션에 대한 다음 동작을 정의합니다. 속성 유형
CDATA ID, IDREF, IDREFS, ENTITY, ENTITIES, NOTATION, Enumeration