P粉3230507802023-09-03 16:42:37
당신이 게시한 것만큼 손상된 문서를 저장할 수 있는 합리적인 방법은 없지만 텍스트에 >
和类似字符替换为其相关实体,例如: > ;
를 입력한다고 가정하면 승인하려는 문서를 DomDocument 와 같은 적절한 라이브러리에 넣어서 처리할 수 있습니다. 나머지.
출력:
으아악P粉0644484492023-09-03 11:17:47
이 정규식도 작동합니다:
HTML 태그의 유효한 부분을 4개 부분으로 나누고 나머지 부분(공백)을 해당 부분으로 대체합니다.
/(<)s*(/?)s*([^<>]*S)s*(>)/g
(<)
- 여는 꺾쇠 괄호 캡처(섹션 1) s*
- 모든 공백과 일치 (/?)
- 선택적 백슬래시 캡처(2부) s*
- 백슬래시 뒤의 모든 공백과 일치합니다. ([^<>]*S)
- 후행 공백 없이 태그 내 콘텐츠 캡처(섹션 3) s*
- 콘텐츠 뒤와 오른쪽 꺾쇠괄호 앞의 공백과 일치합니다(>)
- 오른쪽 꺾쇠괄호 캡처(섹션 4)