Java 정규 표현식의 w 및 b에 해당하는 유니코드
Java의 정규식 구현은 유니코드에 대한 지원이 제한되어 있으므로 단어 또는 일치 항목을 일치시키기가 어렵습니다. 단어 경계를 정확하게 지정합니다. 기본 w 및 b 이스케이프는 ASCII 문자에만 해당합니다.
이 문제를 해결하려면 이러한 이스케이프를 다시 작성하고 유니코드 인식 정의로 바꾸는 함수를 사용하는 것이 좋습니다. 이 함수는 다음 14개의 문자 클래스 이스케이프를 다시 작성할 수 있습니다.
\w \W \s \S \v \V \h \H \d \D \b \B \X \R
다시 작성된 이스케이프 정의:
- w: 문자, 숫자 및 특정 구두점 문자를 캡처합니다. (p{L}pMp{Nd}p{Nl}p{Pc}[p{InEnclosedAlphanumerics}&&p;p{So}]])
- W: w와 일치하는 모든 문자를 제외합니다
- s: 유니코드 공백과 일치 ([u0009-u000Du0020u0085u00A0u1680u180Eu2000-u200Au2028u2029u202Fu205Fu3000])
- S: s
- 와 일치하는 모든 문자 제외 v: 유니코드 수직과 일치 공백 ([u000A-u000Du0085u2028u2029])
- V: v와 일치하는 모든 문자를 제외
- h: 유니코드 가로 공백과 일치 ([u0009u0020u00A0u1680u180Eu2000-u200Au202Fu205Fu3000])
- H: h와 일치하는 모든 문자 제외
- d: 유니코드 숫자와 일치 (p{Nd})
- D: d와 일치하는 모든 문자 제외
- b: 유니코드 단어 문자만 고려하여 단어 경계와 일치
- B: 단어 이외의 경계와 일치 유니코드 단어 문자
- X: 확장 문자소 클러스터와 일치
- R: 줄과 일치 유니코드 줄 바꿈을 포함한 나누기
경계 정의:
경계 이스케이프(b 및 B)는 다음 논리를 사용하여 다시 작성할 수 있습니다.
- ㄴ: (?:(?
- B: (?:(?
Java 수정 Java:
이 함수는 원래 토론 스레드에 제공된 코드를 사용하여 Java로 구현할 수 있습니다. 이 코드를 사용하면 정규식 패턴을 다시 작성하여 유니코드 문자를 더 잘 처리할 수 있습니다.
참고:
Java 7에서 Pattern 클래스는 UNICODE_CHARACTER_CLASS 플래그를 도입하여 유니코드 문자 지원을 활성화합니다. 이는 기본적으로 이스케이프됩니다.
위 내용은 \w 및 \b에 대한 Java 정규식의 유니코드 지원을 어떻게 향상시킬 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

이 기사는 카페인 및 구아바 캐시를 사용하여 자바에서 다단계 캐싱을 구현하여 응용 프로그램 성능을 향상시키는 것에 대해 설명합니다. 구성 및 퇴거 정책 관리 Best Pra와 함께 설정, 통합 및 성능 이점을 다룹니다.

Java의 클래스 로딩에는 부트 스트랩, 확장 및 응용 프로그램 클래스 로더가있는 계층 적 시스템을 사용하여 클래스로드, 링크 및 초기화 클래스가 포함됩니다. 학부모 위임 모델은 핵심 클래스가 먼저로드되어 사용자 정의 클래스 LOA에 영향을 미치도록합니다.

이 기사는 Lambda 표현식, 스트림 API, 메소드 참조 및 선택 사항을 사용하여 기능 프로그래밍을 Java에 통합합니다. 간결함과 불변성을 통한 개선 된 코드 가독성 및 유지 관리 가능성과 같은 이점을 강조합니다.

이 기사는 캐싱 및 게으른 하중과 같은 고급 기능을 사용하여 객체 관계 매핑에 JPA를 사용하는 것에 대해 설명합니다. 잠재적 인 함정을 강조하면서 성능을 최적화하기위한 설정, 엔티티 매핑 및 모범 사례를 다룹니다. [159 문자]

이 기사에서는 Java 프로젝트 관리, 구축 자동화 및 종속성 해상도에 Maven 및 Gradle을 사용하여 접근 방식과 최적화 전략을 비교합니다.

이 기사에서는 선택기와 채널을 사용하여 단일 스레드와 효율적으로 처리하기 위해 선택기 및 채널을 사용하여 Java의 NIO API를 설명합니다. 프로세스, 이점 (확장 성, 성능) 및 잠재적 인 함정 (복잡성,

이 기사에서는 Maven 및 Gradle과 같은 도구를 사용하여 적절한 버전 및 종속성 관리로 사용자 정의 Java 라이브러리 (JAR Files)를 작성하고 사용하는 것에 대해 설명합니다.

이 기사는 네트워크 통신을위한 Java의 소켓 API, 클라이언트 서버 설정, 데이터 처리 및 리소스 관리, 오류 처리 및 보안과 같은 중요한 고려 사항에 대해 자세히 설명합니다. 또한 성능 최적화 기술, i


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

SublimeText3 영어 버전
권장 사항: Win 버전, 코드 프롬프트 지원!

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

Atom Editor Mac 버전 다운로드
가장 인기 있는 오픈 소스 편집기

MinGW - Windows용 미니멀리스트 GNU
이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.

Dreamweaver Mac版
시각적 웹 개발 도구
