Java 正規表現の w および b に相当する Unicode
Java の正規表現実装では Unicode のサポートが制限されているため、単語または単語の境界を正確に検出します。デフォルトの w および b エスケープは、ASCII 文字にのみ対応します。
この問題に対処するには、これらのエスケープを書き換えて Unicode 対応の定義に置き換える関数の使用を検討してください。この関数は、次の 14 の charclass エスケープを書き換えることができます:
\w \W \s \S \v \V \h \H \d \D \b \B \X \R
書き換えられたエスケープ定義:
- w: 文字、数字、および特定の句読点文字をキャプチャします。 (p{L}pMp{Nd}p{Nl}p{Pc}[p{InEnclosedAlphanumerics}&&p{So}]])
- W: w に一致するすべての文字を除外します
- s: Unicode の空白と一致します([u0009-u000Du0020u0085u00A0u1680u180Eu2000-u200Au2028u2029u202Fu205Fu3000])
- S: s に一致するすべての文字を除外します
- v: Unicode 垂直方向に一致します空白 ([u000A-u000Du0085u2028u2029])
- V: v に一致するすべての文字を除外します
- h: Unicode の水平空白と一致します([u0009u0020u00A0u1680u180Eu2000-u200Au202Fu205Fu3000])
- H: h に一致するすべての文字を除外します
- d: Unicode 数字 (p{Nd}) に一致します
- D: d に一致するすべての文字を除外します
- b: Unicode 単語文字のみを考慮して単語境界と一致します
- B: Unicode 単語文字を考慮して非単語境界と一致します
- X: 拡張書記素と一致しますクラスタ
- R: Unicode 行を含む改行と一致します。 Break
境界定義:
境界エスケープ (b および B) は、次のロジックを使用して書き換えることができます:
- b : (?:(?
- B: (?:(?
による Java の修正Java:
この関数は、元のディスカッション スレッドで提供されたコードを使用して Java で実装できます。このコードを使用すると、正規表現パターンを書き換えて Unicode 文字をより適切に処理できます。
注:
Java 7 では、パターン クラスに UNICODE_CHARACTER_CLASS フラグが導入され、これにより、Unicode 文字の Unicode サポートが有効になります。これらはデフォルトでエスケープされます。
以上が\w および \b の Java 正規表現における Unicode サポートを改善するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

この記事では、カフェインとグアバキャッシュを使用してJavaでマルチレベルキャッシュを実装してアプリケーションのパフォーマンスを向上させています。セットアップ、統合、パフォーマンスの利点をカバーし、構成と立ち退きポリシー管理Best Pra

Javaのクラスロードには、ブートストラップ、拡張機能、およびアプリケーションクラスローダーを備えた階層システムを使用して、クラスの読み込み、リンク、および初期化が含まれます。親の委任モデルは、コアクラスが最初にロードされ、カスタムクラスのLOAに影響を与えることを保証します

この記事では、Lambda式、Streams API、メソッド参照、およびオプションを使用して、機能プログラミングをJavaに統合することを調べます。 それは、簡潔さと不変性を通じてコードの読みやすさと保守性の改善などの利点を強調しています

この記事では、キャッシュや怠zyなロードなどの高度な機能を備えたオブジェクトリレーショナルマッピングにJPAを使用することについて説明します。潜在的な落とし穴を強調しながら、パフォーマンスを最適化するためのセットアップ、エンティティマッピング、およびベストプラクティスをカバーしています。[159文字]

この記事では、Javaプロジェクト管理、自動化の構築、依存関係の解像度にMavenとGradleを使用して、アプローチと最適化戦略を比較して説明します。

この記事では、単一のスレッドで複数の接続を効率的に処理するためにセレクターとチャネルを使用して、非ブロッキングI/O用のJavaのNIO APIについて説明します。 プロセス、利点(スケーラビリティ、パフォーマンス)、および潜在的な落とし穴(複雑さ、

この記事では、MavenやGradleなどのツールを使用して、適切なバージョン化と依存関係管理を使用して、カスタムJavaライブラリ(JARファイル)の作成と使用について説明します。

この記事では、ネットワーク通信のためのJavaのソケットAPI、クライアントサーバーのセットアップ、データ処理、リソース管理、エラー処理、セキュリティなどの重要な考慮事項をカバーしています。 また、パフォーマンスの最適化手法も調査します


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

SublimeText3 中国語版
中国語版、とても使いやすい

MinGW - Minimalist GNU for Windows
このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

SAP NetWeaver Server Adapter for Eclipse
Eclipse を SAP NetWeaver アプリケーション サーバーと統合します。

メモ帳++7.3.1
使いやすく無料のコードエディター

mPDF
mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。

ホットトピック



