PHP_PHP チュートリアルで正規表現を使用して中国語の実装ノートを抽出する-PHPチュートリアル-php.cn

ホームページ

バックエンド開発

PHPチュートリアル

PHP_PHP チュートリアルで正規表現を使用して中国語の実装ノートを抽出する

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jul 13, 2016 am 10:01 AM

php中国語使用成し遂げる抽出する通常ノート表現

正規表現を使用して PHP で中国語の実装ノートを抽出する

この記事では、主に PHP で中国語の実装ノートを抽出するための正規表現の使用について紹介し、韓国語と日本語の正規表現についても説明し、実装コードも示します。使用例、困っている友達は参考にしてください

最近、上司からデータ重複チェックの小さな演習を依頼されました。これには、中国語フィールドを含むファイルから中国語フィールドを抽出して保存し、PHP を使用して開発することが含まれます。真ん中は、PHP の正規表現の中国語のマッチングの問題です。インターネットでいろいろ調べましたが、これも非常にわかりにくく、正確な情報がありませんでした。自分のコードを修正してテストした後、最初に抽出関数を書き留めました。

最初に注意すべきことは、全角文字のエンコーディングの問題です。ここでは、将来、中国語と同じ意味の韓国語や日本語などのエンコーディングの問題も発生する可能性があります。

1.GBK(GB2312/GB18030)

コードは次のとおりです:

x00-xff GBK 2 バイトエンコード範囲
x20-x7f アスキー
xa1-xff 中国語 gb2312
x80-xff 中国の GBK
2. UTF-8 (ユニコード)

コードは次のとおりです:

u4e00-u9fa5 (中国語)
x3130-x318F (韓国語
) xAC00-xD7A3 (韓国語)
u0800-u4e00 (日本語)

Notepad++ では、まず通常の書き込みが間違っているかどうかをテストできます。最初の式をテストするために [u4e00-u9fa5]+ を使用しました。+ 記号は複数の

を示します。

PHP中使用正则表达式提取中文实现笔记帮客之家

一致記号。結果は期待どおりです。では、この通常のルールをスクリプトで使用できますか?

テストしてみましょう。preg_match_all('/[u4e00-u9fa5]+/', $subject,$matches) 呼び出しを使用すると、次の結果が表示されます: Compilation failed: PCRE doesn't support L, l, N{ name} 、U、またはオフセット 2 の u。。。。とても大きくないですか？ ?その理由は何でしょうか?

多くの情報を調べた結果、u (PCRE_UTF8) は上記の PCRE であることがわかりました。これは Perl 互換の正規表現ライブラリを含む Perl ライブラリです。この修飾子は、Perl と互換性のない PCRE の追加機能を有効にします。パターン文字列は UTF-8 として扱われます。この修飾子は、Unix では PHP 4.1.0 以降、win32 では PHP 4.2.3 以降で使用できます。 PHP 正規表現には、16 進数データを表現するさまざまな方法もあります。PHP では、16 進数データを表すために x が使用されます。次に、コードを最適化すると、検出関数は次のようになります:

コードは次のとおりです:

クラスstoreDataAdapterはStoreを拡張します{
プライベート $dsData
/**
* データ変換関数。preg_match_all を呼び出して、$pattern の規則性に基づいて数値マッチングを実行し、返された結果を配列の形式で $matches に保存します。
* $matches[0] にはパターン全体に一致するテキストが含まれ、$matches[1] には最初にキャプチャされた括弧内のサブパターンに一致するテキストが含まれます。以下同様です
* @Store::data_convert() を参照
*/
パブリック関数 data_convert($pattern,$subject) {
$matches=array(); if (preg_match_all($pattern, $subject,$matches)){
$matches[0] を返します
}その他
{
null を返す
}
}
}

呼び出すと、次のようになります:

コードは次のとおりです:

$store=新しいstoreDataAdapter($txtContent); $match=配列(); $dsName=$store->data_convert(‘/[x7f-xff]+/’,$txtContent); foreach ($dsName として $val){
echo $val."
"; }

入力ファイルは次のとおりです:

、中国語を抽出した後の出力ファイルの内容は次のとおりです:

、予想されるニーズに沿ったもの。

http://www.bkjia.com/PHPjc/971941.htmlwww.bkjia.com

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

スカラータイプ、リターンタイプ、ユニオンタイプ、ヌル可能なタイプなど、PHPタイプのヒントはどのように機能しますか？Apr 17, 2025 am 12:25 AM

PHPタイプは、コードの品質と読みやすさを向上させるためのプロンプトがあります。 1）スカラータイプのヒント：php7.0であるため、基本データ型は、int、floatなどの関数パラメーターで指定できます。 3）ユニオンタイプのプロンプト：PHP8.0であるため、関数パラメーターまたは戻り値で複数のタイプを指定することができます。 4）Nullable Typeプロンプト：null値を含めることができ、null値を返す可能性のある機能を処理できます。

PHPは、オブジェクトのクローニング（クローンキーワード）と__Clone Magicメソッドをどのように処理しますか？Apr 17, 2025 am 12:24 AM

PHPでは、クローンキーワードを使用してオブジェクトのコピーを作成し、\ _ \ _クローンマジックメソッドを使用してクローン動作をカスタマイズします。 1.クローンキーワードを使用して浅いコピーを作成し、オブジェクトのプロパティをクローン化しますが、オブジェクトのプロパティはクローニングしません。 2。\ _ \ _クローン法は、浅いコピーの問題を避けるために、ネストされたオブジェクトを深くコピーできます。 3.クローニングにおける円形の参照とパフォーマンスの問題を避けるために注意し、クローニング操作を最適化して効率を向上させます。

PHP対Python：ユースケースとアプリケーションApr 17, 2025 am 12:23 AM

PHPはWeb開発およびコンテンツ管理システムに適しており、Pythonはデータサイエンス、機械学習、自動化スクリプトに適しています。 1.PHPは、高速でスケーラブルなWebサイトとアプリケーションの構築においてうまく機能し、WordPressなどのCMSで一般的に使用されます。 2。Pythonは、NumpyやTensorflowなどの豊富なライブラリを使用して、データサイエンスと機械学習の分野で驚くほどパフォーマンスを発揮しています。

さまざまなHTTPキャッシングヘッダー（例：キャッシュコントロール、ETAG、ラスト変更）を説明してください。Apr 17, 2025 am 12:22 AM

HTTPキャッシュヘッダーの主要なプレーヤーには、キャッシュコントロール、ETAG、およびラスト修飾が含まれます。 1.Cache-Controlは、キャッシュポリシーを制御するために使用されます。例：キャッシュコントロール：Max-Age = 3600、public。 2。ETAGは、一意の識別子を介してリソースの変更を検証します。例：ETAG： "686897696A7C876B7E"。 3. Last-Modifiedは、リソースの最後の変更時間を示しています。

PHPでの安全なパスワードハッシュ（例：Password_hash、password_verify）を説明します。 MD5またはSHA1を使用してみませんか？Apr 17, 2025 am 12:06 AM

PHPでは、Password_hashとpassword_verify関数を使用して安全なパスワードハッシュを実装する必要があり、MD5またはSHA1を使用しないでください。 1）password_hashセキュリティを強化するために、塩値を含むハッシュを生成します。 2）password_verifyハッシュ値を比較して、パスワードを確認し、セキュリティを確保します。 3）MD5とSHA1は脆弱であり、塩の値が不足しており、最新のパスワードセキュリティには適していません。

PHP：サーバー側のスクリプト言語の紹介Apr 16, 2025 am 12:18 AM

PHPは、動的なWeb開発およびサーバー側のアプリケーションに使用されるサーバー側のスクリプト言語です。 1.PHPは、編集を必要とせず、迅速な発展に適した解釈言語です。 2。PHPコードはHTMLに組み込まれているため、Webページの開発が簡単になりました。 3。PHPプロセスサーバー側のロジック、HTML出力を生成し、ユーザーの相互作用とデータ処理をサポートします。 4。PHPは、データベースと対話し、プロセスフォームの送信、サーバー側のタスクを実行できます。

PHPとWeb：その長期的な影響を調査しますApr 16, 2025 am 12:17 AM

PHPは過去数十年にわたってネットワークを形成しており、Web開発において重要な役割を果たし続けます。 1）PHPは1994年に発信され、MySQLとのシームレスな統合により、開発者にとって最初の選択肢となっています。 2）コア関数には、動的なコンテンツの生成とデータベースとの統合が含まれ、ウェブサイトをリアルタイムで更新し、パーソナライズされた方法で表示できるようにします。 3）PHPの幅広いアプリケーションとエコシステムは、長期的な影響を促進していますが、バージョンの更新とセキュリティの課題にも直面しています。 4）PHP7のリリースなど、近年のパフォーマンスの改善により、現代の言語と競合できるようになりました。 5）将来的には、PHPはコンテナ化やマイクロサービスなどの新しい課題に対処する必要がありますが、その柔軟性とアクティブなコミュニティにより適応性があります。

なぜPHPを使用するのですか？利点と利点が説明されましたApr 16, 2025 am 12:16 AM

PHPの中心的な利点には、学習の容易さ、強力なWeb開発サポート、豊富なライブラリとフレームワーク、高性能とスケーラビリティ、クロスプラットフォームの互換性、費用対効果が含まれます。 1）初心者に適した学習と使用が簡単。 2）Webサーバーとの適切な統合および複数のデータベースをサポートします。 3）Laravelなどの強力なフレームワークを持っています。 4）最適化を通じて高性能を達成できます。 5）複数のオペレーティングシステムをサポートします。 6）開発コストを削減するためのオープンソース。

See all articles