検索
ホームページバックエンド開発PHPチュートリアルPHP は、わずか 2 行のコードで中国語と英語が混在した文字列インターセプトを簡単に処理できます。

中国語と英語の混合カウントとインターセプトに関して、最初に思い浮かぶのは、ASCII、16 進数、通常のマッチング、ループ カウンティングです。

今日は、PHP の mb 拡張機能を共有して、文字列を簡単に処理する方法を説明します。


まず使用する関数を紹介します:

mb_strwidth($str, $encoding) は文字列の幅を返します

$str 計算される文字列

$encoding utf8、gbk などの使用するエンコーディング

mb_strimwidth($str, $start, $width, $tail, $encoding) は文字列を幅でインターセプトします

$str インターセプトされる文字列

$start インターセプトを開始する位置、デフォルトは 0 です

$width インターセプトされる幅

$tail はインターセプトされた文字列の後の文字列に追加されます。一般的に使用されるのは...

$encoding 使用するエンコーディング


以下に例を示します:

  1. /**
  2. * utf8 エンコード形式
  3. * 1 つの漢字は 3 バイトを占有します
  4. * 1 つの漢字が 2 バイトを占有することを望みます、
  5. * 幅の観点から、2 つの英語文字が占める位置は 1 つの中国語文字に相当するため
  6. */
  7. // テスト文字列
  8. $str = 'aaaaahahaaaaahahahaaa';
  9. echo strlen($str) // 25 バイトを出力する場合のみ strlen を使用します
  10. // エンコーディングを指定する必要があります。指定しない場合、PHP の内部コード mb_internal_encoding() が内部コードの表示に使用されます
  11. // mb_strwidth を使用して幅 20 の文字列を出力し、utf8 エンコーディングを使用します
  12. echo mb_strwidth($ str, 'utf8 ');
  13. // 幅が 10 より大きい場合のみインターセプトします
  14. if(mb_strwidth($str, 'utf8')>10){
  15. // 0 からインターセプトするように設定し、10 回追加します ..., utf8 エンコーディングを使用します
  16. // 追加された... も長さに計算されることに注意してください
  17. $str = mb_strimwidth($str, 0, 10, '...', 'utf8');
  18. }
  19. //最後に aaaa を出力します... a が 4 つで 1 が 4 つとして数えられ、2 つで 3 点として数えられ、3 つで 4+2+3=9 として数えられます
  20. // とても単純ではないですかという人もいますが、なぜですか? 10ではなく9ですか?
  21. // 「ああ」の後に「ああ」が続くため、中国語のカウントは 2、9+2=11 が設定を超えているため、1 を削除すると 9 になります
  22. echo $str;
コードをコピー


その他の機能を以下にいくつか紹介しましょう:

mb_strlen($str, $encoding) は文字列の長さを返します

$str 計算される文字列

$encoding 使用されるエンコーディング

mb_substr($str, $start, $length, $encoding) は文字列をインターセプトします

$str インターセプトされる文字列

$start どこからインターセプトを開始するか

$length インターセプトする長さ

$encoding 使用されるエンコーディング

実際、これら 2 つの関数は strlen() と substr() に非常に似ています。唯一の違いは、エンコーディングを設定できることです。


以下の例:

    /**
  1. * utf8 エンコード形式
  2. * 1 中国語は 3 バイトを占有します
  3. */
  4. $str = 'aa12ahaa';
  5. echo strlen($str); // 直接出力の長さは 9
  6. // 出力の長さは 7 ですが、なぜですか7ですか?
  7. // ここでエンコードを設定すると、中国語でも英語でも、それぞれの長さは 1 になることに注意してください
  8. // a a 1 2 ah a a
  9. // 1+1+1+1+1+1+1 = 7
  10. // ちょうど 7 文字ですか?
  11. echo mb_strlen($str, 'utf8');
  12. // mb_substr にも同じことが当てはまります
  13. // 今必要なのは 5 文字だけです
  14. echo mb_substr($str, 0, 5) , 'utf8') // aa12を出力
コードをコピー


実際、mb 拡張子には便利な関数がたくさんあるので、ここではすべてをリストすることはしません。

興味のある友達は公式マニュアルをチェックしてください

http://www.php.net/manual/zh/ref.mbstring.php

さて、今日はここまでです。


声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
負荷分散がセッション管理にどのように影響し、それに対処するかを説明します。負荷分散がセッション管理にどのように影響し、それに対処するかを説明します。Apr 29, 2025 am 12:42 AM

負荷分散はセッション管理に影響しますが、セッションの複製、セッションの粘着性、集中セッションストレージで解決できます。 1。セッションレプリケーションサーバー間のセッションデータをコピーします。 2。セッションスティンネスは、ユーザーリクエストを同じサーバーに指示します。 3.集中セッションストレージは、Redisなどの独立したサーバーを使用してセッションデータを保存してデータ共有を確保します。

セッションロックの概念を説明します。セッションロックの概念を説明します。Apr 29, 2025 am 12:39 AM

SESSIONLOCKINGISATECHNIQUESTOESUREAUSER'SSESSIONREMAINSEXCLUSIVETOONEUSATIME.ITISCRUCIALFORPREVENTINGDATACORTIONANDSECURITYBREACHESINMULTI-USERAPPLICATIONS.SESSIONLOCKINGISISIMPLEMENTEDUSINGSINGSINGSINGSINGSINGSINGSINGSINGSINGSINGSINGSINGSINGSINGSINGSINGSINGSINGSINGSINGSINGROCKINGSMECHANISMなど

PHPセッションの選択肢はありますか?PHPセッションの選択肢はありますか?Apr 29, 2025 am 12:36 AM

PHPセッションの代替品には、Cookie、トークンベースの認証、データベースベースのセッション、Redis/Memcachedが含まれます。 1.Cookiesは、クライアントにデータを保存することによりセッションを管理します。 2.トークンベースの認証はトークンを使用してユーザーを検証します。これは非常に安全ですが、追加のロジックが必要です。 3.Databaseベースのセッションは、データベースにデータを保存します。これは、スケーラビリティが良好ですが、パフォーマンスに影響を与える可能性があります。 4. Redis/Memcachedは分散キャッシュを使用してパフォーマンスとスケーラビリティを向上させますが、追加のマッチングが必要です

PHPのコンテキストで「セッションハイジャック」という用語を定義します。PHPのコンテキストで「セッションハイジャック」という用語を定義します。Apr 29, 2025 am 12:33 AM

SessionHijackingとは、ユーザーのSessionIDを取得してユーザーになりすましている攻撃者を指します。予防方法には、次のものが含まれます。1)HTTPSを使用した通信の暗号化。 2)SessionIDのソースの検証。 3)安全なSessionID生成アルゴリズムの使用。 4)SessionIDを定期的に更新します。

PHPの完全な形式は何ですか?PHPの完全な形式は何ですか?Apr 28, 2025 pm 04:58 PM

この記事では、PHPについて説明し、その完全なフォーム、Web開発での主要な使用、PythonとJavaとの比較、および初心者の学習のしやすさについて説明します。

PHPはフォームデータをどのように処理しますか?PHPはフォームデータをどのように処理しますか?Apr 28, 2025 pm 04:57 PM

PHPは、$ \ _ postおよび$ \ _を使用してフォームデータを処理し、検証、消毒、安全なデータベースインタラクションを通じてセキュリティを確保します。

PHPとASP.NETの違いは何ですか?PHPとASP.NETの違いは何ですか?Apr 28, 2025 pm 04:56 PM

この記事では、PHPとASP.NETを比較して、大規模なWebアプリケーション、パフォーマンスの違い、セキュリティ機能への適合性に焦点を当てています。どちらも大規模なプロジェクトでは実行可能ですが、PHPはオープンソースであり、プラットフォームに依存しませんが、ASP.NET、

PHPはケースに敏感な言語ですか?PHPはケースに敏感な言語ですか?Apr 28, 2025 pm 04:55 PM

PHPの症例感度は変化します:関数は鈍感であり、変数とクラスは感度があります。ベストプラクティスには、一貫した命名と、比較のためにケース非感受性関数を使用することが含まれます。

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

SublimeText3 英語版

SublimeText3 英語版

推奨: Win バージョン、コードプロンプトをサポート!

SublimeText3 Linux 新バージョン

SublimeText3 Linux 新バージョン

SublimeText3 Linux 最新バージョン

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

AtomエディタMac版ダウンロード

AtomエディタMac版ダウンロード

最も人気のあるオープンソースエディター