中国語の文字または混合文字の長さを返す方法を学習する PHP 文字列-PHPの問題-php.cn

ホームページ

バックエンド開発

PHPの問題

中国語の文字または混合文字の長さを返す方法を学習する PHP 文字列

青灯夜游

Aug 09, 2021 pm 05:28 PM

php弦漢字

前回の記事「PHPは特定の長さの部分文字列を*記号に変える方法」では、特定の長さの部分文字列を*記号に置換する方法である文字列置換を紹介しました。今回は文字列の理解の続きとして、中国語の文字列の長さ、または中国語と英語が混在した文字列の長さを計算する方法を紹介します。

中国語の文字列の長さを計算するにはどうすればよいですか?この問題に関して、最初に strlen() 関数を使用することになるかもしれませんが、strlen() 関数はすべて英語の文字列の処理には適していますが、中国語と英語が混在した文字列や純粋な中国語の文字列の場合は機能しません。。次の例を見てみましょう:

<?php
header("Content-type:text/html;charset=utf-8");  //设置字符编码为utf-8
$str = "欢迎来到PHP中文网！";
echo &#39;字符串 “&#39;.$str.&#39;” 的长度为：&#39;.strlen($str).&#39;<br>&#39;;
?>

出力結果は次のとおりです:

中国語の文字または混合文字の長さを返す方法を学習する PHP 文字列

次の理由により、strlen() 関数は正確ではないことがわかります。文字処理の異なるルールに従う中国語と英語が混在した文字列、または純粋な中国語の文字列の長さを返します。では、なぜ 27 が返されるのでしょうか?

これは、使用する文字エンコーディングが utf-8 であり、UTF-8 エンコーディングでは中国語の文字が 3 バイトを占めるためです。

strlen() 関数 ASCII コードでは、1 つの中国語文字は 2 バイトのスペースを占めます。UTF-8 エンコードでは、1 つの中国語文字 (繁体字中国語を含む) は 3 バイトに相当します。Unicode では、エンコード中です。、中国語 (繁体字を含む) 1 文字は 2 バイトに相当します。

上記の例では、文字列「PHP 中国語 Web サイトへようこそ!」の 1 つに、8 つの中国語文字と 3 つの英語文字が含まれており、その後、8 *3 3 となります。 =27 バイトの場合、文字列の長さは 27 になります。

しかし、そのような文字列の長さは私たちが望むものではありません。中国語の文字を処理し、中国語と英語が混在した文字列、または純粋な中国語の文字列の長さを正確に計算するにはどうすればよいでしょうか?

PHP は、この問題を解決するための関数、mb_strlen() 関数 を提供します。

引き続き前の例ですが、今回は mb_strlen() 関数を使用して文字列の長さを計算します:

<?php
header("Content-type:text/html;charset=utf-8");
$str = "欢迎来到PHP中文网！";
echo &#39;字符串 “&#39;.$str.&#39;” 的长度为：&#39;.mb_strlen($str,&#39;utf-8&#39;).&#39;<br>&#39;;
?>

出力結果は次のとおりです:

中国語の文字または混合文字の長さを返す方法を学習する PHP 文字列

文字列 $str には中国語と英語の感嘆符が 11 個あり、出力結果も 11 であることがわかります。ちなみに、私は適切な人を見つけました~

mb_strlen()関数は、漢字でも英語でも、数字、小数点、下線、スペースを1バイトしか消費しません。

mb_strlen() 関数を簡単に見てみましょう。

mb_strlen($string,$encoding)この関数は、文字エンコーディングを設定することで、対応する文字数を返すことができます。この関数は、必須パラメータ $string (必要な文字列) を受け取ります。検出された) および a 省略されたパラメータ $encoding (文字エンコーディング)。省略された場合、内部文字エンコーディングが使用されます。

対応する $encoding パラメータを設定することで、中国語の文字列の長さの問題を適切に処理できます。

わかりました。これですべてです。他に知りたいことがある場合は、これをクリックしてください。 → →php ビデオチュートリアル

最後に、古典的なコース「PHP 文字列処理 (翡翠少女般若心経編)」を読むことをお勧めします。無料です。ぜひ学んでください。！

以上が中国語の文字または混合文字の長さを返す方法を学習する PHP 文字列の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

酸とベースデータベース：違いとそれぞれを使用するタイミング。Mar 26, 2025 pm 04:19 PM

この記事では、酸とベースのデータベースモデルを比較し、その特性と適切なユースケースを詳述しています。酸は、財務およびeコマースアプリケーションに適したデータの整合性と一貫性を優先し、ベースは可用性に焦点を当て、

PHPセキュアファイルアップロード：ファイル関連の脆弱性の防止。Mar 26, 2025 pm 04:18 PM

この記事では、コードインジェクションのような脆弱性を防ぐために、PHPファイルのアップロードを確保することについて説明します。ファイルタイプの検証、セキュアストレージ、およびアプリケーションセキュリティを強化するエラー処理に焦点を当てています。

PHP入力検証：ベストプラクティス。Mar 26, 2025 pm 04:17 PM

記事では、組み込み関数、ホワイトリストアプローチ、サーバー側の検証などの手法に焦点を当てたセキュリティを強化するためのPHP入力検証のベストプラクティスについて説明します。

PHP APIレート制限：実装戦略。Mar 26, 2025 pm 04:16 PM

この記事では、Token BucketやLeaky BucketなどのアルゴリズムやSymfony/Rate-Limiterなどのライブラリを使用するなど、PHPでAPIレート制限を実装するための戦略について説明します。また、監視、動的に調整されたレートの制限、および手をカバーします

PHPパスワードハッシュ：password_hashおよびpassword_verify。Mar 26, 2025 pm 04:15 PM

この記事では、パスワードを保護するためにPHPでpassword_hashとpassword_verifyを使用することの利点について説明します。主な議論は、これらの関数が自動塩の生成、強力なハッシュアルゴリズム、およびSecurを通じてパスワード保護を強化するということです

OWASPトップ10 PHP：共通の脆弱性を説明し、軽減します。Mar 26, 2025 pm 04:13 PM

この記事では、PHPおよび緩和戦略におけるOWASPトップ10の脆弱性について説明します。重要な問題には、PHPアプリケーションを監視および保護するための推奨ツールを備えたインジェクション、認証の壊れ、XSSが含まれます。

PHP XSS予防：XSSから保護する方法。Mar 26, 2025 pm 04:12 PM

この記事では、PHPでのXSS攻撃を防ぐための戦略について説明し、入力の消毒、出力エンコード、セキュリティを向上させるライブラリとフレームワークの使用に焦点を当てています。

PHPインターフェイスvs抽象クラス：それぞれを使用する時期。Mar 26, 2025 pm 04:11 PM

この記事では、PHPでのインターフェイスと抽象クラスの使用について説明し、それぞれをいつ使用するかに焦点を当てています。インターフェイスは、無関係なクラスや複数の継承に適した、実装なしで契約を定義します。抽象クラスは共通の機能を提供します

See all articles

ホットAIツール

ホットツール

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。