検索
ホームページバックエンド開発PHPチュートリアルPHP substr が文字列をインターセプトするときに発生する中国語文字化けの問題を解決する

PHP プログラムの開発では、文字列のインターセプト操作が頻繁に実行されます。たとえば、情報リストを出力する場合、タイトルが長すぎないようにする必要があります。また、一連の文字列インターセプト操作も実行する必要があります。こうしたニーズに遭遇したとき、私たちはそれを実現するために substr() メソッドを使用することをよく考えます。 substr は中国語で文字化けします。中国語の UTF-8 エンコーディングのため、GB2312 は 2 バイトを占有し、英語は 1 バイトを占有します。substr() は中国語を突然「認識」します。文字. " を半分にすると、壊れた文字が後続の .. をまとめて 1 つの単語を作成するため、PHP substr 中国語の文字化けが発生します。

substr --- 文字列の一部を取得します


構文: string substr (string string, int start [, int length])

説明:

substr() は、パラメータ start とパラメータによって渡された文字列の一部を返します。長さが指定されています。
start が正の数の場合、返される文字列は string の開始文字から始まります。
例:

<?php $rest = substr ("abcdef", 1); // returns "bcdef"
$rest = substr ("abcdef", 1, 3); // returns "bcd"
?>


start が負の数の場合、返される文字列は文字列の末尾の開始文字から始まります。

例:


<?php $rest = substr ("abcdef", -1); // returns "f"
$rest = substr ("abcdef", -2); // returns "ef"
$rest = substr ("abcdef", -3, 1); // returns "d"
?>


パラメーターの長さが指定され、それが正の数である場合、返される文字列は先頭からの長さの文字になります。

パラメータの長さが指定され、それが負の数値である場合、返される文字列は文字列の末尾から length 番目の文字で終了します。

例:

<?php $rest = substr ("abcdef", 1, -1); // returns "bcde"
?>


英語は問題ありません、中国語をテストします

例:


<?php $rest = substr ("中国人", 1, -1); // returns "fdsafsda" 就是乱码了
?>


この種の文字インターセプトの結果は、間違いなく私たちが望む結果ではありません、この種のPHP substr 中国語 文字化けがあると、プログラムが正常に動作しなくなる可能性があります。解決策は主に2つあります:

1. mbstring拡張ライブラリのmb_substr()を使用してインターセプトし、文字化けが発生しないようにします。


関数 mb_substr()/mb_strcut() を使用できます。mb_substr()/mb_strcut() の使用法は、設定するパラメーターが mb_substr()/mb_strcut の最後に 1 つ追加されることを除いて、substr() と似ています。文字列のエンコーディングですが、ほとんどのサーバーは php_mbstring.dll を開きません。php.ini で php_mbstring.dll を開く必要があります。

例:


<?php echo mb_substr("php中文字符encode",0,4,"utf-8");
?>


最後のエンコーディングパラメータが指定されていない場合、utf-8 文字セットを追加すると、漢字 1 文字に対して 3 バイトになります。説明、つまり 1 文字単位で切り取られます。


ご利用の際はphpファイルのエンコードとWebページ表示時のエンコードにご注意ください。この mb_substr メソッドを使用するには、文字列のエンコードを事前に知っておく必要があります。エンコードがわからない場合は、mbstring ライブラリにも文字列のエンコードをチェックするための mb_check_encoding が用意されていますが、まだ完全ではありません。 。


PHP にはいくつかの文字列インターセプト関数が付属しており、その中でよく使用されるのが substr と mb_substr です。前者が中国語を処理する場合、GBK は 2 長さ単位、UTF は 3 長さ単位になります。後者がエンコーディングを指定すると、1 つの中国語文字が 1 長さ単位になります。


substr は時々中国語の 1/3 または半分が切り取られ、文字化けして表示されます。比較的、mb_substr の方が使いやすいです。しかし、mb_substr があまり役に立たないと思われる場合もあります。たとえば、小さな画像の簡単な情報を表示したい場合は、漢字 5 文字がちょうどよく、それ以上の場合は、最初の 4 文字を切り取って「...」を追加するだけで問題ありません。中国語ですが、英語や数字を処理する場合、このインターセプトは短すぎます。

2 番目に、インターセプト関数を自分で作成しますが、効率は mbstring 拡張ライブラリを使用するほど高くありません。以下は、UTF-8 でエンコードされた文字列をインターセプトする ecshop の関数です。


例:


function sub_str($str, $length = 0, $append = true)
{
    $str = trim($str);
    $strlength = strlen($str);
 
    if ($length == 0 || $length >= $strlength)
    {
        return $str;  //截取长度等于0或大于等于本字符串的长度,返回字符串本身
    }
    elseif ($length 
                
                
                <p>
                    上記は、PHP substr で文字列をインターセプトするときに発生する中国語文字化けの問題の解決策を、関連する内容も含めて紹介しました。PHP チュートリアルに興味のある友人の役に立てば幸いです。 </p>
                <p>
                    </p>
声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
php怎么把负数转为正整数php怎么把负数转为正整数Apr 19, 2022 pm 08:59 PM

php把负数转为正整数的方法:1、使用abs()函数将负数转为正数,使用intval()函数对正数取整,转为正整数,语法“intval(abs($number))”;2、利用“~”位运算符将负数取反加一,语法“~$number + 1”。

php怎么除以100保留两位小数php怎么除以100保留两位小数Apr 22, 2022 pm 06:23 PM

php除以100保留两位小数的方法:1、利用“/”运算符进行除法运算,语法“数值 / 100”;2、使用“number_format(除法结果, 2)”或“sprintf("%.2f",除法结果)”语句进行四舍五入的处理值,并保留两位小数。

php怎么根据年月日判断是一年的第几天php怎么根据年月日判断是一年的第几天Apr 22, 2022 pm 05:02 PM

判断方法:1、使用“strtotime("年-月-日")”语句将给定的年月日转换为时间戳格式;2、用“date("z",时间戳)+1”语句计算指定时间戳是一年的第几天。date()返回的天数是从0开始计算的,因此真实天数需要在此基础上加1。

php怎么判断有没有小数点php怎么判断有没有小数点Apr 20, 2022 pm 08:12 PM

php判断有没有小数点的方法:1、使用“strpos(数字字符串,'.')”语法,如果返回小数点在字符串中第一次出现的位置,则有小数点;2、使用“strrpos(数字字符串,'.')”语句,如果返回小数点在字符串中最后一次出现的位置,则有。

php怎么设置implode没有分隔符php怎么设置implode没有分隔符Apr 18, 2022 pm 05:39 PM

在PHP中,可以利用implode()函数的第一个参数来设置没有分隔符,该函数的第一个参数用于规定数组元素之间放置的内容,默认是空字符串,也可将第一个参数设置为空,语法为“implode(数组)”或者“implode("",数组)”。

php怎么查找字符串是第几位php怎么查找字符串是第几位Apr 22, 2022 pm 06:48 PM

查找方法:1、用strpos(),语法“strpos("字符串值","查找子串")+1”;2、用stripos(),语法“strpos("字符串值","查找子串")+1”。因为字符串是从0开始计数的,因此两个函数获取的位置需要进行加1处理。

php怎么读取字符串后几个字符php怎么读取字符串后几个字符Apr 22, 2022 pm 08:31 PM

在php中,可以使用substr()函数来读取字符串后几个字符,只需要将该函数的第二个参数设置为负值,第三个参数省略即可;语法为“substr(字符串,-n)”,表示读取从字符串结尾处向前数第n个字符开始,直到字符串结尾的全部字符。

使用java的String.length()函数获取字符串的长度使用java的String.length()函数获取字符串的长度Jul 25, 2023 am 09:09 AM

使用Java的String.length()函数获取字符串的长度在Java编程中,字符串是一种非常常见的数据类型,我们经常需要获取字符串的长度,即字符串中字符的个数。在Java中,我们可以使用String类的length()函数来获取字符串的长度。下面是一个简单的示例代码:publicclassStringLengthExample{publ

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SecLists

SecLists

SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser は、オンライン試験を安全に受験するための安全なブラウザ環境です。このソフトウェアは、あらゆるコンピュータを安全なワークステーションに変えます。あらゆるユーティリティへのアクセスを制御し、学生が無許可のリソースを使用するのを防ぎます。

EditPlus 中国語クラック版

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

mPDF

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。