Heim > Artikel > Backend-Entwicklung > So berechnen Sie, wie viele Bytes ein String in PHP belegt
In PHP können Sie die Funktion strlen() verwenden, um die Anzahl der Bytes in einem String zu berechnen. Diese Funktion berechnet die Länge einer Zeichenfolge in Bytes und kann die von der Zeichenfolge belegte Zeichenlänge (Anzahl der Bytes) zählen. Die Syntax lautet „strlen (Zeichenfolge)“. Bei der Berechnung dieser Funktion belegen englische Kommas, Zahlen, englische Buchstaben, Dezimalpunkte usw. nur ein Byte, während ein GB2312-kodiertes chinesisches Zeichen zwei Bytes und ein UTF-8-kodiertes chinesisches Zeichen drei Bytes einnimmt.
Die Betriebsumgebung dieses Tutorials: Windows 7-System, PHP-Version 8.1, DELL G3-Computer
Die von Zeichen in verschiedenen Codierungsformaten in PHP belegten Bytes sind unterschiedlich:
ANSI-Codierungsformat Weiter Chinesisch A Das Zeichen belegt 2 Bytes und ein englisches Zeichen 1 Byte. Im
UTF-8-Codierungsformat belegt ein chinesisches Zeichen 3 Bytes und ein englisches Zeichen 1 Byte.
In PHP können Sie die Funktion strlen() verwenden, um die Anzahl der Bytes in einem String zu berechnen. Die Funktion
strlen() berechnet die Stringlänge in Bytes.
strlen($string)
Diese Funktion akzeptiert nur einen Parameter $string (den zu berechnenden String) und gibt 0 zurück, wenn der in diesem Parameter übergebene Wert leer ist.
strlen()-Funktion (im englischen Modus) Kommas, Zahlen, englische Buchstaben, Dezimalpunkte .
, Unterstriche, Leerzeichen usw. belegen nur eine Zeichenlänge (Byte). .
、下划线、空格等都只占一个字符长度(字节)。
<?php header("Content-type:text/html;charset=utf-8"); $str = "hello world!"; echo '字符串 “'.$str.'” 占:'.strlen($str).' 个字节<br>'; ?>
分析:上例的字符串中,有10个英文字母,一个空格、一个英文感叹号;合计:12个个字节。
strlen()函数中,一个 GB2312 编码的汉字占两个字符长度(字节),一个 UTF-8 编码的汉字占三个字符长度(字节)。
<?php header("Content-type:text/html;charset=utf-8"); $str = "!"; echo '字符串 “'.$str.'” 占:'.strlen($str).' 个字节<br>'; ?>
上例中,"!"是中文感叹号,因此占三个字节。
<?php header("Content-type:text/html;charset=utf-8"); $str = "欢迎"; echo '字符串 “'.$str.'” 占:'.strlen($str).' 个字节<br>'; ?>
上例中,包含两个汉字,因此占6个字节。
<?php header("Content-type:text/html;charset=utf-8"); $str = "hello,欢迎来到这里!"; echo '字符串 “'.$str.'” 占:'.strlen($str).' 个字节<br>'; ?>
上例中,包含5个英文字符,6个汉字,一个中文感叹号和一个中文逗号;因此占5+(8*3)=29个字节。
说明:在计算字符串的字符个数时,strlen()函数只能处理英文字符串,对中文或中英混合字符串不友好。此时,就需要利用
mb_strlen()函数了,该函数可以按字符
来计算字符串长度的。
扩展知识:mb_strlen() 函数
mb_strlen() 函数同样可以返回字符串的长度,语法格式如下:
mb_strlen($str [, $encoding = mb_internal_encoding()])
$str 为需要计算长度的字符串
$encoding 是可选参数,为字符编码,如果省略则使用内部字符编码。
mb_strlen() 函数的返回值为具有 $encoding 编码的字符串 $str 所包含的字符数,如果 $encoding 无效则返回 false。
注意:与 strlen() 函数不同,在 mb_strlen() 函数中,无论是汉字,还是英文、数字、小数点、下划线和空格,都只占一个字符长度。
【示例】 使用 mb_strlen() 函数获取字符串长度。
<?php header("Content-type:text/html;charset=utf-8"); $str = "hello 你好!"; echo '字符串 “'.$str.'” 的长度为:'.mb_strlen($str,"utf-8").'<br>'; $str = "欢迎来到PHP中文网!"; echo '<br>字符串 “'.$str.'” 的长度为:'.mb_strlen($str,'utf-8').'<br>'; ?>
可以看出,我们可以通过设置对应的$encoding
Analyse: In der Zeichenfolge im obigen Beispiel gibt es 10 englische Buchstaben, ein Leerzeichen und ein englisches Ausrufezeichen, insgesamt 12 Bytes. Mit der Funktion
🎜🎜🎜strlen() belegt ein GB2312-kodiertes chinesisches Zeichen eine Länge von zwei Zeichen (Bytes) und ein UTF-8-kodiertes chinesisches Zeichen eine Länge von drei Zeichen (Byte). 🎜🎜rrreee🎜🎜 🎜Im obigen Beispiel ist „!“ ein chinesisches Ausrufezeichen, es belegt also drei Bytes. 🎜rrreee🎜🎜🎜 Im obigen Beispiel enthält es zwei chinesische Zeichen und belegt daher 6 Bytes. 🎜rrreee🎜🎜🎜 Im obigen Beispiel enthält es 5 englische Zeichen, 6 chinesische Zeichen, ein chinesisches Ausrufezeichen und ein chinesisches Komma und belegt daher 5+(8*3)=29 Bytes. 🎜🎜🎜Hinweis: 🎜Bei der Berechnung der Anzahl der Zeichen in einer Zeichenfolge kann die Funktion strlen() nur englische Zeichenfolgen verarbeiten und ist nicht für chinesische oder gemischte chinesische und englische Zeichenfolgen geeignet. Zu diesem Zeitpunkt müssen Sie die Funktion 🎜mb_strlen() verwenden, die die Länge der Zeichenfolge anhand von Zeichen
berechnen kann. 🎜
🎜Erweiterte Kenntnisse: mb_strlen()-Funktion 🎜🎜🎜mb_strlen()-Funktion kann auch die Länge der Zeichenfolge zurückgeben, das Syntaxformat ist wie folgt: 🎜rrreee🎜🎜🎜 $str ist erforderlich. Berechnen Sie die Länge der Zeichenfolge. 🎜🎜🎜🎜$encoding ist ein optionaler Parameter, bei dem es sich um die Zeichenkodierung handelt. Wenn er weggelassen wird, wird die interne Zeichenkodierung verwendet. Der Rückgabewert der Funktion 🎜🎜🎜🎜mb_strlen() ist die Anzahl der Zeichen, die in der Zeichenfolge $str mit der Codierung $encoding enthalten sind. Wenn $encoding ungültig ist, wird „false“ zurückgegeben. 🎜🎜🎜Hinweis: Im Gegensatz zur Funktion strlen () nehmen in der Funktion mb_strlen () chinesische Zeichen, englische Zeichen, Zahlen, Dezimalpunkte, Unterstriche und Leerzeichen nur ein Zeichen in der Länge ein. 🎜🎜🎜【Beispiel】 Verwenden Sie die Funktion mb_strlen(), um die Stringlänge zu erhalten. 🎜rrreee🎜🎜🎜 Es ist ersichtlich, dass wir das Längenproblem chinesischer Zeichenfolgen gut lösen können, indem wir die entsprechenden $encoding
-Parameter festlegen. 🎜🎜Empfohlenes Lernen: „🎜PHP-Video-Tutorial🎜“🎜
Das obige ist der detaillierte Inhalt vonSo berechnen Sie, wie viele Bytes ein String in PHP belegt. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!