ホームページ >バックエンド開発 >PHPチュートリアル >php中的mb_detect_encoding函数原理是什么

php中的mb_detect_encoding函数原理是什么

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBオリジナル: 2016-06-06 20:41:211466ブラウズ

php中的mb_detect_encoding可以根据输入的字符串判断它到底属于哪种编码，这种判断是如何进行的，utf-8和asc的宽度都不一样，而且前者还是变长的，它如何判断多出来的那个字节到底是属于下一个字的还是这个字最后一个字节

回复内容：

与其说utf-8跟 ascii区别,不如说如何判断 ascii和非ascii
ascii最大是127，判断时，只要这个字节大于127，也就是7f，就可以认定是这个字节属于多字节编码。不论是GBK还是UTF-8 都是兼容ascii。
1. utf-8 每个字的第一个字节，有表示这个字总共有多少个字节。所有变长的数据类型基本是这么实现的，比如数据库的varchar也是有多出来的字节保存长度，就不会误读。
2. GBK是等宽双字节的，只要这个字节不是ascii字符，就把它和下一个读在一起就OK 了
3. 至于如何猜测 utf-8和gbk，我也不了解。猜测应该是通过一些算法，去匹配编码规律或码表吧，关于这个可以参考：http://blog.csdn.net/ecjtuync/article/details/1774429

声明：

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

前の記事：【借贷系统】【数据库】资金流水表&利息表：怎么设计次の記事：typecho的文章怎么设置每行文字缩进两字符？

続きを見る

php中的mb_detect_encoding函数原理是什么

回复内容：

関連記事