搜索
首页后端开发C++如何在 C 中计算 UTF-8 字符串的实际长度?

How to Calculate the Actual Length of a UTF-8 String in C  ?

计算 UTF-8 字符串的实际长度

在使用 UTF-8 编码的 std::string 对象时,开发人员经常遇到str.length() 返回的值与字符串中的实际字符数之间的差异。这是因为 str.length() 只是计算字符串中的字节数,没有考虑用于表示 UTF-8 字符的多字节编码。

UTF-8 编码定义了一组字节序列用于表示 Unicode 字符。每个字符可由一到四个字节表示,具体取决于其 Unicode 代码点。这些字节序列的结构如下:

  • 1 字节序列 (0x00-0x7F): 直接表示 ASCII 字符。
  • 2 字节序列 (0x80-0xBF): 表示码位从 0x0080 到 0x07FF 的字符。
  • 3 字节序列 (0xC0-0xDF): 表示码位从 0x0800 到 0x0800 的字符0xFFFF。
  • 4 字节序列 (0xE0-0xFF): 表示代码点从 0x10000 到 0x10FFFF 的字符。

计算实际长度

UTF-8 编码字符串的实际长度可以通过计算字符串中第一个字节的数量来确定,这些字节是与模式 10xxxxxx 不匹配的字节。此模式表示连续字节,用于表示多字节序列。

代码片段

<code class="cpp">int len = 0;
while (*s) len += (*s++ & 0xc0) != 0x80;</code>

在此代码中,while 循环迭代字符串,对于遇到的每个第一个字节,长度 len 计数加 1。

以上是如何在 C 中计算 UTF-8 字符串的实际长度?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
Gulc:从头开始建造的C库Gulc:从头开始建造的C库Mar 03, 2025 pm 05:46 PM

Gulc是一个高性能的C库,优先考虑最小开销,积极的内衬和编译器优化。 其设计非常适合高频交易和嵌入式系统等关键应用程序,其设计强调简单性,模型

c语言函数返回值的类型有哪些?返回值是由什么决定的?c语言函数返回值的类型有哪些?返回值是由什么决定的?Mar 03, 2025 pm 05:52 PM

本文详细介绍了C函数返回类型,包括基本(int,float,char等),派生(数组,指针,结构)和void类型。 编译器通过函数声明和返回语句确定返回类型,执行

c语言函数的定义和调用规则是什么c语言函数的定义和调用规则是什么Mar 03, 2025 pm 05:53 PM

本文解释了C函数声明与定义,参数传递(按值和指针),返回值以及常见的陷阱,例如内存泄漏和类型不匹配。 它强调了声明对模块化和省份的重要性

c语言函数格式字母大小写转换步骤c语言函数格式字母大小写转换步骤Mar 03, 2025 pm 05:53 PM

本文详细介绍了字符串案例转换的C功能。 它可以通过ctype.h的toupper()和tolower()解释,并通过字符串迭代并处理零终端。 常见的陷阱,例如忘记ctype.h和修改字符串文字是

c语言函数返回值在内存保存在哪里?c语言函数返回值在内存保存在哪里?Mar 03, 2025 pm 05:51 PM

本文研究C函数返回值存储。 较小的返回值通常存储在寄存器中以备速度;较大的值可能会使用指针来记忆(堆栈或堆),影响寿命并需要手动内存管理。直接ACC

distinct用法和短语分享distinct用法和短语分享Mar 03, 2025 pm 05:51 PM

本文分析了形容词“独特”的多方面用途,探索其语法功能,常见的短语(例如,“不同于”,“完全不同”),以及在正式与非正式中的细微应用

C标准模板库(STL)如何工作?C标准模板库(STL)如何工作?Mar 12, 2025 pm 04:50 PM

本文解释了C标准模板库(STL),重点关注其核心组件:容器,迭代器,算法和函子。 它详细介绍了这些如何交互以启用通用编程,提高代码效率和可读性t

如何有效地使用STL(排序,查找,转换等)的算法?如何有效地使用STL(排序,查找,转换等)的算法?Mar 12, 2025 pm 04:52 PM

本文详细介绍了c中有效的STL算法用法。 它强调了数据结构选择(向量与列表),算法复杂性分析(例如,std :: sort vs. std vs. std :: partial_sort),迭代器用法和并行执行。 常见的陷阱

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
2 周前By尊渡假赌尊渡假赌尊渡假赌
仓库:如何复兴队友
1 个月前By尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island冒险:如何获得巨型种子
4 周前By尊渡假赌尊渡假赌尊渡假赌

热工具

螳螂BT

螳螂BT

Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

VSCode Windows 64位 下载

VSCode Windows 64位 下载

微软推出的免费、功能强大的一款IDE编辑器

Dreamweaver Mac版

Dreamweaver Mac版

视觉化网页开发工具

SublimeText3 英文版

SublimeText3 英文版

推荐:为Win版本,支持代码提示!

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器