計算UTF-8 字串的實際長度
在使用UTF-8 編碼的std::string 物件時,開發人員經常遇到str.length() 傳回的值與字串中的實際字元數之間的差異。這是因為 str.length() 只是計算字串中的位元組數,沒有考慮用於表示 UTF-8 字元的多位元組編碼。
UTF-8 編碼定義了一組位元組序列用於表示 Unicode 字元。每個字元可由一到四個位元組表示,具體取決於其 Unicode 代碼點。這些位元組序列的結構如下:
- 1 位元組序列 (0x00-0x7F): 直接表示 ASCII 字元。
- 2 位元組序列 (0x80-0xBF): 表示碼位元從 0x0080 到 0x07FF 的字元。
- 3 位元組序列 (0xC0-0xDF): 表示碼位從 0x0800 到 0x0800 的字元0xFFFF。
- 4 位元組序列 (0xE0-0xFF): 表示代碼點從 0x10000 到 0x10FFFF 的字元。
計算實際長度
UTF-8 編碼字串的實際長度可以透過計算字串中第一位元組的數量來決定,這些位元組是與模式10xxxxxx 不符的位元組。此模式表示連續字節,用於表示多字節序列。
程式碼片段
<code class="cpp">int len = 0; while (*s) len += (*s++ & 0xc0) != 0x80;</code>
在此程式碼中,while 循環迭代字串,對於遇到的每個第一個位元組,長度len 計數加1。
以上是如何在 C 中計算 UTF-8 字串的實際長度?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本文詳細介紹了C函數返回類型,包括基本(int,float,char等),派生(數組,指針,結構)和void類型。 編譯器通過函數聲明和返回語句確定返回類型,執行

Gulc是一個高性能的C庫,優先考慮最小開銷,積極的內襯和編譯器優化。 其設計非常適合高頻交易和嵌入式系統等關鍵應用程序,其設計強調簡單性,模型

本文詳細介紹了字符串案例轉換的C功能。 它可以通過ctype.h的toupper()和tolower()解釋,並通過字符串迭代並處理零終端。 常見的陷阱,例如忘記ctype.h和修改字符串文字是

本文解釋了C函數聲明與定義,參數傳遞(按值和指針),返回值以及常見的陷阱,例如內存洩漏和類型不匹配。 它強調了聲明對模塊化和省份的重要性

本文研究C函數返回值存儲。 較小的返回值通常存儲在寄存器中以備速度;較大的值可能會使用指針來記憶(堆棧或堆),影響壽命並需要手動內存管理。直接ACC

本文分析了形容詞“獨特”的多方面用途,探索其語法功能,常見的短語(例如,“不同於”,“完全不同”),以及在正式與非正式中的細微應用

本文詳細介紹了c中有效的STL算法用法。 它強調了數據結構選擇(向量與列表),算法複雜性分析(例如,std :: sort vs. std vs. std :: partial_sort),迭代器用法和並行執行。 常見的陷阱

本文解釋了C標準模板庫(STL),重點關注其核心組件:容器,迭代器,算法和函子。 它詳細介紹了這些如何交互以啟用通用編程,提高代碼效率和可讀性t


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

SublimeText3漢化版
中文版,非常好用

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

MantisBT
Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

Dreamweaver CS6
視覺化網頁開發工具

DVWA
Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中