文字
分享

在头文件<stdlib.h>中定义



int mbtowc(wchar_t * pwc,const char * s,size_t n)


(直到C99)

int mbtowc(wchar_t * restrict pwc,const char * restrict s,size_t n)


(自C99以来)

将第一个字节由s指向的多字节字符转换为宽字符,如果pwc不为null,则将其写入* pwc。

如果s是空指针,则重置全局转换状态并确定是否使用移位序列。

注意

每次调用mbtowc都会更新内部全局转换状态(类型为mbstate_t的静态对象,只有此函数已知)。 如果多字节编码使用移位状态,则必须小心避免回溯或多次扫描。 在任何情况下,多线程都不应该在没有同步的情况下调用mbtowc:可以使用mbrtowc。

参数

pwc

-

指向宽字符输出的指针

s

-

指向多字节字符的指针

n

-

限制可以检查的s中的字节数

返回值

如果s不是空指针,则返回多字节字符中包含的字节数,如果s指向的第一个字节没有形成有效的多字节字符,则返回-1;如果s指向空字符,则返回0'\ 0'。

如果s是空指针,则重置其内部转换状态以表示初始移位状态,如果当前多字节编码不是状态相关的(不使用移位序列),且如果当前多字节为非零值编码是依赖于状态的(使用移位序列),则返回0。

#include <stdio.h>#include <locale.h>#include <string.h>#include <stdlib.h>#include <wchar.h> // print multibyte string to wide-oriented stdout// equivalent to wprintf(L"%s\n", ptr);void print_mb(const char* ptr){    mbtowc(NULL, 0, 0); // reset the conversion state    const char* end = ptr + strlen(ptr);
    int ret;    for (wchar_t wc; (ret = mbtowc(&wc, ptr, end-ptr)) > 0; ptr+=ret) {        wprintf(L"%lc", wc);    }    wprintf(L"\n");}
 int main(void){    setlocale(LC_ALL, "en_US.utf8");    // UTF-8 narrow multibyte encoding    print_mb(u8"z\u00df\u6c34\U0001F34C"); // or u8"zß水?"}

输出:

zß水?

参考

  • C11标准(ISO / IEC 9899:2011):

    • 7.22.7.2 mbtowc函数(p:358)

  • C99标准(ISO / IEC 9899:1999):

    • 7.20.7.2 mbtowc函数(p:322)

  • C89 / C90标准(ISO / IEC 9899:1990):

    • 4.10.7.2 mbtowc函数

扩展内容

mbrtowc(C95)

将下一个多字节字符转换为宽字符,给定状态(函数)

mblen

返回下一个多字节字符(函数)中的字节数

| mbtowc的C ++文档 |

本文档系腾讯云云+社区成员共同维护,如有问题请联系 yunjia_community@tencent.com

在头文件<wctype.h>中定义



int iswdigit(wint_t ch);


(自C95以来)

检查给定的宽字符是否对应(如果缩小)十个十进制数字字符0123456789中的一个。

参数

CH

-

宽字符

返回值

如果宽字符是数字字符,则为非零值,否则为零。

注意

iswdigitiswxdigit是唯一不受当前安装的C语言环境影响的标准宽字符分类函数。

一些语言环境提供了检测非ASCII数字的附加字符类。

#include <stdio.h>#include <wctype.h>#include <wchar.h>#include <locale.h> void test(wchar_t a3, wchar_t u3, wchar_t j3){    printf("        '%lc' '%lc' '%lc'\n", a3, u3, j3);    printf("iswdigit %d    %d   %d\n",           !!iswdigit(a3), !!iswdigit(u3), !!iswdigit(j3));    printf("jdigit:  %d    %d   %d\n", !!iswctype(a3, wctype("jdigit")),          !!iswctype(u3, wctype("jdigit")),          !!iswctype(j3, wctype("jdigit")));}
 int main(void){
    wchar_t a3 = L'3';  // the ASCII digit 3
    wchar_t u3 = L'三'; // the CJK numeral 3
    wchar_t j3 = L'3'; // the fullwidth digit 3 
    setlocale(LC_ALL, "en_US.utf8");    puts("In American locale:");    test(a3, u3, j3); 
    setlocale(LC_ALL, "ja_JP.utf8");    puts("\nIn Japanese locale:");    test(a3, u3, j3);}

输出:

In American locale:        '3' '三' '3'iswdigit 1    0   0jdigit:  0    0   0
 In Japanese locale:        '3' '三' '3'iswdigit 1    0   0jdigit:  0    0   1

参考

  • C11标准(ISO / IEC 9899:2011):

    • 7.30.2.1.5 iswdigit函数(p:449)

  • C99标准(ISO / IEC 9899:1999):

    • 7.25.2.1.5 iswdigit函数(p:395)

扩展内容

isdigit

检查一个字符是否是一个数字(功能)

| 用于iswdigit的C ++文档 |

ASCII 值  (十六进制)

字符

iscntrl  iswcntrl.

isprint  iswprint.

isspace  iswspace.

isblank  iswblank.

isgraph  iswgraph.

ispunct  iswpunct.

isalnum  iswalnum.

isalpha  iswalpha.

isupper  iswupper.

islower  iswlower.

isdigit  iswdigit.

isxdigit  iswxdigit.


0 - 8

0x00-0x08

控制码 (NUL, etc.)

≠0

0

0

0

0

0

0

0

0

0

0

0

9

0x09

tab (\t)

≠0

0

≠0

≠0

0

0

0

0

0

0

0

0

10 - 13

0x0A-0x0D

空格 (\n,\v,\f,\r)

≠0

0

≠0

0

0

0

0

0

0

0

0

0

14 - 31

0x0E-0x1F

控制码

≠0

0

0

0

0

0

0

0

0

0

0

0

32

0x20

space

0

≠0

≠0

≠0

0

0

0

0

0

0

0

0

33 - 47

0x21-0x2F

!"#$%&'()*+,-./

0

≠0

0

0

≠0

≠0

0

0

0

0

0

0

48 - 57

0x30-0x39

0123456789

0

≠0

0

0

≠0

0

≠0

0

0

0

≠0

≠0

58 - 64

0x3a-0x40

:;<=>?@

0

≠0

0

0

≠0

≠0

0

0

0

0

0

0

65 - 70

0x41-0x46

ABCDEF

0

≠0

0

0

≠0

0

≠0

≠0

≠0

0

0

≠0

71 - 90

0x47-0x5A

GHIJKLMNOPQRSTUVWXYZ

0

≠0

0

0

≠0

0

≠0

≠0

≠0

0

0

0

91 - 96

0x5B-0x60

[]^_` | 0 | ≠0 | 0 | 0 | ≠0 | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 |













97 -102

0x61-0x66

abcdef

0

≠0

0

0

≠0

0

≠0

≠0

0

≠0

0

≠0

103-122

0x67-0x7A

ghijklmnopqrstuvwxyz

0

≠0

0

0

≠0

0

≠0

≠0

0

≠0

0

0

123-126

0x7B-0x7E

{|}~

0

≠0

0

0

≠0

≠0

0

0

0

0

0

0

127

0x7F

退格 (DEL)

≠0

0

0

0

0

0

0

0

0

0

0

0

上一篇:mbstowcs_s下一篇:memchr