c语言宽字符处理函数 c语言宽字符是什么

什么是C语言中的宽字符与多字节字符

C 语言原本是在英文环境中设计的,主要的字符集是7 位的ASCII 码。从此开始,8 位的byte(字节)变成最常见的字符编码单位,但是国际化软件必须能够表示不同的字符,而这些字符数量庞大,无法使用一个字节编码,于是世界上使用各式 各样多字节的字符编码集合已经有数十年了,比如用来表示“非拉丁字母”以及“非字母”的中、日、韩文字系统。在1994 年,“Normative Addendum 1”(基准增补一)的采用,让ISO C 可以标准化两种表示大型字符集的方法:宽字符(wide character,该字符集内每个字符使用相同的位长)以及多字节字符(multibyte character,每个字符可以是一到多个字节不等,而某个字节序列的字符值由字符串或流(stream)所在的环境背景决定)。

鄢陵网站制作公司哪家好,找创新互联!从网页设计、网站建设、微信开发、APP开发、自适应网站建设等网站项目制作,到程序开发,运营维护。创新互联于2013年开始到现在10年的时间,我们拥有了丰富的建站经验和运维经验,来保证我们的工作的顺利进行。专注于网站建设就选创新互联。

注 意: 虽然C现在提供抽象机制,可以处理和转换不同种类的编码集合,但语言本身并没有定义或指定任何编码集合,或任何字符集(除前一节提到的基本源代码字符集和 基本运行字符集外)。换句话说,这部分是由个别的实现版本指定如何编码宽字符,以及要支持什么类型的多字节字符编码机制。

自从1994 年的增补之后,C 不只提供char类型,还提供wchar_t类型(宽字符),此类型定义在stddef.h 头文件中。wchar_t 类型足以表示某个实现版本扩展字符集的任何元素。

虽然C 标准没有支持Unicode 字符集,许多实现版本使用Unicode 转换格式UTF-16 和UTF-32(参考) 来处理宽字符。Unicode 标准和ISO/IEC 10646标准相当接近,而且是许多既有字符集(包括7 位的ASCII)的超集。如果遵循Unicode标准,wchar_t类型至少是16或32位长,而wchar_t类型的一个值就代表一个Unicode 字符。

在多字节字符集中,每 个字符的编码宽度都不等,可以是一个字节,也可以是多个字节。源代码字符集和运行字符集都可能包含多字节字符,如果真的包含多字节字符的话,那么基本字符 集中的每个字符都只会占用一个字节(完全没有多字节的字符),空字符是唯一的例外,空字符可能会占用任意个数的字节(但这些字节内全部的位都必须为0)。 多字节字符可以被用于字符的常量、字符串字面值(string literal)、标识符(identifier)、注释(comment),以及头文件。许多的多字节字符集被设计来支持特定国家的语言,例如JIS 字符集(日本业界标准,Japanese Industrial Standard)。多字节UTF-8 字符集是由Unicode Consortium(万国码联盟)定义的,可以表示Unicode 字符集的所有字符。

UTF-8 字符所使用的空间大小从一个字节到四个字节都有可能。多字节字符和宽字符(也就是wchar_t)的主要差异在于宽字符占用的字节数目都一样,而多字节字符的字节数目不等,这样的表示方式使得多字节字符串比宽字符串更难处理。

比 方说,即使字符'A'可以用一个字节来表示,但是要在多字节的字符串中找到此字符,就不能使用简单的字节比对,因为即使在某个位置找到相符合的字节,此字 节也不见得是一个字符,它可能是另一个不同字符的一部分。然而,多字节字符相当适合用来将文字存储成文件(参见第13 章)。

C 提供了一些标准函数,可以将多字节字符转换为wchar_t,或将宽字符转换为多字节字符。比方说,如果C 编译器使用Unicode 标准的UTF-16 和UTF-8

c语言字符串处理函数有哪些

1、puts函数——输出字符串的函数

一般的形式为puts(字符串组)

作用:将一个字符串输出到终端。如,char一个string,并赋予初值。调用puts(string);进行字符串的输出。

2、gets函数——输入字符串的函数

一般的形式:gets(字符数组)

作用:从终端输入一个字符串到字符数组,并且得到一个函数值成为字符数组的起始地址。

gets(str);

键盘输入,,,,你懂得。

注意:puts和gets函数只能输出或者输入一个字符串。

3、strcat函数——字符串连接函数

一般的形式:strcat(字符数组1,字符数组2);

作用:把两个字符串数组中字符串连接起来,把字符串2连接到字符串1的后面。

说明:字符数组1必须足够大,以便容纳连接后的新字符串。

4、strcpy/strncpy函数——字符串复制函数

一般形式:strcpy(字符数组1,字符串2);

作用:将字符串2复制到字符数组1中去。

如:char str1[10],str2[]="DongTeng";

strcpy(str1,str2);

执行后的结果为:你懂得

注意:

1. 不能用赋值语句直接将一个字符串常量或者字符数组直接给一个字符数组。

2. 用strncpy可以赋值指定的位置的字符。strncpy(str1,str2,3);将str2中的第3个字符复制到str1中。

5、strcmp函数——字符串比较函数

一般形式:strcmp(字符串1,字符串2);

作用:用来比较两个字符串的差异。具有不同的比较规则。

6、strlen函数——测字符串长度的函数

一般形式:strlen(字符数组);

如:char str[10]="DongTeng";

printf("%d",strlen(str));

得到的结果是:5

7、strlwr函数——转换为小写的函数

一般形式:strlwr(字符串);

8、strupr函数——转换为大写的函数

一般形式:strupr(字符串)。

C语言printf不输出宽字符

C语言中要输出宽字符,可以使用wprintf(),同时要设置本地化,以适应宽字符输出。示例如下,输出宽字符“中”字。

#include stdio.h

#include locale.h

int main()

{

setlocale(LC_ALL, "chs");

wchar_t wc = L'中';

wprintf(L"%c\n",wc);

return 0;

}

C语言宽字符

宽字符就是UNICODE操作的函数和ASIC字符有一点区别,一般用来表示汉字,MFC里面用_T("")表示宽字符和ASIC字符兼容的字符串,就是通过宏定义来完成的,如果定义了使用UNICODE,_T("")宏就将其中的字符串转换成UNICODE 否则就是普通的ASIC字符,建议写MFC程序是定义字符串使用_T("字符串")的形式。

如果对您有帮助,请记得采纳为满意答案,谢谢!祝您生活愉快!


当前名称:c语言宽字符处理函数 c语言宽字符是什么
文章分享:http://azwzsj.com/article/ddioiic.html