重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
1、iconv的含义是将一个抽象的符号的编码进行转换。
成都网站建设哪家好,找创新互联公司!专注于网页设计、成都网站建设、微信开发、微信小程序开发、集团成都定制网站等服务项目。核心团队均拥有互联网行业多年经验,服务众多知名企业客户;涵盖的客户类型包括:玻璃贴膜等众多领域,积累了大量丰富的经验,同时也获得了客户的一致认可!
但是如果一个符号比如“个”,可能在BIG5的编码中不存在(繁体字中不同)
GBK包含的是简体字,BIG5包含的是繁体字,Unicode包含全部,
所以
GBK-Unicode,Big5-Unicode (总是OK)
Unicode-GBK (当里面仅包含英文及简体时OK)
Unicode-BIG5 (当里面仅包含英文及繁体时OK)
GBK-Big5 (基本上不行,除非某些字没有特别的简体字)
GBK-Big5是汉字的简繁转换,不是编码转换,简体字转繁体字还有一个问题,一个简体字可能是对应多个繁体字,这种很难转换正确。繁体字转换成简体字相对难度低。
2、#include iconv.h
size_t iconv(iconv_t cd,
char **inbuf, size_t *inbytesleft,
char **outbuf, size_t *outbytesleft);
函数原型, outbuf是一个 char **类型
在函数手册中:
The iconv() function converts one multibyte character at a time, and for each character conversion it increments *inbuf and decrements
*inbytesleft by the number of converted input bytes, it increments *outbuf and decrements *outbytesleft by the number of converted
output bytes
#include iconv.h
size_t iconv(iconv_t cd,
char **inbuf, size_t *inbytesleft,
char **outbuf, size_t *outbytesleft);
你看函数原型, outbuf是一个 char **类型
在函数手册中:
The iconv() function converts one multibyte character at a time, and for each character conversion it increments *inbuf and decrements
*inbytesleft by the number of converted input bytes, it increments *outbuf and decrements *outbytesleft by the number of converted
output bytes
也就是说,当你执行过iconv以后,*outbuf所指向的内存空间位置已经被改掉了, 所以你任何时候去读*outbuf, 都是读不到任何iconv后的数据的(都在*outbuf这个指针前面放着呢)。
所以你应该 预先备份outbuf的数据,
比如 char k[1000]; char *outb = k; 执行完iconv(t,inb,inl,outb,outl)以后,你去读k数组就可以了。
除了iconv敕令我们在linux体系下的man page的第三节还可以看到一组iconv函数。它们分别是 iconv_t iconv_open(const char *tocode, const char *fromcode); size_ticonv(iconv_t cd, char **inbuf, size_t *inbytesleft, char **outbuf, size_t *outbytesleft); int iconv_close(iconv_t cd); iconv_open函数用来打开一个编码转换的流iconv函数的感化是实际进行转换iconv_close函数的感化就是封闭这个流。实际用法拜见下面的例子下面是一个将UTF-8码转换成GBK码的例子我们假设已经有了一个uft8编码的输入缓冲区inbuf以及这个缓冲区的长度inlen。 iconv_t cd = iconv_open( \"GBK\", \"UTF-8\"); char *outbuf = (char *)malloc(inlen * 4 ); bzero( outbuf, inlen * 4); char *in = inbuf; char *out = outbuf; size_t outlen = inlen *4; iconv[b]cd,