C++中怎么读取UTF-8编码的文件

C++中怎么读取UTF-8编码的文件,第1张

1.windows上 默认使裂绝用的是 GBK,所以处理UTF8稍微麻烦点,甚至都桐配不能直接显示utf8.

2.任何文件都是二进制数据。

3.将文件读取到的字节数组 byte[] C++里面实际上是 unsigned char[]类型,使用windows api里面的一个函数进行转换,转换成unicode 也就是 wchar_t的字符数组 —— MultiByteToWideChar

4.对于wchar_t的字符,可以直接显示,也可以直接使用,因为基本上所有 *** 作系统都支持这种编码。

5.如果需要使用GBK的字符编码数组,那么使用上面函数的另一个兄弟函数——WideCharToMultiByte

提示:Windows MFC里面的字符串 CStringA CAtlStringA 这些都是肆轮姿基于GBK的

如果用CStringA保存UTF8的编码,直接输出会乱码,所以避免混淆,应该使用std::string 保存 utf8

std::wstring保存 unicode。而CStringA只在调用系统API的时候临时使用而已,而不作为长久数据保存于系统中。

读取unicode可以用

WCHAR *str

CFile F.Open("Filename.txe"丛坦数)

int length=F.SeekToEnd()

str=new(length)

F.Read(str,length)

F.Close()

这是以unicode来读整个文件

一行一行的读就渗首得信桥自己加判断了


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/12252003.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-22
下一篇 2023-05-22

发表评论

登录后才能评论

评论列表(0条)

保存