use master
select from syscharsets
就可以得到数据库的字符集。
查询数据库版本:
>
如果需要以utf解码你的汉字,可以用如下办法
>>> unicode('人','utf-16')u'\ucbc8'
如果需要以gbk解码你的汉字,可以用如下办法
>>> unicode('人','gbk')u'\u4eba
若想实现更复杂的文件编码检测,可以使用一个开源项目cpdetector,它所在的网址是:>
文件的字符集在Windows下有两种,一种是ANSI,一种Unicode。
对于Unicode,Windows支持了它的三种编码方式,一种是小尾编码(Unicode),一种是大尾编码(BigEndianUnicode),一种是UTF-8编码。
我们可以从文件的头部来区分一个文件是属于哪种编码。当头部开始的两个字节为 FF FE时,是Unicode的小尾编码;当头部的两个字节为FE FF时,是Unicode的大尾编码;当头部两个字节为EF BB时,是Unicode的UTF-8编码;当它不为这些时,则是ANSI编码。
按照如上所说,我们可以通过读取文件头的两个字节来判断文件的编码格式,代码如下(C#代码):
程序中SystemTextEncodingDefault是指 *** 作系统的当前 ANSI 代码页的编码。
public SystemTextEncoding GetFileEncodeType(string filename)
{
SystemIOFileStream fs = new SystemIOFileStream(filename, SystemIOFileModeOpen, SystemIOFileAccessRead);
SystemIOBinaryReader br = new SystemIOBinaryReader(fs);
Byte[] buffer = brReadBytes(2);
if(buffer[0]>=0xEF)
{
if(buffer[0]==0xEF && buffer[1]==0xBB)
{
return SystemTextEncodingUTF8;
}
else if(buffer[0]==0xFE && buffer[1]==0xFF)
{
return SystemTextEncodingBigEndianUnicode;
}
else if(buffer[0]==0xFF && buffer[1]==0xFE)
{
return SystemTextEncodingUnicode;
}
else
{
return SystemTextEncodingDefault;
}
}
else
{
return SystemTextEncodingDefault;
}
以上就是关于SQL Server DB编码查询全部的内容,包括:SQL Server DB编码查询、python中如何获取中文的utf8编码、java代码如何获取文件的编码格式等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)