PHP有没有判断一个文件或者一段字符串是什么编码的函数_框架

测试：将 text1txt 保存成 ASCII编码， text2txt 保存成 UTF-8 编码

<php

function chkCode($string){

$code = array('ASCII', 'GBK', 'UTF-8');

foreach($code as $c){

if( $string === iconv('UTF-8', $c, iconv($c, 'UTF-8', $string))){

return $c;

}

return null;

}

$file = 'text1txt';

echo chkCode(file_get_contents($file)); // 输出ASCII

echo '<br />';

$file = 'text2txt';

echo chkCode(file_get_contents($file)); // 输出UTF-8

echo '<br />';

PHP对中文字符串的处理一直困扰于刚刚接触PHP开发的新手程序员。下面简要的剖析一下PHP对中文字符串长度的处理：

PHP自带的函数如strlen()、mb_strlen()都是通过计算字符串所占字节数来统计字符串长度的，一个英文字符占1字节。例：

$enStr = ‘Hello,China!’;

echo strlen($enStr); // 输出：12

而中文则不然，做中文网站一般会选择两种编码：gbk/gb2312或是utf-8。utf-8能兼容更多的字符，所以受到很多站长的喜爱。gbk与utf-8对中文的编码不同，导致中文在gbk与utf-8编码下所占字节也有差异。

gbk编码下每个中文字符所占字节为2，例：

$zhStr = ‘您好，中国！’;

echo strlen($zhStr); // 输出：12

utf-8编码下每个中文字符所占字节为3，例：

$zhStr = ‘您好，中国！’;

echo strlen($zhStr); // 输出：18

那么如何计算这组中文字符串的长度呢？有人可能会说gbk下获取中文字符串长度除以2，utf-8编码下除以3不就行了吗？但是您要考虑字符串并不老实，99%的情况会以中英混合的情况出现。

这是WordPress中的一段代码，主要思想就是先用正则将字符串分解为个体单元，然后再计算单元的个数即字符串的长度，代码如下（只能处理utf-8编码下的字符串）：

$zhStr = ‘您好，中国！’;

$str = ‘Hello,中国！’;

// 计算中文字符串长度

function utf8_strlen($string = null) {

// 将字符串分解为单元

preg_match_all(“//us”, $string, $match);

// 返回单元个数

return count($match[0]);

}

echo utf8_strlen($zhStr); // 输出：6

echo utf8_strlen($str); // 输出：9

以上就是关于PHP有没有判断一个文件或者一段字符串是什么编码的函数全部的内容，包括:PHP有没有判断一个文件或者一段字符串是什么编码的函数、PHP如何获取中文字符串长度 utf8、等相关内容解答，如果想了解更多相关内容，可以关注我们，你们的支持是我们更新的动力！

欢迎分享，转载请注明来源：内存溢出

PHP有没有判断一个文件或者一段字符串是什么编码的函数