51可用代码模板网站

咨询热线:

181-1164-6936
  • 1
PHP代码
当前位置:首页>实用代码>PHP代码>

php编码转换及问题

时间:2017-08-14 14:01点击:
 首先,编码,在大陆,最常见的也就两种,一种是utf-8,一种是gbk/gb2312。

gb2312是简体中文编码。gbk/gb2312是中文编码,二者是相对兼容的。

数据库存储数据,一般采用utf8编码方式。而常常我们windows系统默认的编码方式是gb2312,这就出现了编码不统一的问题。

 

情景:

写入数据库。此时:我们需要将编码改为utf8后,才能往数据库存储。

其实,只需要简单的三步:判断编码,编码转换,写入数据库。(仅提供gbk/gb2312 与 utf8编码之间的转换,其他非主流类似处理即可)

一、判断编码

有很多种方式,我现在用的是这种:


    function is_utf8($string) {     
        return preg_match('%^(?:  
            [\x09\x0A\x0D\x20-\x7E]   
            | [\xC2-\xDF][\x80-\xBF]  
            |  \xE0[\xA0-\xBF][\x80-\xBF]  
            | [\xE1-\xEC\xEE\xEF][\x80-\xBF]{2}  
            |  \xED[\x80-\x9F][\x80-\xBF]  
            |  \xF0[\x90-\xBF][\x80-\xBF]{2}  
            | [\xF1-\xF3][\x80-\xBF]{3}  
            |  \xF4[\x80-\x8F][\x80-\xBF]{2}  
        )*$%xs', $string);    
    }  


这是各种编码的区间:


    $re['utf-8']  = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|[\xe0-\xef][\x80-\xbf]{2}|[\xf0-\xff][\x80-\xbf]{3}/";  
    $re['gb2312'] = "/[\x01-\x7f]|[\xb0-\xf7][\xa0-\xfe]/";  
    $re['gbk']    = "/[\x01-\x7f]|[\x81-\xfe][\x40-\xfe]/";  
    $re['big5']   = "/[\x01-\x7f]|[\x81-\xfe]([\x40-\x7e]|\xa1-\xfe])/";  


通过此函数,稍作修改即可:


    function is_utf8($string) {  
        return preg_match('/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|[\xe0-\xef][\x80-\xbf]{2}|[\xf0-\xff][\x80-\xbf]{3}/', $string);  
    }  


 二、编码转换

编码转换一般有三种方式:1、iconv  2、mbstring扩展 3、自写转换函数
1、iconv转换


    //UTF-8 to GB2312  
    //UTF-8转换时有小bug,请在第二个参数后加"//IGNORE"  
    iconv("UTF-8","GB2312//IGNORE",$data)  
      
    //GB2312 to UTF-8  
    iconv('GB2312', 'UTF-8', $str);  


2、因为我PHP开启了mbstring扩展,我使用的是此方式。


    //utf-8 to gb2312  
    $str = mb_convert_encoding("杨森", "gb2312", "utf-8");   
    //GBK to UTF-8  
    $str = mb_convert_encoding($str, "utf-8", "GBK");  


3、自写转换函数,我还没自己写过,没有自己的,写上来也是网上查询所得。所以建议网上自行查询。

 
4、如果牵涉到文件上传的编码,可使用以上函数直接读入然后写入即可。


    file_get_contents($path);  
    if(!is_utf8($str)) {                                                                                                                     
        $str = mb_convert_encoding($str, "utf-8", "gbk");  
        file_put_contents($path, $str);  
    }  


然后就写入数据库了。

51可用模板(代码)网站专为广大站长朋友提供精品模板与代码,同时免费提供网站收录。
本站域名: WWW.51KYDM.COM    联系方式:QQ:182468923    手机:18111646936
本站关键词:网站链接收录网址收录入口网站免费提交收录网站收录提交入口    网站地图
51可用模板
展开