步骤一 将待导出的数据表的表结构导出(可以用Phpmyadmin、mysqldump等,很简单就不说了),然后将导出的create table语句的CHARSET=latin1改为CHARSET=utf8,在目标库newdbname中执行该create table语句把表结构建好,接下来开始导出-导入数据
步骤二 命令行:进入mysql命令行下,mysql -hlocalhost -uroot -p*** dbname
步骤三 执行SQL select * from tbname into outfile '/usr/local/tbname.sql'
步骤四 将tbname.sql转码为utf-8格式,建议使用UltraEditor,可以直接使用该编辑器的'转换->ASCII到UTF-8(Unicode编辑)',或者将文件另存为UTF-8(无BOM)格式
步骤五 在mysql命令行下执行语句 set character_set_database=utf8 注:设置mysql的环境变量,这样mysql在下一步读取sql文件时将以utf8的形式去解释该文件内容
步骤六 在mysql命令行下执行语句 load data infile 'tbname.sql' into table newdbname.tbname
已有的网站是GB2312编码?看到UTF-8编码的优点有点心动?本文就是教你如何把网站从GB2312转为UTF-8。GB2312是简体中文的编码,所以当文章/网页中包含繁体中文、日文、韩文时,这些内容可能无法被正确编码。
有一种比GB2312编码略广的编码,就是GBK,它包含了对繁体中文的编码,但对他国非拉丁字母语言还是有问题。
UTF-8编码是一种目前广泛应用于网页的编码,它其实是一种Unicode编码,即致力于把全球所有语言纳入一个统一的编码。目前UTF-8已经把几种重要的亚洲语言纳入,包括简繁中文和日韩文字。采用UTF-8编码的网页某种意义上说就是“与国际接轨”了。此外,很多手机终端都使用UTF-8编码,如果网站考虑开发WAP界面而网站数据本身又是UTF-8编码,就省却了开发WAP界面时的转码问题。
已有的网站是GB2312编码?看到UTF-8编码有点心动?本文就是教你如何把网站从GB2312转为UTF-8。
在转换前,必须考虑网站是否有必要转码。我提供几点供参考:
1、网站面向的对象,是局限一小圈子的人,还是中国大陆,还是包括港澳台在内的整个中国甚至全世界。
2、在GB2312编码中一个汉字占2个字节,而在UTF-8中,一个汉字要占3个字节,这种空间增加的代价是否值得。
3、在旧有的数据库系统上(例如mysql 4.0及以前的版本)可能没有内置对UTF-8的支持,虽然本文有办法解决,但不排除还潜在一些小问题。
4、网页文件转为UTF-8编码后是否方便编辑。我目前用ZDE4,设置好后对UTF-8编码支持非常好。设置方法是在菜单Tools->Preferences中,点Editing标签,把Encoding改为UTF-8即可。
考虑好决定转码以后,就可以开始了。本文仅以PHP 4.0~5.0 + MySQL 3.23~4.0为例。
首先对准备转码的数据库,为其建立一个新的数据库及相应表结构用于存储转码结果。如果在没有内置支持UTF-8的数据库系统 *** 作,则建议把用于存储中文的CHAR、VARCHAR、TEXT字段分别改为BINARY、VARBINARY、BLOB,虽然我试验过不改也没有问题。
接着在 *** 作系统命令行下执行如下命令导出原有的数据库(其中{dbname}用数据库名替换,{path1}用一个已存在的临时路径替换,导出的数据将会存放于此):
mysqldump --opt --comments=0 -n -t --fields-terminated-by=, --fields-escaped-by=\ {dbname} -uroot -p --tab={path1}
上述命令中的用户root也可换为其它用户,但须保证有dump的权限。用转码工具,例如ConvertZ,把上面{path1}中的全部文件转为UTF-8编码。注意要关闭BOM选项。假设转码后的文件保存在路径{path2}。
用有LOAD DATA权限的用户连接MySQL服务器,用use命令选择刚才新建的数据库,然后对每个表{table_name}执行如下命令:
LOAD DATA INFILE '{path2}{table_name}.txt' INTO TABLE {table_name} FIELDS TERMINATED BY ',' ESCAPED BY '\'
提示:表比较多的时候可以写个小程序生成一个SQL脚本。
执行上述命令时可能会出现警告(Warnings),请留意Warning的这些行(Row),可能有些数据并没有转换成功,例如字段错位。
根据经验,此种情况多数是由数据结尾的字节的16进制码大于7F所致。通常这些行数量是比较少的,可以手工修正这些行。
至此数据库的转码就完成了。清理原数据库和转码过程的临时文件这里就不详述了。
对网页转码:同样用转码工具把网站所有网页转为UTF-8编码。
然后打开包含头部的网页文件/网页模版文件,把这样的行:
替换为这样:
据我的经验,如果网页采用Css样式表控制网页样式,如果在css的body标签中设置了字体,那么在原来的gb2312编码下,该字体设置可以继承到intput和textarea中,但转为utf-8后,需要在input和textarea标签中重新设置字体。
转码本质上就是一种外在的加密技术,但这种技术本身有一定的局限性。使用转码存储达到加密效果的通常都是手工实现的,保护对象通常是一些文档资料,这些东西与其它应用系统之间通常不会有较强的关联性,而且在使用时需要手工转码回来才能被相关软件工具读取。转码工作通常由手工或软件开发商的专用软件实现,通常不适合随时有读取和写入 *** 作的对象,在处理性能上和应用场景上都不适合于大量数据资料的处理。另外,对于被保护的资料,知道转码密码或有权限使用专用软件 *** 作它们的所有人都具有完全相同的 *** 作权限,这也限制了转码存储不可能被大规模和大范围使用。由于这种透明性上、性能上和应用场景上的巨大缺失,结合数据库系统在整个业务系统中的定位与运作方式,转码存储一定不适合数据库系统。数据库加密产品是面向数据库安全而设计的,在对存储的数据进行加密保护的同时,能够实现对应用系统和基于数据库的各类业务的完全透明,在使用过程中,数据保护相关工作由数据库引擎完成,完全不需要手工介入,同时还可以保证数据库系统的性能优势。数据库加密产品的保护目标是数据库,与数据库系统被应用于什么样子的业务和场景没有关系,因此具备很强的业务适应性,可应用于任何数据库应用场景中。此外,加密系统的增强权控可以为同一个加密表设定完全不同的访问权限,可以非常方便地提升被保护数据的安全性。
推荐安华金和数据库加密产品,是一款基于透明加密技术的数据库数据安全加固产品,该产品为数据库数据提供加密存储、访问控制增强、应用访问安全、三权分立等功能。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)