赛迪网 > IT技术 Linux > 系统管理
  IT资讯搜索
 
IT产品搜索
[程序开发][网管世界][网络安全][数据库技术]
[操作系统][嘉宾聊天·在线访谈][活动集锦]
[精彩专题][Symantec专区][订阅IT技术周刊]
[开发论坛][网管论坛][安全论坛][数据库论坛]
[操作系统论坛][Sybase专区][IBM dW技术专区]
[病毒求助][病毒与漏洞播报][文档·源码下载]

Linux系统中关于文件编码以及编码的转换

发布时间:2008.01.30 06:34     来源:赛迪网    作者:korn

Windows中默认的文件格式是GBK(gb2312),当然也可以保存为UTF-8的,最简单的方法是用记事本的“另存为”就可以做到。

为了与windows兼容,SecureCRT中文件编码的默认配置是”Default”,其实也就是GBK。如果我们将其更改为了”UTF-8″,那么我们查看从windows中scp过去的GBK文件就会变成乱码,需要进行转换,比较麻烦。

不过有时候我们也需要进行编码的转换,比如这次我这次在建立cacti的模板的时候使用了中文,apache默认是UTF-8的编码,所以记录到mysql数据库中的就是UTF-8的编码了(奇怪的是,在mysql中使用”set names utf-8″看不到正确的中文,需要使用”hex()”函数来看二进制,数一下字符数量,看是不是utf-8…..)。而当我使用批量添加主机的脚本来添加新服务器信息到数据库后,发现在网页中出现了乱码。原因是在cli中使用脚本的话,中文是使用GBK的格式保存到数据库中的。于是变成了很郁闷的情况,无论将浏览器编码设置为”UTF-8″还是”GB2312″,总会有一部分中文是乱码的。

解决的方法,不是将原来的模板的中文都转换成gb2312,就是要将以后添加的主机信息里面的中文转换成UTF-8。因为我比较喜欢UTF-8一点,所以我决定用后一种方法。

linux里面转换编码的方法很多,google了一下,一般的人都是用”iconv”命令来进行转换。但是由于我需要在脚本里面判断文件的编码,”iconv”就不太适用。其实Linux里面还有另一个能进行编码转换,并比”iconv”功能强大的”enca”。

debian中的安装:

aptitude install enca

使用方法:

enca -L zh_CN file 检查文件的编码

enca -L zh_CN -x UTF-8 file 将文件编码转换为"UTF-8"编码

enca -L zh_CN -x UTF-8 < file1 > file2 如果不想覆盖原文件可以这样

除了有检查文件编码的功能以外,”enca”还有一个好处就是如果文件本来就是你要转换的那种编码,它不会报错,还是会print出结果来,而”iconv”则会报错。这对于脚本编写是比较方便的事情。

(责任编辑:云子)


[ 发表评论 ] 字体[  ] [ 打印 ] [ 进入博客 ] [ 进入论坛 ]  [ 推荐给朋友 ]
  相关文章
· 在RedHat Linux 5上配置了Vsftpd的方法 (01-29) · Linux hosts.allow与hosts.deny限制访问 (01-29)
· 解决Linux系统下Twiki权限设置相关问题 (01-29) · 实用技巧:使Linux系统的服务器快速登录 (01-29)
· 新手看招:Linux操作系统下挂载SAN资源 (01-29) · Linux系统无线网卡DWL G122驱动模块安装 (01-29)
· Linux下将root帐号的邮件转到到其它用户 (01-29) · Linux系统下如何使用rsync进行数据同步 (01-29)
· 新手学堂:Linux操作系统硬盘路径的设置 (01-29) · Lotus Notes将对Ubuntu系统提供全面支持 (01-29)
  客户需求反馈表
* 姓  名:
更多资料  了解方案  认识厂商
* 单位名称:
* 联系电话:
* 电子邮件:
  赛迪推荐  
  手机·资费 ·新品·导购·评测·手机资费·宽带
手机搜索  诺基亚 N73 MOTO Z6
  IT产品 ·笔记本·台式机·服务器·打印·投影
IT产品搜索 
  IT技术 ·开发·网管·安全·数据库·操作系统
  信息化 ·热点·专题·访谈·周刊·方案案例
· 移动信息化市场方兴未艾 企业呼唤标准出台
· 如何把握企业价值差异 避免CRM与SCM脱节
· 齐看四大厂商的SaaS动态 ERP案例分析
· 通方期货CRM解决方案 方正电子公文系统
  IT博客 ·曾剑秋·项立刚·Java学习·网管
  IT技术论坛 ·开发·网管·安全·数据库·系统