思索网:WWW.4SO.NET
网站首页
设为首页
加入收藏
社区论坛
联系我们
网站地图
发现个人价值
提高企业内涵
一切源于思索
首页
企业之家
公关文秘
免费论文
网上办公指南
操作系统
多媒体应用
现代教学
下载中心
专题报道
推荐文章
评论
English Article
IT资讯
网页设计
网站运营
编程开发
平面设计
网络安全
工具下载
站内搜索
最新文章
热门文章
论坛
栏目列表
Windows XP
win9x
Windows NT/2000
Windows 2003
Longhorn
Windows应用
Linux
首页
>
操作系统
>
Linux
> 抛砖引玉------python中的unicode操作
抛砖引玉------python中的unicode操作
日期:
2006-06-12 00:35:58
来源:
网络转载
请您记住思索网的网址:
http://www.4so.net
[加入收藏夹]
本人献丑先,将unicode操作的经验点滴再贴一遍,希望能够起到抛砖引玉的作用,有不对的请指正。
1、要注意命令行下与GUI下显示有差别,测试最好在交互示环境下进行,因为GUI的显示模块对测试有影响
2、在2.3b1版本中,可以在源码文件上加上如下两行,不需解码即可识别中文字符,但使用unicode编码才可获得正确的中文处理
#!/usr/bin/env python
# -*- coding: cp936 -*-
import locale
encoding = locale.getdefaultlocale()[1]
s1 = unicode('中华人民共和国', encoding)
s2 = '中华人民共和国'
print s1.encode(encoding), s2
print len(s1), len(s2) # 输出:7 14
3、在sitecustomize.py文件中加入以下两句即支持中文(该文件Python会在启动时自动导入。)
import sys
sys.setdefaultencoding('mbcs') # mbcs编码支持亚洲语言,包括中文,2.3b1版下也可用cp936编码(关于这些编码,希望有人能够作个专题阐述)
>>> s = '中华人民共和国' # python会自动调用mbcs编码转换,使用时不需任何特殊处理
>>> print s
中华人民共和国
>>>
4、读写unicode文件
>>> u = unicode("中国", "mbcs")
>>> u
u'/u4e2d/u56fd'
>>> print u
中国
>>> s = codecs.open("test-uft16.txt", "w", "mbcs")
>>> s.write(u) # 写中文字符到文件
>>> s.close()
本文地址:
http://www.4so.net/system/linux/60740.html
将本页加入收藏夹
将地址复制到剪贴板发送给好友
若发现本文有误或版权问题点击这里
热门信息
相关文章
[
Linux
]
wget的常见用法
[
Linux
]
/dev/null丟失后
[
Linux
]
自认为最简单的中文latex配置,3
[
Linux
]
介绍一个apt系统的小技巧
[
Linux
]
好用的工具checkinstall
[
Linux
]
关于如何设置sources.list,大家一
[
Linux
]
关于如何设置sources.list
[
Linux
]
关于debian汉化的一点补充
[
Linux
]
告诉大家一个非常好的工具--nets
[
Linux
]
《Debian服务器设置入门》系列教
无相关信息
文章评论
收藏本文
打印本文
关闭窗口