频道栏目
首页 > 程序开发 > Web开发 > Python > 正文
python之中文字符串的处理方法介绍
2010-10-17 10:04:07           
收藏   我要投稿
python中直接将一个中文字符串赋值给一个变量使用的是utf-8格式的编码,以下为证.
>>> teststr = 我的eclipse不能正确的解码gbk码!
>>> teststr
xe6x88x91xe7x9ax84eclipsexe4xb8x8dxe8x83xbdxe6xadxa3xe7xa1xaexe7x9ax84xe8xa7xa3xe7xa0x81gbkxe7xa0x81xefxbcx81
>>> tests2 = u我的eclipse不能正确的解码gbk码!
>>> test3 = tests2.encode(gb2312)
>>> test3
xcexd2xb5xc4eclipsexb2xbbxc4xdcxd5xfdxc8xb7xb5xc4xbdxe2xc2xebgbkxc2xebxa3xa1
>>> test3
xcexd2xb5xc4eclipsexb2xbbxc4xdcxd5xfdxc8xb7xb5xc4xbdxe2xc2xebgbkxc2xebxa3xa1
>>> teststr
xe6x88x91xe7x9ax84eclipsexe4xb8x8dxe8x83xbdxe6xadxa3xe7xa1xaexe7x9ax84xe8xa7xa3xe7xa0x81gbkxe7xa0x81xefxbcx81
>>> test3.decode(gb2312).encode(utf-8)
xe6x88x91xe7x9ax84eclipsexe4xb8x8dxe8x83xbdxe6xadxa3xe7xa1xaexe7x9ax84xe8xa7xa3xe7xa0x81gbkxe7xa0x81xefxbcx81
>>> test3.decode(gb2312).encode(utf-8) == teststr
True
如上所见,test3变量(gb2312编码)经过解码(变成unicode字符串)后再使用utf-8编码,就成了与teststr值相同的串了.

通过上面的例子我们也发现,unicode字符串是gb2312字符串(windows就使用这种格式)与utf-8字符串(python本身使用)之间的一座桥梁.
点击复制链接 与好友分享!回本站首页
相关TAG标签 字符串 中文 方法
上一篇:python之快速排序程序代码
下一篇:Python 3.2 alpha 4 发布 - 下载
相关文章
图文推荐
文章
推荐
点击排行

关于我们 | 联系我们 | 广告服务 | 投资合作 | 版权申明 | 在线帮助 | 网站地图 | 作品发布 | Vip技术培训 | 举报中心

版权所有: 红黑联盟--致力于做实用的IT技术学习网站