重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
这篇文章主要介绍了Python3编码怎样实现相互转化,具有一定借鉴价值,需要的朋友可以参考下。希望大家阅读完这篇文章后大有收获。下面让小编带着大家一起了解一下。
我们注重客户提出的每个要求,我们充分考虑每一个细节,我们积极的做好网站制作、成都网站设计服务,我们努力开拓更好的视野,通过不懈的努力,创新互联赢得了业内的良好声誉,这一切,也不断的激励着我们更好的服务客户。 主要业务:网站建设,网站制作,网站设计,微信小程序开发,网站开发,技术开发实力,DIV+CSS,PHP及ASP,ASP.Net,SQL数据库的技术开发工程师。
可以通过 Unicode 编码来进行不同编码之间的相互转化
了解 ASCII、Unicode、UTF-8、GBK这四种编码的相关概念
不同的编码之间不能互相识别,不能相互转化,会报错或出现乱码
国际通用标准:文字通过网络传输、或硬盘存储等不能使用 Unicode 编码方式,因为 Unicode 使用的是升级版 32 位的,太费流量和空间
在 Python3 版本中,唯独string在内存中的编码方式是Unicode,所以字符串不能直接进行网络传输及进行文件的存储
bytes:也是一种数据类型,不是字节,与string类型就像是孪生兄弟
为啥要有 bytes ?—— bytes内部编码不是Unicode方式,因此可以进行网络传输和文件的存储
前面提到,string 类型却是 Unicode 方式,为啥平时我们用的是 string 而不是 bytes?——因为 bytes 的中文是 16 进制方式存在
因此,一般当需要网络传输数据或者文件存储时要考虑用 bytes 类型。
s1 = "abc" s2 = b"abc" print(type(s1)) #print(type(s2)) #
string 转化成bytes的方法
######## 方法一 ######## # Unicode编码方式的 string --> GBK编码方式的 string --> GBK编码方式的 bytes # encode 编码 # decode 解码 # Python3 版本中,字符串的编码方式就是 Unicode, 所以这里等同于 s = u"中国" s1 = "中国" b = s1.encode("gbk") s2 = b.decode("gbk") print(s1) # 中国 print(b) # b'\xd6\xd0\xb9\xfa' print(s2) # 中国 print(type(s1)) #print(type(b)) # print(type(s2)) # # 原因解析:首先 s1 是以 Unicode 编码方式的 string # 然后 b 是将 Unicode 编码方式的 string 转化成 GBK 编码方式的 bytes # 最后 s2 是将 GBK 编码方式的 bytes 转化成 Unicode 编码方式的 string ######## 方法二 ######## # Unicode编码方式的 string --> UTF-8 编码方式的 string --> GBK编码方式的 bytes s1 = "中国" b = s1.encode("utf-8") s2 = b.decode("utf-8") print(s1) # 中国 print(b) # b'\xe4\xb8\xad\xe5\x9b\xbd' print(s2) # 中国 print(type(s1)) # print(type(b)) # print(type(s2)) #
强调一点:不同编码之间只能通过 Unicode编码方式来相互转化
感谢你能够认真阅读完这篇文章,希望小编分享Python3编码怎样实现相互转化内容对大家有帮助,同时也希望大家多多支持创新互联,关注创新互联行业资讯频道,遇到问题就找创新互联,详细的解决方法等着你来学习!