Rumah > Soal Jawab > teks badan
代码如下:
str1 = '\xB4\xF3\xE5N'
请问在python3中,如何把变量str1转成utf-8的字符串.
原编码gbk。字符串中的内容,是从网页采集的内容中的一段。
大家讲道理2017-04-18 10:01:41
>>> str1 = '\xB4\xF3\xE5N'
>>> str1
'´óåN'
>>> bytes(str1,'l1').decode('gbk')
'大錘'
>>> unicode = _
>>> unicode
'大錘'
>>> utf8=unicode.encode('utf8')
>>> utf8
b'\xe5\xa4\xa7\xe9\x8c\x98'
>>>
PHPz2017-04-18 10:01:41
>>> import unicodedata
>>> unicodedata.decomposition(u'\xb4')
'<compat> 0020 0301'
daripada: http://stackoverflow.com/ques...
伊谢尔伦2017-04-18 10:01:41
x sudah dikodkan, kan?
Kaedah di bawah 2.7:
str1.decode(原编码).encode('utf8')
Adapun 3, kerana saya tidak pernah menggunakannya, saya hanya boleh mencarinya di Baidu. Hasilnya ialah str pada asalnya unicode, jadi hanya kodkannya terus
bytes_str1 =str1.encode('utf8')
print(str(bytes_str1,'utf8'))
高洛峰2017-04-18 10:01:41
Jawapannya ialah:
bytes(str1,'l1')
Terima kasih kerana "bersetuju dan menerima" Kasut Kanak-kanak