在Python 3中,将字节转换为十六进制字符串的正确方法是什么?

在Python 3中,将字节转换为十六进制字符串的正确方法是什么?

我看到了一个bytes.hex方法的声明,bytes.decode编解码器,并尝试了其他可能的最小惊讶函数,但没有效果。我只想要我的字节为十六进制!

498966 次浏览

使用binascii模块:

>>> import binascii
>>> binascii.hexlify('foo'.encode('utf8'))
b'666f6f'
>>> binascii.unhexlify(_).decode('utf8')
'foo'

请看下面的答案: Python 3.1.1字符串到十六进制 < / p >

Python有字节到字节的标准的编解码器,可以执行方便的转换,如引号-printable(适合7bits ascii), base64(适合字母数字),十六进制转义,gzip和bz2压缩。在Python 2中,你可以这样做:

b'foo'.encode('hex')

在Python 3中,str.encode / bytes.decode严格用于bytes<->str转换。相反,你可以这样做,这适用于Python 2和Python 3 (s /编码/解码/ g为逆):

import codecs
codecs.getencoder('hex')(b'foo')[0]

从Python 3.4开始,有一个不那么尴尬的选项:

codecs.encode(b'foo', 'hex')

这些misc编解码器也可以在它们自己的模块中访问(base64, zlib, bz2, uu, quopri, binascii);API不太一致,但对于压缩编解码器,它提供了更多的控制。

import codecs
codecs.getencoder('hex_codec')(b'foo')[0]

适用于Python 3.3(因此“hex_codec”而不是“hex”)。

方法binascii.hexlify()将把bytes转换为表示ascii十六进制字符串的bytes。这意味着输入中的每个字节将被转换为两个ascii字符。如果你想要一个真正的str输出,那么你可以.decode("ascii")结果。

我包含了一个说明它的代码片段。

import binascii


with open("addressbook.bin", "rb") as f: # or any binary file like '/bin/ls'
in_bytes = f.read()
print(in_bytes) # b'\n\x16\n\x04'
hex_bytes = binascii.hexlify(in_bytes)
print(hex_bytes) # b'0a160a04' which is twice as long as in_bytes
hex_str = hex_bytes.decode("ascii")
print(hex_str) # 0a160a04

从十六进制字符串"0a160a04"到可以用binascii.unhexlify("0a160a04")返回bytes,返回b'\n\x16\n\x04'

自Python 3.5以来,这终于不再尴尬:

>>> b'\xde\xad\xbe\xef'.hex()
'deadbeef'

和反向:

>>> bytes.fromhex('deadbeef')
b'\xde\xad\xbe\xef'

也适用于可变的bytearray类型。

参考:https://docs.python.org/3/library/stdtypes.html#bytes.hex

如果你想将b'\x61'转换为97或'0x61',你可以尝试这样做:

[python3.5]
>>>from struct import *
>>>temp=unpack('B',b'\x61')[0] ## convert bytes to unsigned int
97
>>>hex(temp) ##convert int to string which is hexadecimal expression
'0x61'

参考:https://docs.python.org/3.5/library/struct.html

好吧,如果你只关心Python 3,下面的答案有点超出范围,但即使你没有指定Python版本,这个问题也是第一个谷歌问题,所以这里有一种在Python 2 而且 Python 3上都可以工作的方法。

我还将这个问题解释为将bytes转换为str类型:即在Python 2上是bytes-y,在Python 3上是Unicode-y。

鉴于此,我所知道的最佳方法是:

import six


bytes_to_hex_str = lambda b: ' '.join('%02x' % i for i in six.iterbytes(b))

以下断言对于Python 2或Python 3都是正确的,假设你没有在Python 2中激活unicode_literals future:

assert bytes_to_hex_str(b'jkl') == '6a 6b 6c'

(或者你可以使用''.join()来省略字节之间的空格,等等)

它可以使用格式说明符%x02来格式化并输出一个十六进制值。例如:

>>> foo = b"tC\xfc}\x05i\x8d\x86\x05\xa5\xb4\xd3]Vd\x9cZ\x92~'6"
>>> res = ""
>>> for b in foo:
...     res += "%02x" % b
...
>>> print(res)
7443fc7d05698d8605a5b4d35d56649c5a927e2736

python 3.8的新功能是,可以将分隔符参数传递给hex函数,如本例所示

>>> value = b'\xf0\xf1\xf2'
>>> value.hex('-')
'f0-f1-f2'
>>> value.hex('_', 2)
'f0_f1f2'
>>> b'UUDDLRLRAB'.hex(' ', -4)
'55554444 4c524c52 4142'

https://docs.python.org/3/library/stdtypes.html#bytes.hex