最佳答案
如何在 python 中将字节串转换为 int?
像这样说: 'y\xcc\xa6\xbb'
我想出了一个聪明/愚蠢的方法:
sum(ord(c) << (i * 8) for i, c in enumerate('y\xcc\xa6\xbb'[::-1]))
我知道必须有一些内置的或在标准库中,这样做更简单..。
这与可以使用 int (xxx,16)的 转换十六进制数字字符串不同,但是我想转换实际字节值的字符串。
更新:
我更喜欢 James 的回答,因为它不需要导入另一个模块,但是 Greg 的方法更快:
>>> from timeit import Timer
>>> Timer('struct.unpack("<L", "y\xcc\xa6\xbb")[0]', 'import struct').timeit()
0.36242198944091797
>>> Timer("int('y\xcc\xa6\xbb'.encode('hex'), 16)").timeit()
1.1432669162750244
我的方法是:
>>> Timer("sum(ord(c) << (i * 8) for i, c in enumerate('y\xcc\xa6\xbb'[::-1]))").timeit()
2.8819329738616943
更新:
有人在评论中问导入另一个模块有什么问题。嗯,进口一个模块不一定便宜,看看:
>>> Timer("""import struct\nstruct.unpack(">L", "y\xcc\xa6\xbb")[0]""").timeit()
0.98822188377380371
包括导入模块的成本几乎否定了这种方法所具有的所有优点。我相信这将只包括在整个基准测试运行期间导入它一次的费用; 看看每次我强制它重新加载时会发生什么:
>>> Timer("""reload(struct)\nstruct.unpack(">L", "y\xcc\xa6\xbb")[0]""", 'import struct').timeit()
68.474128007888794
不用说,如果每次导入都要执行大量此方法,那么这个问题就会相应减少。它也可能是输入/输出成本而不是 CPU,因此它可能取决于特定机器的容量和负载特性。