Python 的“ buffer”类型是用来做什么的?

Python 中有一个 buffer类型,但是我如何使用它呢?

关于 buffer()的 Python 文档中,描述如下:

buffer(object[, offset[, size]])

Object 参数必须是一个支持缓冲区调用接口(如字符串、数组和缓冲区)的对象。将创建一个引用对象参数的新缓冲区对象。缓冲区对象将是从对象开始(或从指定的偏移量)开始的一个片。切片将扩展到对象的末尾(或者具有由 size 参数给出的长度)。

174892 次浏览

示例用法:

>>> s = 'Hello world'
>>> t = buffer(s, 6, 5)
>>> t
<read-only buffer for 0x10064a4b0, size 5, offset 6 at 0x100634ab0>
>>> print t
world

本例中的缓冲区是一个子字符串,从位置6开始,长度为5,它不占用额外的存储空间——它引用字符串的一个片段。

这对于像这样的短字符串来说不是很有用,但是在使用大量数据时可能是必要的。这个例子使用了一个可变的 bytearray:

>>> s = bytearray(1000000)   # a million zeroed bytes
>>> t = buffer(s, 1)         # slice cuts off the first byte
>>> s[1] = 5                 # set the second element in s
>>> t[0]                     # which is now also the first element in t!
'\x05'

如果您希望在数据上拥有多个视图,并且不希望(或者不能)在内存中保存多个副本,那么这将非常有帮助。

请注意,在 Python 3中,buffer已经被更好的名称 memoryview所取代,尽管您可以在 Python 2.7中使用任何一种。

还要注意,如果不深入研究 C API,就不能为自己的对象实现缓冲区接口,也就是说,不能在纯 Python 中实现。

我认为缓冲区在将 Python 与本地库接口时非常有用(吉多·范罗苏姆这个邮件列表的邮件中解释了 buffer)。

例如,笨蛋似乎使用缓冲区进行高效的数据存储:

import numpy
a = numpy.ndarray(1000000)

a.data是:

<read-write buffer for 0x1d7b410, size 8000000, offset 0 at 0x1e353b0>