为什么Python中没有元组理解?

我们都知道,有列表理解,比如

[i for i in [1, 2, 3, 4]]

还有字典理解,比如

{i:j for i, j in {1: 'a', 2: 'b'}.items()}

(i for i in (1, 2, 3))

将在生成器中结束,而不是tuple理解。为什么呢?

我的猜测是tuple是不可变的,但这似乎不是答案。

189018 次浏览

我最好的猜测是他们用完了括号,并且认为它没有足够的用处来保证添加一个“丑陋的”语法…

你可以使用生成器表达式:

tuple(i for i in (1, 2, 3))

但是括号已经被用于生成器表达式。

我相信这只是为了清晰起见,我们不想用太多不同的符号来混淆语言。另外,tuple推导式永远不是必要的,可以使用列表来代替,速度差异可以忽略不计,不像字典推导式和列表推导式。

理解通过循环或迭代项并将它们赋值到容器中来工作,元组无法接收赋值。

一旦创建了元组,就不能对其追加、扩展或赋值。修改元组的唯一方法是它的一个对象本身可以被赋值(是一个非元组容器)。因为元组只保存了对这类对象的引用。

而且,元组有自己的构造函数tuple(),你可以给它任何迭代器。这意味着创建一个元组,你可以这样做:

tuple(i for i in (1,2,3))

Raymond Hettinger (Python核心开发人员之一)对最近的微博中的元组这样说:

#python提示:通常,列表用于循环;用于结构的元组。列表是同构的;元组异构。可变长度的列表。

这(对我来说)支持了这样一种观点,即如果序列中的项足够相关,可以由生成器生成,那么它应该是一个列表。虽然tuple是可迭代的,看起来像一个简单的不可变列表,但它实际上是Python中的C结构体:

struct {
int a;
char b;
float c;
} foo;


struct foo x = { 3, 'g', 5.9 };

在Python中变成

x = (3, 'g', 5.9)

元组不能像列表一样有效地追加。

因此,元组理解需要在内部使用列表,然后转换为元组。

这将与您现在所做的相同:tuple([comprehension])

我们可以从列表推导式生成元组。下面的例子将两个数字依次添加到一个元组中,并给出一个从数字0到9的列表。

>>> print k
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99]
>>> r= [tuple(k[i:i+2]) for i in xrange(10) if not i%2]
>>> print r
[(0, 1), (2, 3), (4, 5), (6, 7), (8, 9)]

圆括号不能创建元组。也就是one = (two)不是元组。唯一的方法是one = (two,)或者one = tuple(two)。所以解决方案是:

tuple(i for i in myothertupleorlistordict)

从Python 3.5开始,你也可以使用splat *解包语法来解包生成器表达式:

*(x for x in range(10)),

作为另一个海报macm在他的回答中提到,从生成器创建元组的最快方法是tuple([generator])


性能比较

  • < p >列表理解:

      $ python3 -m timeit "a = [i for i in range(1000)]"
    10000 loops, best of 3: 27.4 usec per loop
    
  • 元组从列表理解:

      $ python3 -m timeit "a = tuple([i for i in range(1000)])"
    10000 loops, best of 3: 30.2 usec per loop
    
  • 元组from generator:

      $ python3 -m timeit "a = tuple(i for i in range(1000))"
    10000 loops, best of 3: 50.4 usec per loop
    
  • 元组从unpacking:

      $ python3 -m timeit "a = *(i for i in range(1000)),"
    10000 loops, best of 3: 52.7 usec per loop
    

我的python版本:

$ python3 --version
Python 3.6.3

因此,您应该始终从列表推导式创建元组,除非性能不是问题。

在我的python(3.5)中,使用来自collectionsdeque生成器比使用list推导式略快:

>>> from collections import deque
>>> timeit.timeit(lambda: tuple([i for i in range(10000000)]),number=10)
9.294099200000005
>>> timeit.timeit(lambda: tuple(deque((i for i in range(10000000)))),number=10)
9.007653800000014

因为您不能在元组中添加项。这就是如何将简单的列表推导式转换为更基本的python代码。

_list = [1,2,3,4,5]
clist = [ i*i for i in _list ]
print(clist)


clist1 = []
for i in _list:
clist1.append(i*i)
print(clist1)

现在,对于上面的例子,使用元组理解意味着将项添加到元组中,这是不允许的。不过,你可以使用tuple(clist1)将这个列表隐藏为一个元组

现在python3中有元组理解了。您可以遵循下面的代码片段。

(k*k for k in range(1,n+1))

它将返回一个生成器对象理解。