提取每个子列表的第一项

我想知道提取列表中每个子列表的第一个项目并将其附加到新列表中的最佳方法是什么。因此,如果我有:

lst = [[a,b,c], [1,2,3], [x,y,z]]

我想取出 a1x然后创建一个单独的列表。

我试过:

lst2.append(x[0] for x in lst)
358923 次浏览

使用 列表内涵:

>>> lst = [['a','b','c'], [1,2,3], ['x','y','z']]
>>> lst2 = [item[0] for item in lst]
>>> lst2
['a', 1, 'x']

你的代码几乎是正确的。唯一的问题是列表内涵的使用。

如果在 lst 中使用 like: (x [0]表示 x) ,它将返回一个生成器对象。 如果使用 like: [ x [0] for x in lst ] ,它将返回一个列表。

当你将列表内涵输出附加到一个列表时,列表内涵的输出就是列表的单个元素。

lst = [["a","b","c"], [1,2,3], ["x","y","z"]]
lst2 = []
lst2.append([x[0] for x in lst])
print lst2[0]

Lst2 = [[‘ a’,1,‘ x’]]

Lst2[0] = [‘ a’,1,‘ x’]

如果我错了,请告诉我。

你说你有一个现成的名单,所以我就照你说的做。

>>> lst1 = [['a','b','c'], [1,2,3], ['x','y','z']]
>>> lst2 = [1, 2, 3]

现在,您正在将生成器对象追加到第二个列表中。

>>> lst2.append(item[0] for item in lst)
>>> lst2
[1, 2, 3, <generator object <genexpr> at 0xb74b3554>]

但是您可能希望它是第一个项目的列表

>>> lst2.append([item[0] for item in lst])
>>> lst2
[1, 2, 3, ['a', 1, 'x']]

现在,我们将第一个项的列表附加到现有列表中。如果您希望将这些项本身(而不是它们的列表)添加到现有的项中,那么可以使用 list.tended。在这种情况下,我们不必担心添加生成器,因为扩展将使用该生成器来添加它从那里获得的每个项,以扩展当前列表。

>>> lst2.extend(item[0] for item in lst)
>>> lst2
[1, 2, 3, 'a', 1, 'x']

或者

>>> lst2 + [x[0] for x in lst]
[1, 2, 3, 'a', 1, 'x']
>>> lst2
[1, 2, 3]

Https://docs.python.org/3.4/tutorial/datastructures.html#more-on-lists Https://docs.python.org/3.4/tutorial/datastructures.html#list-comprehensions

你可以用 zip:

>>> lst=[[1,2,3],[11,12,13],[21,22,23]]
>>> zip(*lst)[0]
(1, 11, 21)

或者,在 Python 3中,zip不产生列表:

>>> list(zip(*lst))[0]
(1, 11, 21)

或者,

>>> next(zip(*lst))
(1, 11, 21)

或者,(我最喜欢的)使用 numpy:

>>> import numpy as np
>>> a=np.array([[1,2,3],[11,12,13],[21,22,23]])
>>> a
array([[ 1,  2,  3],
[11, 12, 13],
[21, 22, 23]])
>>> a[:,0]
array([ 1, 11, 21])

Python 包含一个名为 itemgetter 的函数,用于返回列表中特定索引处的项:

from operator import itemgetter

将要检索的项的索引传递给 itemgetter ()函数。要检索第一个项,可以使用 itemgetter (0)。重要的是要理解 itemgetter (0)本身返回一个函数。如果向该函数传递一个列表,就会得到特定的项:

itemgetter(0)([10, 20, 30]) # Returns 10

当您将其与 map ()组合时,这非常有用,后者将函数作为第一个参数,并将 list (或任何其他可迭代参数)作为第二个参数。它返回对迭代器中的每个对象调用函数的结果:

my_list = [['a', 'b', 'c'], [1, 2, 3], ['x', 'y', 'z']]
list(map(itemgetter(0), my_list)) # Returns ['a', 1, 'x']

注意 map ()返回一个生成器,因此结果被传递给 list ()以获得一个实际的列表。总之,你的任务可以这样完成:

lst2.append(list(map(itemgetter(0), lst)))

这是使用列表内涵的另一种方法,选择哪种方法很大程度上取决于上下文、可读性和偏好。

更多信息: Https://docs.python.org/3/library/operator.html#operator.itemgetter

lst = [['a','b','c'], [1,2,3], ['x','y','z']]
outputlist = []
for values in lst:
outputlist.append(values[0])


print(outputlist)

输出: ['a', 1, 'x']

遇到同样的问题,并对每个解决方案的性能感到好奇。

这是 %timeit:

import numpy as np
lst = [['a','b','c'], [1,2,3], ['x','y','z']]

第一个 numpy 方法,转换数组:

%timeit list(np.array(lst).T[0])
4.9 µs ± 163 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)

完全原生的使用列表内涵(如@alecxe 所解释的) :

%timeit [item[0] for item in lst]
379 ns ± 23.1 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)

另一种使用 zip的本地方式(如@Dawg 所解释的) :

%timeit list(zip(*lst))[0]
585 ns ± 7.26 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)

第二个傻瓜,也是@dog 解释的:

%timeit list(np.array(lst)[:,0])
4.95 µs ± 179 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)

令人惊讶的是(至少对我来说)使用列表内涵的本地方式是最快的,比 numpy 方式快10倍。在没有最终 list的情况下运行这两种数字方式可以节省大约一 μs,这仍然是10倍的差异。

请注意,当我用对 len的调用包围每个代码片段时,为了确保 Generators 运行到结束,时间保持不变。

我建议的另一个答案是

lst = [['a','b','c'], [1,2,3], ['x','y','z']]
new_lst=[lst[0][0],lst[1][0],lst[2][0]]
print(new_lst)

输出如下

[‘ a’,1,‘ x’]

希望这个有用! 谢谢!