最佳答案
for
循环真的“很糟糕”吗?如果没有,在什么情况下,他们会比使用更传统的“向量化”方法更好
我熟悉“向量化”的概念,以及大熊猫如何使用向量化技术来加快计算速度。向量化函数在整个系列或 DataFrame 上广播操作,以实现比传统的在数据上迭代大得多的加速。
然而,我非常惊讶地看到许多代码(包括来自 Stack Overflow 的答案)为使用 for
循环和列表理解在数据中循环的问题提供了解决方案。文档和 API 指出,循环是“坏的”,人们应该“永远”不要在数组、序列或 DataFrames 上迭代。那么,为什么我有时会看到用户建议使用基于循环的解决方案呢?
1-虽然这个问题听起来有点宽泛,但事实是,在非常特定的情况下,for
循环通常比传统的对数据进行迭代要好。这篇文章的目的是为后人捕捉这一点。