最佳答案
我有一个大的 pyspark.sql.dataframe.DataFrame
,我想保留(因此 filter
)所有行,其中保存在 location
列中的 URL 包含一个预先确定的字符串,例如‘ google.com’。
我试过了:
import pyspark.sql.functions as sf
df.filter(sf.col('location').contains('google.com')).show(5)
但这会引发
TypeError: _TypeError: 'Column' object is not callable'
我如何去周围和过滤我的 df 正确吗? 非常感谢提前!