最佳答案
我需要通过从文件中读取数据来创建一个数据帧,使用 read_csv
方法。但是,分隔符不是很规则: 有些列用制表符(\t
)分隔,有些用空格分隔。此外,有些列可以用2个或3个以上的空格分隔,甚至可以用空格和制表符的组合分隔(例如3个空格、2个制表符和1个空格)。
有没有办法告诉熊猫要好好对待这些档案?
顺便说一下,如果我使用 Python,就不会有这个问题。我使用:
for line in file(file_name):
fld = line.split()
而且效果很好。它不关心字段之间是否有2或3个空格。即使是空格和制表符的组合也不会造成任何问题。熊猫也能做到吗?