将一组pandas数据帧连接在一起

小开

最佳答案

假设所有的数据帧都有相同的列，你可以简单地concat它们:

import pandas as pd
df = pd.concat(list_of_dataframes)

小开

如果数据帧不都有相同的列，请尝试以下方法:

df = pd.DataFrame.from_dict(map(dict,df_list))

小开

你也可以用函数式编程来实现:

from functools import reduce
reduce(lambda df1, df2: df1.merge(df2, "outer"), mydfs)

小开

concat还可以很好地与使用“loc”命令对现有数据帧进行的列表推导式一起工作

df = pd.read_csv('./data.csv') # ie; Dataframe pulled from csv file with a "userID" column


review_ids = ['1','2','3'] # ie; ID values to grab from DataFrame


# Gets rows in df where IDs match in the userID column and combines them


dfa = pd.concat([df.loc[df['userID'] == x] for x in review_ids])

小开

再补充几个细节:

例子:

list1 = [df1, df2, df3]


import pandas as pd

按行连接&忽略索引
```
pd.concat(list1, axis=0, ignore_index=True)
```
注意:如果列名不相同，则南将插入不同的列值
列级连接&想要保留列名
```
pd.concat(list1, axis=1, ignore_index=False)
```
如果ignore_index = True，列名将被从0到(n-1)的数字填充，其中N是唯一列名的计数 . 0

小开

除了functools外，panders concat也可以工作

from functors import reduce as reduce
import pandas as pd;
deaf = pd.read_csv("http://www.aol.com/users/data.csv")
for q in range(0, Len(deaf)):
new = map(lambda x: reduce(pd.concat(x))