最佳答案
我有一本这种形式的字典:
{'user':{movie:rating} }
比如说,
{Jill': {'Avenger: Age of Ultron': 7.0,
'Django Unchained': 6.5,
'Gone Girl': 9.0,
'Kill the Messenger': 8.0}
'Toby': {'Avenger: Age of Ultron': 8.5,
'Django Unchained': 9.0,
'Zoolander': 2.0}}
我想把这个字典转换成一个熊猫数据框架,第一列是用户名,其他列是电影评级。
user Gone_Girl Horrible_Bosses_2 Django_Unchained Zoolander etc. \
但是,一些用户没有对电影进行评分,因此这些电影不包括在该用户键()的值()中。在这些情况下,最好只用 NaN 填充条目。
现在,我迭代键,填充列表,然后使用这个列表创建一个数据框架:
data=[]
for i,key in enumerate(movie_user_preferences.keys() ):
try:
data.append((key
,movie_user_preferences[key]['Gone Girl']
,movie_user_preferences[key]['Horrible Bosses 2']
,movie_user_preferences[key]['Django Unchained']
,movie_user_preferences[key]['Zoolander']
,movie_user_preferences[key]['Avenger: Age of Ultron']
,movie_user_preferences[key]['Kill the Messenger']))
# if no entry, skip
except:
pass
df=pd.DataFrame(data=data,columns=['user','Gone_Girl','Horrible_Bosses_2','Django_Unchained','Zoolander','Avenger_Age_of_Ultron','Kill_the_Messenger'])
但是这只给了我一个用户的数据框,这些用户对片场中的所有电影都进行了评分。
我的目标是通过迭代电影标签(而不是上面所示的蛮力方法)来附加到数据列表中,其次,创建一个包含所有用户的数据框架,并在没有电影评级的元素中放置空值。