最佳答案
我有一个读取到一个数据帧大型 CSV 文件。Csv 文件中的数据来自表示用户信息的多个网站。例如,这里是数据框架的结构。
user_id, number_of_logins, number_of_images, web
001, 34, 3, aa.com
002, 4, 4, aa.com
034, 3, 3, aa.com
001, 12, 4, bb.com
002, 1, 3, bb.com
034, 2, 2, cc.com
正如您可以看到的,一旦我将数据放入数据框,user _ id 就不再是唯一的 id,这就导致了所有的分析。我试图在 user_id
之前添加另一列,它类似于 "generated_uid"
,并且基本上使用 data.frame
的索引来填充该列。最好的方法是什么。