我有一个这样的数据框架(df1)。
f1 f2 f3 f4 f5
d1 1 0 1 1 1
d2 1 0 0 1 0
d3 0 0 0 1 1
d4 0 1 0 0 1
The d1...d4 column is the rowname, the f1...f5 row is the columnname.
为了处理 sample (df1) ,我得到一个新的数据帧,其计数为1,与 df1相同。因此,对于整个数据框架,1的计数是保守的,但对于每一行或每一列则不是。
是否可以按行或按列进行随机化?
我想为每一列随机化 df1列,即每一列中的1保持不变。每列至少需要更改一次。例如,我可能有一个这样的随机 df2: (注意,每列中1的计数保持不变,但每行中1的计数不同。
f1 f2 f3 f4 f5
d1 1 0 0 0 1
d2 0 1 0 1 1
d3 1 0 0 1 1
d4 0 0 1 1 0
同样,我还想为每一行随机化 df1行,即 no。每一行中的1保持不变,并且每一行都需要更改(但是没有更改的条目可能是不同的)。例如,随机 df3可以是这样的:
f1 f2 f3 f4 f5
d1 0 1 1 1 1 <- two entries are different
d2 0 0 1 0 1 <- four entries are different
d3 1 0 0 0 1 <- two entries are different
d4 0 0 1 0 1 <- two entries are different
PS. Many thanks for the help from Gavin Simpson, Joris Meys and Chase for the previous answers to my previous question on randomizing two columns.