如何用熊猫创建一个随机整数的数据框架?

我知道如果我用 randn,

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(100, 4), columns=list('ABCD'))

给我我要找的,但元素从一个正态分布。但如果我只想要随机整数呢?

randint通过提供一个范围来工作,但不像 randn那样提供一个数组。那么如何处理某个范围内的随机整数呢?

204118 次浏览

numpy.random.randint 接受第三个参数(size) ,您可以在其中指定输出数组的大小。你可以用这个来创建你的 DataFrame-

df = pd.DataFrame(np.random.randint(0,100,size=(100, 4)), columns=list('ABCD'))

这里 -np.random.randint(0,100,size=(100, 4))-创建一个大小为 (100,4)的输出数组,在 [0,100)之间使用随机整数元素。


示范 -

import numpy as np
import pandas as pd
df = pd.DataFrame(np.random.randint(0,100,size=(100, 4)), columns=list('ABCD'))

产生:

     A   B   C   D
0   45  88  44  92
1   62  34   2  86
2   85  65  11  31
3   74  43  42  56
4   90  38  34  93
5    0  94  45  10
6   58  23  23  60
..  ..  ..  ..  ..

现在,使用 NumPy 创建随机整数的推荐方法是使用 numpy.random.Generator.integers

import numpy as np
import pandas as pd


rng = np.random.default_rng()
df = pd.DataFrame(rng.integers(0, 100, size=(100, 4)), columns=list('ABCD'))
df
----------------------
A    B    C    D
0   58   96   82   24
1   21    3   35   36
2   67   79   22   78
3   81   65   77   94
4   73    6   70   96
... ...  ...  ...  ...
95   76   32   28   51
96   33   68   54   77
97   76   43   57   43
98   34   64   12   57
99   81   77   32   50
100 rows × 4 columns