How to plot two columns of a pandas data frame using points

我有一个熊猫数据框架,并希望绘制来自一个列的值与来自另一个列的值的对比图。幸运的是,有一个与数据帧相关的 plot方法可以满足我的需要:

df.plot(x='col_name_1', y='col_name_2')

不幸的是,在情节样式中(在 kind参数后面列出了 给你)似乎没有点。我可以使用线或条,甚至密度,但不能使用点。有没有什么方法可以帮助解决这个问题。

438266 次浏览

在调用 df.plot时,可以指定绘制线的 style:

df.plot(x='col_name_1', y='col_name_2', style='o')

style参数也可以是 dictlist,例如:

import numpy as np
import pandas as pd


d = {'one' : np.random.rand(10),
'two' : np.random.rand(10)}


df = pd.DataFrame(d)


df.plot(style=['o','rx'])

matplotlib.pyplot.plot的文档中列出了所有可接受的样式格式。

Output

对于这个(以及大多数的绘图) ,我不会依赖于熊猫包装器 matplotlib,而是直接使用 matplotlib:

import matplotlib.pyplot as plt
plt.scatter(df['col_name_1'], df['col_name_2'])
plt.show() # Depending on whether you use IPython or interactive mode, etc.

and remember that you can access a NumPy array of the column's values with df.col_name_1.values for example.

我在使用这种方法时遇到了麻烦,熊猫默认绘制的时间戳值列精度为毫秒。在尝试将对象转换为 datetime64类型时,我还发现了一个棘手的问题: < Panda 在询问 Timestamp 列值是否具有 attr astype 时给出了不正确的结果 > 。

Pandas uses matplotlib as a library for basic plots. The easiest way in your case will using the following:

import pandas as pd
import numpy as np


#creating sample data
sample_data={'col_name_1':np.random.rand(20),
'col_name_2': np.random.rand(20)}
df= pd.DataFrame(sample_data)
df.plot(x='col_name_1', y='col_name_2', style='o')

enter image description here

然而,我建议使用 seaborn作为一个替代的解决方案,如果你想有更多的定制图,而不是进入 matplotlib.的基本水平在这种情况下,你的解决方案将如下:

import pandas as pd
import seaborn as sns
import numpy as np


#creating sample data
sample_data={'col_name_1':np.random.rand(20),
'col_name_2': np.random.rand(20)}
df= pd.DataFrame(sample_data)
sns.scatterplot(x="col_name_1", y="col_name_2", data=df)

enter image description here

现在,在最新的熊猫中,您可以直接使用 df.plot.scatter 函数

df = pd.DataFrame([[5.1, 3.5, 0], [4.9, 3.0, 0], [7.0, 3.2, 1],
[6.4, 3.2, 1], [5.9, 3.0, 2]],
columns=['length', 'width', 'species'])
ax1 = df.plot.scatter(x='length',
y='width',
c='DarkBlue')

Https://pandas.pydata.org/pandas-docs/version/0.23/generated/pandas