我在用 kaggle.com 的泰坦尼克号数据集(泰坦尼克号上每个人的数据)做实验,得出了这样一个性别分类:
df = pd.DataFrame({'sex': ['male'] * 577 + ['female'] * 314})
gender = df.sex.value_counts()
gender
male 577
female 314
我想知道泰坦尼克号上男女船员的比例。
我的方法略有欠理想:
from __future__ import division
pcts = gender / gender.sum()
pcts
male 0.647587
female 0.352413
有没有更好的(更惯用的)方法?