我有一个 pandas
数据框架,我希望能够从列 B 和 C 中的值预测列 A 的值。下面是一个玩具的例子:
import pandas as pd
df = pd.DataFrame({"A": [10,20,30,40,50],
"B": [20, 30, 10, 40, 50],
"C": [32, 234, 23, 23, 42523]})
理想情况下,我会有一些类似于 ols(A ~ B + C, data = df)
的东西,但是当我从像 scikit-learn
这样的算法库中查看 例子时,它似乎用行列表而不是列表将数据提供给模型。这将需要我将数据重新格式化为列表内的列表,这似乎违背了使用大熊猫的首要目的。对熊猫数据框架中的数据运行 OLS 回归(或任何更一般的机器学习算法)的最简捷的方法是什么?