最佳答案
作为一个长期的 SAS 用户,我正在探索转换到 python 和熊猫。
然而,当今天运行一些测试时,我感到惊讶的是 python 在尝试 pandas.read_csv()
一个128mb 的 csv 文件时内存不足。它有大约200,000行和200列主要是数字数据。
使用 SAS,我可以导入一个 csv 文件到 SAS 数据集,它可以像我的硬盘驱动器一样大。
在 pandas
中有类似的东西吗?
我经常处理大型文件,无法访问分布式计算网络。