最佳答案
我有一个自1998年以来1000只股票的1分钟数据的数据集,总共约 (2012-1998)*(365*24*60)*1000 = 7.3 Billion
行。
大多数(99.9%)时间我只执行 读请求。
将此数据存储在数据库中的最佳方法是什么?
我不习惯处理这么大的数据集,所以这是我学习的绝佳机会。我将非常感谢你的帮助和建议。
编辑:
这是一个示例行:
‘ XX’,20041208,938,43.7444,43.7541,43.735,43.7444,35116.7,1,0,0
第1列是股票代码,第2列是日期,第3列是分钟,剩下的是开-高-低-收盘价,成交量和3个整数列。
大多数的查询会像“给我2012年4月12日12:15至2012年4月13日12:52的 AAPL 价格”
关于硬件: 我计划使用 Amazon RDS,所以我对此很灵活