最佳答案
我上传了一个文件到谷歌电子表格(使一个公开的例子 IPython 笔记本电脑,与数据)我使用的文件在它的本地形式可以读入熊猫数据框架。所以现在我使用下面的代码来读取电子表格,工作良好,但只是以字符串的形式输入,我没有任何运气试图把它放回到一个数据框架(你可以得到数据)
import requests
r = requests.get('https://docs.google.com/spreadsheet/ccc?key=0Ak1ecr7i0wotdGJmTURJRnZLYlV3M2daNTRubTdwTXc&output=csv')
data = r.content
数据最终看起来像: (第一行标题)
',City,region,Res_Comm,mkt_type,Quradate,National_exp,Alabama_exp,Sales_exp,Inventory_exp,Price_exp,Credit_exp\n0,Dothan,South_Central-Montgomery-Auburn-Wiregrass-Dothan,Residential,Rural,1/15/2010,2,2,3,2,3,3\n10,Foley,South_Mobile-Baldwin,Residential,Suburban_Urban,1/15/2010,4,4,4,4,4,3\n12,Birmingham,North_Central-Birmingham-Tuscaloosa-Anniston,Commercial,Suburban_Urban,1/15/2010,2,2,3,2,2,3\n
带入磁盘驻留文件的本地熊猫代码如下:
df = pd.io.parsers.read_csv('/home/tom/Dropbox/Projects/annonallanswerswithmaster1012013.csv',index_col=0,parse_dates=['Quradate'])
一个“干净”的解决方案将有助于许多提供一个简单的方式共享熊猫使用数据集!我尝试了很多替代方案,但都没有成功,我很确定我又错过了一些显而易见的东西。
更新注释新的 Google 电子表格有一个不同的 URL 模式只要用这个来代替上面例子中的 URL,或者用下面的答案,你应该就没问题了,这里有一个例子:
https://docs.google.com/spreadsheets/d/177_dFZ0i-duGxLiyg6tnwNDKruAYE-_Dd8vAQziipJQ/export?format=csv&id
参见下面@Max Ghenis 的解决方案,它刚刚使用了 pd.read _ csv,不需要 StringIO 或请求..。