我看了以前类似的问题,只是更加困惑。
在 python 3.4中,给定 url,我希望将 html 页面读取为字符串。
在 perl 中,我使用 LWP: : Simple,使用 get ()来完成这项工作。
Matplotlib 1.3.1示例说明: import urllib; u1=urllib.urlretrieve(url)
。
Python3找不到 urlretrieve
。
我试了 u1 = urllib.request.urlopen(url)
,它似乎得到一个 HTTPResponse
对象,但我不能打印它或得到它的长度或索引它。
u1.body
不存在,我在 python3中找不到对 HTTPResponse
的描述。
在 HTTPResponse
对象中是否有一个属性可以给出 html 页面的原始字节?
(来自其他问题的不相关内容包括 urllib2
,它不存在于我的 python、 csv 解析器等中。)
编辑:
我在之前的一个问题中发现了一些东西,它们部分(大部分)起到了作用:
u2 = urllib.request.urlopen('http://finance.yahoo.com/q?s=aapl&ql=1')
for lines in u2.readlines():
print (lines)
我说“部分”是因为我不想读取单独的行,而只是一个大字符串。
我可以只是连接行,但每一行打印有一个字符“ b”预先对它。
这是怎么回事?
同样,我想我可以在连接之前删除第一个字符,但这确实是一个 kloodge。