我有一个这样的字符串:
6Â 918Â 417Â 712
修剪这个字符串的简单方法(据我对 Python 的理解)就是说这个字符串在一个名为 s
的变量中,我们得到:
s.replace('Â ', '')
这样应该可以了。当然,它抱怨文件 blabla.py 中的非 ASCII 字符 '\xc2'
没有编码。
我一直不太明白如何在不同的编码之间切换。
这是代码,和上面的一样,但现在是在上下文中。该文件以 UTF-8格式保存在记事本中,并具有以下标头:
#!/usr/bin/python2.4
# -*- coding: utf-8 -*-
密码:
f = urllib.urlopen(url)
soup = BeautifulSoup(f)
s = soup.find('div', {'id':'main_count'})
#making a print 's' here goes well. it shows 6Â 918Â 417Â 712
s.replace('Â ','')
save_main_count(s)
没有比 s.replace
更远的了。