最佳答案
我正在使用 美味汤并解析一些 HTML。
我从每个 HTML (使用 for loop)中获得一些数据,并将这些数据添加到一个特定的列表中。
问题是,一些 HTML 有不同的格式 (他们没有我想要的数据)。
因此,我尝试使用异常处理并将值 null
添加到列表 (我应该这样做,因为数据的顺序很重要。)中
例如,我有这样一个代码:
soup = BeautifulSoup(links)
dlist = soup.findAll('dd', 'title')
# I'm trying to find content between <dd class='title'> and </dd>
gotdata = dlist[1]
# and what i want is the 2nd content of those
newlist.append(gotdata)
# and I add that to a newlist
一些链接没有任何 <dd class='title'>
,所以我想做的是添加字符串 null
到列表中。
错误出现了:
list index out of range.
我所做的尝试是添加一些像这样的行:
if not dlist[1]:
newlist.append('null')
continue
但是它并不奏效,它仍然显示出错误:
list index out of range.
我应该怎么做? 我应该使用异常处理吗? 还是有更简单的方法?
有什么建议吗? 任何帮助都是非常好的!