最佳答案
我想编写一个代码片段,以 lxml 格式在下面的三个实例中获取 <content>
标记中的所有文本,包括代码标记。我已经试过 tostring(getchildren())
,但是它会错过标签之间的文本。我在 API 中搜索相关函数的运气不太好。你能帮帮我吗?
<!--1-->
<content>
<div>Text inside tag</div>
</content>
#should return "<div>Text inside tag</div>
<!--2-->
<content>
Text with no tag
</content>
#should return "Text with no tag"
<!--3-->
<content>
Text outside tag <div>Text inside tag</div>
</content>
#should return "Text outside tag <div>Text inside tag</div>"