我正在使用Scrapy选择器从html中提取字段
xpath = /html/body/path/to/element/text()
这与问题类似
scrapy获取同一类别的第n个孩子的文本
根据文档,我们可以使用
.getall()
方法来获取所有元素,并从列表中选择特定的元素。
selected_list = Selector(text=soup.prettify()).xpath(xpath).getall()
有没有可能在xpath本身中直接指定选择第n个元素?
像下面这样
xpath = /html/body/path/to/element/text(2) #to select 3 child text
<i class="ent_sprite remind_icon">
text that needs to be
</body>
The result of response.xpath('/body/div/text()').getall()
consist of 2 elements
'text that needs to be'