我试图抓取一个有这样一个部分的页面:
<a name="id_631"></a> <div class="store-class"> <span><strong>Store City</strong</span> <div class="store-class-content"> <p>Event listing</p> <p>Event listing2</p> <p>Event listing3</p> Stuff about contact info </div>
页面是这样的部分列表,区别它们的唯一方法是通过 <a> 标记中的name属性。
<a>
所以我想我想把目标对准,然后转到next_sibling,得到 <hr> ,然后再转到下一个兄弟,得到 <div class="store-class"> 部分。我只想要那个div标签上的信息。
<hr>
<div class="store-class">
不过,我不知道如何针对这个 <a> 标记来移动两个兄弟姐妹。当我尝试 print(soup.find_all('a', {"name":"id_631"})) 时,它只会给出标记中的内容,这是没有意义的。
print(soup.find_all('a', {"name":"id_631"}))
这是我的剧本:
import requests from bs4 import BeautifulSoup r = requests.get("http://www.tandyleather.com/en/leathercraft-classes")