相关文章推荐
玩篮球的茴香  ·  [CMake教程] ...·  1 月前    · 
胆小的豆浆  ·  matlab ...·  1 月前    · 
小胡子的火锅  ·  Android ...·  5 天前    · 
纯真的冲锋衣  ·  数据争用(data race) ...·  2 天前    · 
玉树临风的鸡蛋  ·  fp = ...·  7 月前    · 
爽快的冲锋衣  ·  ios 编辑UITableView ...·  1 年前    · 
安静的领结  ·  C# ...·  1 年前    · 

如何通过BeautifulSoup的soup.select_one()来获取变量的值?

0 人关注

如果你试图用BeautifulSoup刮取一个网页,同时使用这个函数,你怎么能得到变量 ue_mid 的值。 soup.select_one()

源代码上的变量列表是这样的。

var ue_id = 'XXXXXXXXXXXX',
    ue_mid = 'ValueToGet',
    ue_navtiming = 1;

非常感谢你的到来!🙏

1 个评论
它是JavaScript - 你可以把它作为单个字符串获得,然后使用字符串的函数(或regex)从字符串中提取它。 select_one() 在这里是没有用的。
python
web-scraping
beautifulsoup
Anatol
Anatol
发布于 2019-07-21
1 个回答
furas
furas
发布于 2019-07-21
已采纳
0 人赞同

这就是JavaScript。你可以使用 select_one() 来从标签 <script> 中获取文本,之后你必须使用字符串的函数(或regex)来从字符串中提取它。

html = '''<script>
var ue_id = 'XXXXXXXXXXXX',
    ue_mid = 'ValueToGet',
    ue_navtiming = 1;
</script>'''
from bs4 import BeautifulSoup as BS
soup = BS(html, 'html.parser')
text = soup.select_one('script').get_text()
text = text.split("ue_mid = '")[1]