首页 > 脚本专栏 > python > Selenium+BeautifulSoup获取json

Selenium+BeautifulSoup+json获取Script标签内的json数据

作者:诡途

这篇文章主要介绍了Selenium+BeautifulSoup+json获取Script标签内的json数据,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

Selenium爬虫遇到 数据是以 JSON 字符串的形式包裹在 Script 标签中,

假设Script标签下代码如下:

<script id="DATA_INFO" type="application/json" > "user": { "isLogin": true, "userInfo": { "id": 123456, "nickname": "LiMing", "intro": "人生苦短,我用python" </script>

此时drive.find_elements_by_xpath('//*[@id="DATA_INFO"] 只能定位到元素,但是无法通过.text方法,获取Script标签下的json数据

from bs4 import BeautifulSoup as bs import json as js #selenium获取当前页面源码 html = drive.page_source #BeautifulSoup转换页面源码 bs=BeautifulSoup(html,'lxml') #获取Script标签下的完整json数据,并通过json加载成字典格式 js_test=js.loads(bs.find("script",{"id":"DATA_INFO"}).get_text()) #获取Script标签下的nickname 值 js_tes

到此这篇关于Selenium+BeautifulSoup+json获取Script标签内的json数据的文章就介绍到这了,更多相关Selenium+BeautifulSoup获取json内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:
  • 一行Python命令实现批量加水印
    一行Python命令实现批量加水印
    2022-04-04
  • python使用opencv对图像添加噪声(高斯/椒盐/泊松/斑点)
    python使用opencv对图像添加噪声(高斯/椒盐/泊松/斑点)
    2022-04-04
  • python实现自动整理文件
    python实现自动整理文件
    2022-04-04
  • Python图片存储和访问的三种方式详解
    Python图片存储和访问的三种方式详解
    2022-04-04
  • Spectral clustering谱聚类算法的实现代码
    Spectral clustering谱聚类算法的实现代码
    2022-04-04
  • Python利用Matplotlib库实现绘制饼形图
    Python利用Matplotlib库实现绘制饼形图
    2022-04-04
  • Flask项目搭建及部署(最全教程)
    Flask项目搭建及部署(最全教程)
    2022-04-04
  • 基于Python实现打哈欠检测详解
    基于Python实现打哈欠检测详解
    2022-04-04
  • 美国设下计谋,用娘炮文化重塑日本,已影响至中国
    美国设下计谋,用娘炮文化重塑日本,已影响至中国
    2021-11-19
  • 时空伴随者是什么意思?时空伴随者介绍
    时空伴随者是什么意思?时空伴随者介绍
    2021-11-09
  • 工信部称网盘企业免费用户最低速率应满足基本下载需求,天翼云盘回应:坚决支持,始终
    工信部称网盘企业免费用户最低速率应满足基本下载需求,天翼云盘回应:坚决支持,始终
    2021-11-05
  • 2022年放假安排出炉:五一连休5天 2022年所有节日一览表
    2022年放假安排出炉:五一连休5天 2022年所有节日一览表
    2021-10-26
  • 电脑版 - 返回首页

    2006-2023 脚本之家 JB51.Net , All Rights Reserved.
    苏ICP备14036222号