要出家的煎饼果子 · 前端性能优化——让你的长任务保持在50ms ...· 3 天前 · |
光明磊落的烤面包 · 如何在Kotlin中使用值初始化数组?-腾讯 ...· 2 天前 · |
奋斗的针织衫 · 如何使用python将HTML标记转换为字符 ...· 昨天 · |
细心的仙人球 · 不能将类型“Boolean”分配给类型“bo ...· 昨天 · |
不羁的风衣 · TypeScript编程 读书笔记 - ...· 5 小时前 · |
豪气的香瓜 · bat脚本变量赋值-掘金· 11 月前 · |
苦闷的扁豆 · BeanShell常用内置变量 - 简书· 1 年前 · |
博学的苦瓜 · Window open() 方法 | 菜鸟教程· 1 年前 · |
胡子拉碴的豆腐 · 真实盈余管理 Stata程序 - 知乎· 1 年前 · |
python python函数 函数调用 javascript |
https://cloud.tencent.com/developer/ask/sof/660870/answer/981784/comments |
胡子拉碴的地瓜
1 年前 |
我需要抓取一个网站,然而,它的内容是动态的。Python中有没有可以调用js函数的包?例如,假设我在JS中有一个链接和JS函数1、2和3,我应该在该网页上调用,并且在所有JS函数调用之后我需要最终的网页。
执行客户端javascript可能会变得非常复杂,所以像用户一样在页面上运行所有javascript最可靠的方法是在无头模式下使用真正的浏览器。有一个专门针对Python的Python+Selenium组合,用于处理无头Chrome。如果你愿意用Python来交换Nodejs,一个更强大的工具集是Puppeteer+headless Chrome (它可以让你做比Selenium更多的事情)。还有一个早期的非官方的Puppeteer到Python的移植,但我还没有尝试过,也不能评论它是多么稳定的 https://pypi.org/project/pyppeteer/
Copyright © 2013 - 2023 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号: 粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
扫码关注腾讯云开发者
领取腾讯云代金券
不羁的风衣 · TypeScript编程 读书笔记 - CD、小月 - 博客园 5 小时前 |
豪气的香瓜 · bat脚本变量赋值-掘金 11 月前 |
苦闷的扁豆 · BeanShell常用内置变量 - 简书 1 年前 |
博学的苦瓜 · Window open() 方法 | 菜鸟教程 1 年前 |
胡子拉碴的豆腐 · 真实盈余管理 Stata程序 - 知乎 1 年前 |