字体反反爬——一键通用解决方案(浏览器版) _Code

相关文章推荐

考研的投影仪 · OptimizeWarning: ...· 5 月前 ·

强悍的楼梯 · 【译】在Asp.Net中操作PDF - ...· 6 月前 ·

睡不着的荒野 · 通过Airflow调度工具进行作业调度_云原 ...· 1 年前 ·

果断的风衣 · jQuery ...· 1 年前 ·

爱旅游的感冒药 · 解决在MFC中使用Easylogging++ ...· 1 年前 ·

你去复制的话，复制出来的就是像  的乱码，其中处理的比较好的是某车之家的字体反爬，一起来看一下他的处理。以下是他页面的源码，可以看到，font文字是空白的，不容易分析出特征，你去读取他字体文件的时候，是没有unicode码的，不过呢，他强任他强，这不妨碍我们的pojie工作。 文末会告诉你们某车之家这种反爬要怎么处理。

我们再来对比其他的。

下面这个是某众点评的处理，可以看到他用的是unicode图标，咩有对字符特征做处理

以上就是对字体反爬的简(敷)单(衍)介绍，直接进入正题。

pojie的思路，就是将他的unicode和真实字符做匹配，要处理字符图标的识别，要记录下识别出的结果和unicode编码

这里提供一个我写的前端解决方案：项目地址

可以通用到所有网站，原理就是1、拿到字符图片，2、识别字符图片，3、记录，4、保存

目前市场上对字体爬虫的处理手段，大部分都是用的python作为主要语言对字体文件进行操作，对unicode编码识别，放到前端处理，其实也是一样的。

要准备一个跨域浏览器，因为项目默认是自动获取token的，不会制作跨域浏览器的可以去百度，巨简单，要是跨域浏览器弄不好，那就用Postman获取baidu的AccessToken，然后写死到access_token就好了，下面逻辑不用动，只需要赋值就好了，逻辑已经做了处理

对于写死的access_token，浏览器就随便用了，没有限制

先介绍一下这个项目吧，这个项目我是爬的网上一个字体在线查看网站的源码，然后进行二次开发得来的，他的功能是对字体文件文字查看和修改，字体文件一键打开即可查看字体的编码和字符图案。

打开字体文件就是下面这样，有字体的字形，字体的unicode，以及对字体的二次编辑等功能

我魔改的部分是他的预览页面，首先我们看下预览结果页面的样子

这个页面就满足了我们所有的需求。

为什么这么说呢，因为这个页面会展示文件内所有的字符，前端通过获取每个dom的base64图片，然后将图片传给识别接口识别，最后记录下来，简直完美。识别接口这里用到的是百度的通用识别，每天5万次，个人使用完全够了，准确率杠杆的，没注册的可以去注册一个

项目里面这个地方要用到。

我知道你们在想什么，“可以教一下这个怎么填写么”，行的，可以（你们还是回家养猪吧）

注册之后先进到控制台，然后打开文字识别

这两个玩意按顺序完成就可以

创建完应用之后，在应用列表里面，这几个值是你要保管好的，他可以去获取AccessToken，这个token就是一个通行证一样，有了这个通行证才能去访问服务

看到了吧，就是这几个，文档其实写的也很清楚了，就不一一赘述

以上就是大概的介绍，项目使用这里就用一个gif演示吧，最后会有一个json文件下载下来。里面就是你识别出的结果，对于错误或者，没有识别出来的，会有一个记录，就需要你自己手动修复一下了

某车字体对抗思路

最后，前面说的关于某车的反爬pojie方法，这里简单说一下，以下图这个为例，这是浏览器渲染后的dom效果

然后再看看网页源码，可以判断这个是服务端渲染的，虽然看不见字符，但是可以获取到字符

我们将获取到的字符写个demo测试一下

然后我们再去对应一下这个字体表，ec66刚好就是我们对应的“大”字

根据这个原理，那么我们可以通过获取到dom的字符然后转码出来替换为真实的字符，完结撒花，demo已经有了，思路到位就行

相关推荐

网易易盾——推理拼图验证码参数逆向分析和调用

之前发过一篇文章，《对无序的验证码拼图还原》，地址在这里，本篇文章主要是对验证的提交参数进行逆向分析，成功演示结果在最底部目标网址抓包提交分析

1082
One瓜瓜

前端安全&反爬虫AST混淆JavaScript与还原—（1）JS代码安全防护原理

本章将学习JavaScript的安全防护的原理，后面会继续介绍AST抽象语法树的原理和实现和Bable的API的使用，学会这两个之后，就可以开始实现自动化混淆和还原JavaScript代码。

717
One瓜瓜

对无序的验证码拼图还原

首先看一下目标的验证形态是什么样子的是一种通过验证推理的验证方式，用来防人机破解的确是很有效果，但是，But，这里面已经会有一些破绽，比如：（以上是原图和二值化之后的结果）（以上是正常图片和二值

601
Sheepy

AIGC 浪潮下，前端何去何从？

自 ChatGPT 上线以来，传统互联网行业受到了巨大冲击，而这冲击也不止体现在大厂的模型竞赛、创业赛道和投资方向的集中化、新岗位的涌现和旧岗位的没落等可见的变化，更体现在每个互联网从业者动荡的内心上

120
前端碎碎念

不可不知的前端工程化—— 埋点&监控

前端埋点和监控的出现，可以帮助开发者和产品运营人员，收集用户的行为数据，分析用户的行为习惯，实时监控应用的性能，发现和解决问题，处理系统故障。

123
JavaScript

路才走了一半，为何停下？（2023 年中总结）

这篇文章姑且算的上是我 2023 年的年中总结。我最近看到了这样一句话：“网站的流量是由于先前写的文章，你现在的成就是由于之前的努力或者有远见的选择。”

103
Cosolar JavaScript TypeScript

从JavaScript到TypeScript：详解转换过程与类型检查

JavaScript是一门强大而灵活的编程语言，但在大型项目中缺乏类型检查可能导致错误和调试困难。TypeScript作为JavaScript的超集，为开发人员提供了静态类型检查、更好的协作能力和面向

132
JavaScript

同学：“这个 iframe 元素我咋获取不到啊？”

背景故事起源于昨晚，我有个朋友问我了一个问题，场景是这样的。他的页面自己写了一个 div，然后通过一些调用内嵌了一个外部的 iframe，这个 iframe 就是一个外部 ide...

243
前端技术砖家

前端没了？也许是刚开始

最近听说某大厂取消大前端部门，前端被拆分到各个业务组。很多前端高 P 或离职，或被裁，或转后端。这是前端的落日？

3.2w
ssh_晨曦时梦见兮 JavaScript Vue.js

从尤雨溪这两天微博募捐，思考开源如何赚大钱

这两天，尤大在他的微博表示，他打算开启国内开源捐赠计划，截止本文发帖为止，已经有 6k / 月的固定充电了。这个数额目前还是比较小的，企业级别的 sponsor 应该还没有出现。

3.6w
superZidan JavaScript React.js

在 React Router 中使用 JWT

本篇文章将探讨 JWT 身份校验与 React 和 React-router 的无缝集成。我们还将学习如何处理公共路由、受校验保护路由，以及如何利用 axios 库通过身份验证令牌发出 API 请求

2.3w
纯爱掌门人 Flutter

Flutter制作桌面图标长按展示操作项面板

通过本文的学习，你应该掌握了如何在Flutter中制作一个长按展示操作项面板的桌面图标。这个功能在许多应用程序中都非常实用。同时，通过这个示例程序的学习，你也应该了解了如何在Flutter中创建Ale

192
JetTsang React.js JavaScript

ReactContext的封装思路

写在最前看官们好，我叫JetTsang，之前都是在掘金潜水来着，现在偶尔做一些内容输出吧。引出在React当中，做全局状态管理可能一般会想到Redux、Recoil、Zustand之类专门用于状

216
CUGGZ JavaScript React.js

高中生打破React性能极限，将React性能提升70%！

React 是当今最受欢迎的 JavaScript 框架之一，它的创新就是引入了虚拟 DOM 技术，但很多现代框架已经不再采用这种方案。Svelte 的创建者 Rich Harris 曾将其称作纯粹的

1.1w

SSL TLS

HTTPS HTTPS，全称为 Hypertext Transfer Protocol Secure，是一种通过加密通道传输数据的安全协议。它是 HTTP 协议的安全版本，用于在 Web 浏览器和 W

135

zotidaan

1、货运驾驶员要以一种有利于社会的方式进行道路运输和经营，承担相应的法律和经济义务，安全驾驶、文明行车、规范经营、优质服务、节能环保、诚实守信，对社会整体承担责任，为社会创造价值。 2、货运驾驶员的社

69
汪啊汪QAQ

【HTTP完全注释】Connection的前世今生

完整手册可关注该仓库，给个✨ 该站点也会同步更新 Connection [HTTP/1.0、HTTP/1.1] 🔠取值值简称说明 close 短连接不保持网络连接，它每发起一个请求时都会创建一

356
Vue.js JavaScript

Vue2屎山代码大盘点

遇到屎山代码，大多数人第一反应就是这谁写的代码这么差，其实大多数公司大多数人至少曾经都写过一些屎山代码，有屎山代码很正常，问题在于怎么快速梳理出业务逻辑，防止在迭代新需求时引发bug

7506

友情链接：

漫威：开局娶了黑寡妇都市逍遥邪医被渣后我被大叔宠成了全球首富 php mysql 长连接文明校园守则醉梦舞江湖醉欢莫拾酒痕在衣醉殇姒若梦遗年情侣名 One瓜瓜师傅，你是做什么工作的？

推荐文章

考研的投影仪 · OptimizeWarning: Covariance of the parameters could not be estimated category=OptimizeWarning) 这个w

5 月前

强悍的楼梯 · 【译】在Asp.Net中操作PDF - iTextSharp - 使用字体-阿里云开发者社区

6 月前

睡不着的荒野 · 通过Airflow调度工具进行作业调度_云原生数据仓库AnalyticDB MySQL版-阿里云帮助中心

1 年前

果断的风衣 · jQuery load和unload函数使用-阿里云开发者社区

1 年前

爱旅游的感冒药 · 解决在MFC中使用Easylogging++导致TRACE未定义错误_trace 未定义_lhw330472787的博客-CSDN博客

1 年前

今天看啥 · Py中国 · codingpro · 藏经阁 · 小百科 · link之家 · 卧龙AI搜索

删除内容请联系邮箱 2879853325@qq.com

Code - 代码工具平台

© 2024 ~ 沪ICP备11025650号