-
本文介绍免费图片文本识别(OCR)工具,包括普通文字识别,公式识别,甚至是手写公式和文字
-
重点在于免费和好用,不失选择的多样性
-
虽然公式识别的难度远大于普通文字的识别难度,但是随着技术的发展,公式识别也会像文本识别那样易用,免费
-
其他重要的AI应用(这里不展开)
-
还有表格识别,尤其是复杂表格的识别
-
逼真(接近真人播音员朗读效果)的文本朗读语言生成
-
本文内容可能会随着时间的逝去而过时,某些东西将来可能不那么好用,也可能变得好用,也可能出现更好的工具
-
这类软件或平台十分的多,早已普及,比如qq/微信都有文本识别的功能
-
有人把微信里的ocr功能作为后台设计了一个本地OCR,并且接入语音朗读
-
那么主要比较的是识别速度和精度,以及易用程度,比如能否离线识别,连续识别的体验,跨平台如何,费用等方面
-
当然能够识别公式的平台通常也能识别普通文本(但是个别模型为了提高公式识别精度,仅设计为用来识别公式)
-
软件有多个模型供下载使用,识别公式的速度不是很快,模型推理时对于磁盘有一定的读写量
-
在有需要说别的时候,我个人会优先使用在线工具识别
-
做以下测试具有时效性,测试时都是免费功能,后续可能会有优化,也可能不再免费
模型
|
示例
|
评价(仅先测试时的版本)
|
通义千问
|
|
效果尚可,需要等一会,复杂公式需要久一些
点击通义回复的右下角复制按钮获得latex代码;但是默认缺乏排班,需要告诉模型追加源代码输出,而不仅仅是渲染后的公式
|
文心一言
|
|
免费模型(3.5)测的,一般般,复杂公式识别不全,期待优化
|
-
大模型很多,这里就举出两个例子,其他的模型比如智谱清言也可以识别,但是同样的例子出现了错误,将来可能会改进
-
注意到通义模型可以较好的识别公式,个别细节可能需要微调
-
我们也可以继续和模型交谈,让他输出源代码,或者排版,甚至给出改进建议,例如我要求输出公式源代码而非展示markdown渲染结果
对于一个科研党er来说,最重要就是论文的输出,尤其是于理工科学生,每天打交道的就是各种复杂的
公式
,有的
公式
来自书上或者文献里,一个一个往Word或者LaTex里面敲非常累。而且在LaTeX中,
公式
都需要用代码编辑,对于我这样的科研小白来说,光是大段的
公式
就已经很头疼了,更何况是要转换为代码,此时如果能有
识别
公式
的神器,那肯定会提升不少效率。
于是我们有了AI智能
识别
的
公式
编辑器,只需要截个图,Slager就可以将截图中的
公式
自动转化为 LaTex 代码表达式,我们只需要简单地修改一下就可以直接插入到LaT
之前写各种报告总逃不过有些复杂的
公式
,然后每次都被弄得头昏脑胀,今天就来分享一款
公式
OCR
——妙手
OCR
,帮助你快速码完
公式
。
解压压缩包,得到相应文件。右键【妙手
OCR
】,以管理员打开。
打开软件,首先进行软件设置,包括
识别
接口和快捷键设置。点击【设置及其它】。
在默认
OCR
项目栏中,点击下拉按钮,找到【
公式
(微软接口)】选中。
点击【快捷键设置】,
title: 数学
公式
神器Mathpix Snip—妈妈再也不用担心我不会写数学
公式
了!
数学
公式
神器Mathpix Snip
本文转载自机器之心—《最好用的文字与
公式
编辑器,这套数学笔记神器送给你》,原文链接点击这儿。
在平时写博客或者写论文的时候,经常需要花些时间的就是嵌入数学
公式
。其实用 LaTex 表达式写数学
公式
还是挺麻烦的,至少一般人做不到手写速度。但是我们有 Mathpix Snip...
导读:本文为本系列第二章,在上一章中,我们对
OCR
的概念、发展历程等做了详细解读,并介绍了几种
OCR
识别
方法,本章将继续针对
OCR
文字
识别
进行详细讨论,通过不同的
OCR
分类
识别
数据集进一步介绍常用的几种
OCR
算法,对比传统
OCR
与深度学习
OCR
。首先是传统
OCR
识别
方法,下面内容将从我国
OCR
研究历程开始展开。这篇文章将对
OCR
技术进行分类描述,我国
OCR
发展过程:
我国的印刷体汉字
识别
研究是从上世纪70年代末起步的,至今己有近三十年的发展历...
OCR
软件全称Optical Character Recognitio,翻译成汉语是“光学字符
识别
”,通常我们俗称“文字
识别
”。有时我们对
文档
中的文字进行复制时,可能由于是扫描版或
图片
版,这时就需要用到文字
识别
软件了。不同的文字
识别
软件,水平高低不同。
今天我提供几款
OCR
识别
软件。
第一款:Panda
OCR
Panda
OCR
是一款专注于 Windows 桌面端
OCR
文字
识别
的软件,支持多功能
OCR
识别
、即时翻译和朗读等。而且
识别
和翻译等引擎都是可以自由调换的,界面简洁,使用起来也很方便。