平台:
「白描」这款 App,我们以前有介绍过,我们还采访过它的开发者。
作为一款 iOS/安卓 上通吃的 App。「白描」是一款综合实力强劲的应用
和一些更轻量级的App相比,例如:「小嘿扫描」
「白描」则提供了「多语言翻译」以及「批量识别」之类额外的实用功能。
不过纯轻度使用或备用的话,「小嘿扫描」也是不错的选择。
「白描」的识别率和专业的文字识别「TextGrabber」之类相比不相上下。个人感觉,「白描」在中文识别率上更胜一筹。
例如:我扫描上面这本中文书籍某页时,「白描」可以正确显示出中文的段落标题,「TextGrabber」偶尔会走偏。
有些专业文字识别App需要昂贵的按月订阅,相较而言,「白描」基础版+高级版的收费方式,对于非重度用户而言,性价比就体现出来了。
其实,各款 OCR App 都各有千秋,完全可以按照各自偏好各取所需。「白描」恰好比较对我们胃口。
特点:网页应用,桌面办公理想选择
平台:
网址: http://app.xunjiepdf.com/ocrpart
这是一个网页应用,属于「迅捷 PDF 转换器」的一部分。
顾名思义,这个网页应用 除了图片转文字,还有不少 PDF 相关的处理。
「网页应用」的好处是在桌面级办公时非常方便,如果你在PC 或 Mac上已经有一堆扫描下来的图片文件,打开网页就能直接拖上去转换为文字,非常方便!
不过这种做法,缺点也很明显,上传到网站,可能会有一些「隐私顾虑」。
「迅捷」还提供了在线文档分享功能,如果是你的敏感文字内容,并不推荐上传分享。
特点:无需网络也可识别,私密性更强
平台:
既然说到「隐私顾虑」,那么这款 App主打的就是「私密性」。
「小度识字」无需网络也可识别你的图片文字,不用每次上传到云端,私密性更强,更适合在以下场景使用:
扫描有所顾虑的文字内容
手机信号不好甚至断网的情况下
作为代价,「小度识字」的功能性不如「白描」,例如:目前不能批量扫描。
特点:微信小程序, 方便顺手,功能强大
平台:
火箭君之前对「小程序」有一定误会,认为只不过是「网页」套一个壳子,功能性肯定会有折扣。
「拍图识字」这款「小程序」,让我有了新的认识。
考虑到越来越多的工作/生活场景,已经迁移到「微信」中,「小程序」则无需安装,微信内置,有种天然的「打开便利性」。
例如:
如果,我收到老板微信上发给我几张 收据/发票,要求登记一下。
当然,这时看着微信聊天的图片,用手打字登记也不是不可以。
但,这时直接在微信里打开一个「拍图识字」小程序,批量扫图,选中识别出的公司抬头,金额,用途,直接复制粘贴到文件里岂不是更好!
另外「拍图识字」还提供了一些「职场常用」的实用功能。
例如下面这些:
光学字符识别(Optical Character Recognition, OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。亦即将图像中的文字进行识别,并以文本的形式返回。
ocr的发展已经有了非常多的积累,一般人或者企业使用, 都是直接使用第三方的服务,目前提供第三方服务的大企业也非常多,百度,阿里云,腾讯等等,都提供了非常方便的api接口,可以进行调用,识别的速度、精确度和效果也都是非常不错的。唯一的缺点就是api的调用是需要收费的,对于调用频次不高的个人和企业,这个费用还是非常低的。
目前因为公司的现状,使用开源的有几个目的
目前针对ocr的相关开源项目也还是有不少的,作者正好是公司也需要类似的功能,所以做了一些简单的调研,在这里进行记录。
对于调研不准确的希望大家指出
Tesseract 是谷歌开发并开源的图像文字识别引擎,使用python开发。
所以针对目前公司的现状,放弃了这个项目的学习和调研
PaddleOCR 是百度开源的中文识别的ocr开源软件
EasyOCR 是一个用 Python 编写的 OCR 库,用于识别图像中的文字并输出为文本,支持 80 多种语言。
chineseocr
chineseocr_lite
TrWebOCR
cnocr
针对上面的比较讨论,同时根据现在的公司的情况和之前既定的一些目标,暂时选择最简单的cnocr进行学习和内部学习和使用。同时也针对目前cnocr仅仅是一个python包,而且无法通过接口进行调用的情况,做了一个补充项目 hn_ocr 。
目前放到github上面,欢迎大家一起学习和完善。
1.HBuilderX 新建项目 因为做的功能简单 选了个纯洁的模板
2.新建路由先整个页面出来 代码如下 看不懂的去uniapp官网瞅瞅
https://uniapp.dcloud.io/api/README
3.上面扫码的功能完成了 就这么简单 下面是OCR 图片文字识别 用到百度的开发api 你需要注册个百度云账号 领取免费资源 新建任务 获取秘钥 才能使用 文字识别我用的是 vin识别能正常调用 其他好几个好像是并发限制 用不了
https://console.bce.baidu.com/ai/?_=1628820741533#/ai/ocr/app/create
4.HBuildX运行发布 新建小程序 微信开发者平台注册 获取appid
导入项目目录下的 unpackagedistdev到微信开发者工具打开
如果没有出现上传按钮 多半是appid和你微信开发者平台的不一样 以平台为准
5.点击上传 期间可以能会有各种各样的问题 百度都能找到 懒得写了
6.上传完事 去平台看看效果
7.这个修改的路径 就是小程序默认打开的页面
8.我是整的体验版 不用等审核就可以用手机打开访问了 当然了 这个时候你的小程序请求是发不出去的 要配置域名 如下改改就成
需要正式发布的 发布前导入build包 上传并提交审核就成了
开发中还有很多小问题 没列出来 有兴趣的私聊交流
需要源码。。。。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)