最近,在做完OpenHarmony 3516开发板拍照的功能以后,下一步就需要研究一下目前又哪些AI云服务可用,可以实现从图片中识别文字,于是做了如下记录:
华为云:
文字识别服务的产品介绍:图解文字识别_文字识别 OCR_产品介绍_华为云
目前开通了一个一年的试用,每天有500次的免费调用。
尝试使用了通用文字识别,手写文字识别。试用方式:首先先在在线体验模拟调用https://apiexplorer.developer.huaweicloud.com/apiexplorer/sdk?product=OCR&api=RecognizeHandwriting
然后使用postman调用restAPI: 首先需要获取token(认证鉴权_文字识别 OCR_API参考_如何调用API_华为云),然后再调用通用文字识别,手写文字识别服务。
体验反馈:
1.手写文字识别不准,即使是用手写文字识别服务。咨询了官方,说是文字必须写的很工整,要求写字体尽量越接近正楷。。。。
2.因OpenHarmony开发使用的是c++,然而c++ sdk依赖了好几个库,暂时不知道该如何写GN,一起编译进来,目前只能使用OpenHarmony原生的libcurl来调用rest http接口
3.这个token返回,居然是从返回的header获取(认证鉴权_文字识别 OCR_API参考_如何调用API_华为云),目前还不知道如何使用libcurl调用。。。
百度云
文字识别服务:OCR文字识别_免费试用_图片转文字-百度AI开放平台
使用课程:百度云智教育
API文档说明:https://cloud.baidu.com/doc/OCR/s/1k3h7y3db
使用方式,仍然是先使用AK/SK调用获取token,然后使用token调用文字识别服务。我测试了通用文字识别(高精度版)这个服务
体验反馈:
1.比华为云稍准一些,但我手写的一个汉字,还是没识别出来。看样子确实写的太丑了。
2.撇开所谓安全不说,百度云的接口设计得更方便使用一些。一是体现在获取token接口得返回,那么token就是返回json的一个属性,不像华为云那样,把token放在header里返回。二是文字识别返回,识别的文字解析也很方便,而华为云的返回内容非常复杂。也许因为,我目前只使用libcurl+jsoncpp这些简单的c++类库调用,所以希望接口使用必须简单把
3.主页上写,支持私有化部署方案,离线识别SDK,但需要有企业认证,无法体验
阿里云
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)