Java集成第三方OCR识别——文档篇

Java集成第三方OCR识别——文档篇,第1张

Java快速集成OCR文字识别
  • 相关文章
  • 简介
  • 官方文档
  • Web 配置 *** 作
    • 第一步:成为百度AI开放平台的开发者
    • 第二步:开通文字识别服务
      • 1. 领取免费测试资源
      • 2. 创建应用
    • 第三步:使用文字识别服务
      • 1. 添加OCR依赖
      • 2. 下载相关工具包
      • 3. 手写文字识别
      • 4. 获取access_token
    • 第四步:测试
  • 第五步:监控报表
  • 结束

相关文章

Java集成第三方OCR识别 ——代码篇

简介

文字识别OCR(Optical Character Recognition)提供多场景、多语种、高精度的文字检测与识别服务,多项ICDAR指标居世界第一。广泛适用于金融服务、财税报销、法律政务、保险医疗、快递物流、交通出行、教育培训等场景,显著提升信息提取和录入效率,实现信息处理的“电子化”、“自动化”,助力企业加快数字化建设和智能化升级。

官方文档

https://cloud.baidu.com/doc/OCR/s/fk3h7xu7h

Web 配置 *** 作 第一步:成为百度AI开放平台的开发者

要调用百度AI开放平台的文字识别能力先要成为百度AI开放平台的开发者,首先让我们花5分钟来注册百度AI开放平台的开发者。

先点击注册百度账户,进入如下图的页面快速地建立一个百度账号。

第二步:开通文字识别服务 1. 领取免费测试资源

点击登录 文字识别控制台,找到「领取免费资源」按钮。


根据您的需求选择相应的文字识别接口,选择完成后点击「0元领取」,领取免费测试资源。

2. 创建应用

领取完免费测试资源后,您需要创建应用才可正式调用文字识别能力。

进入 文字识别控制台,点击 「创建应用」。


需要,填写完毕相应信息后,点击「立即创建」,即可完成应用的创建。应用创建完毕后,您可以点击左侧导航中的「应用列表」,进行应用查看。

然后就能看到创建完的应用 API KEY 以及 Secret KEY 了。以上两个信息是您应用实际开发的主要凭证,每个应用之间各不相同,请您妥善保管。

第三步:使用文字识别服务 1. 添加OCR依赖
		<dependency>
            <groupId>com.google.code.gson</groupId>
            <artifactId>gson</artifactId>
            <version>2.8.6</version>
        </dependency>

        <dependency>
            <groupId>com.baidu.aip</groupId>
            <artifactId>java-sdk</artifactId>
            <version>4.16.7</version>
        </dependency>
2. 下载相关工具包
  • FileUtil
    https://ai.baidu.com/file/658A35ABAB2D404FBF903F64D47C1F72
  • Base64Util
    https://ai.baidu.com/file/C8D81F3301E24D2892968F09AE1AD6E2
  • HttpUtil
    https://ai.baidu.com/file/544D677F5D4E4F17B4122FBD60DB82B3
  • GsonUtils
    https://ai.baidu.com/file/470B3ACCA3FE43788B5A963BF0B625F3
3. 手写文字识别

注:这里以手写文字识别为例

package com.baidu.ai.aip;

import com.baidu.ai.aip.utils.Base64Util;
import com.baidu.ai.aip.utils.FileUtil;
import com.baidu.ai.aip.utils.HttpUtil;

import java.net.URLEncoder;

/**
* 手写文字识别
*/
public class Handwriting {

    public static String handwriting(String picture) {

            String url = "https://aip.baidubce.com/rest/2.0/ocr/v1/handwriting";
            try {
                String filePath = picture;
                byte[] imgData = FileUtil.readFileByBytes(filePath);
                String imgStr = Base64Util.encode(imgData);
                String imgParam = URLEncoder.encode(imgStr, "UTF-8");
                String param = "image=" + imgParam;
                // 注意这里仅为了简化编码每一次请求都去获取access_token,线上环境access_token有过期时间, 客户端可自行缓存,过期后重新获取。
                String accessToken = AuthService.getAuth();
                String result = HttpUtil.post(url, accessToken, param);
                System.out.println(result);
                return result;
            } catch (Exception e) {
                e.printStackTrace();
            }
            return null;
        }

        public static void main(String[] args) {
            Handwriting.handwriting("D:\1493859062306177024.jpg");
        }
    }
}

access_token 通过API Key和Secret Key获取的access_token

4. 获取access_token

package com.baidu.ai.aip.auth;

import org.json.JSONObject;

import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
import java.util.List;
import java.util.Map;

/**
 * 获取token类
 */
public class AuthService {

    /**
     * 获取权限token
     * @return 返回示例:
     * {
     * "access_token": "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567",
     * "expires_in": 2592000
     * }
     */
    public static String getAuth() {
        // 官网获取的 API Key 更新为你注册的
        String clientId = "*******************";
        // 官网获取的 Secret Key 更新为你注册的
        String clientSecret = "*******************";
        return getAuth(clientId, clientSecret);
    }

    /**
     * 获取API访问token
     * 该token有一定的有效期,需要自行管理,当失效时需重新获取.
     * @param ak - 百度云官网获取的 API Key
     * @param sk - 百度云官网获取的 Secret Key
     * @return assess_token 示例:
     * "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567"
     */
    public static String getAuth(String ak, String sk) {
        // 获取token地址
        String authHost = "https://aip.baidubce.com/oauth/2.0/token?";
        String getAccessTokenUrl = authHost
                // 1. grant_type为固定参数
                + "grant_type=client_credentials"
                // 2. 官网获取的 API Key
                + "&client_id=" + ak
                // 3. 官网获取的 Secret Key
                + "&client_secret=" + sk;
        try {
            URL realUrl = new URL(getAccessTokenUrl);
            // 打开和URL之间的连接
            HttpURLConnection connection = (HttpURLConnection) realUrl.openConnection();
            connection.setRequestMethod("GET");
            connection.connect();
            // 获取所有响应头字段
            Map<String, List<String>> map = connection.getHeaderFields();
            // 遍历所有的响应头字段
            for (String key : map.keySet()) {
                System.err.println(key + "--->" + map.get(key));
            }
            // 定义 BufferedReader输入流来读取URL的响应
            BufferedReader in = new BufferedReader(new InputStreamReader(connection.getInputStream()));
            String result = "";
            String line;
            while ((line = in.readLine()) != null) {
                result += line;
            }
            /**
             * 返回结果示例
             */
            System.err.println("result:" + result);
            JSONObject jsonObject = new JSONObject(result);
            String access_token = jsonObject.getString("access_token");
            return access_token;
        } catch (Exception e) {
            System.err.printf("获取token失败!");
            e.printStackTrace(System.err);
        }
        return null;
    }

}
第四步:测试
  • 识别图片

  • 获取access_token

  • 识别文字

第五步:监控报表
在管理控制台可查看流量情况

结束

这样我们 使用Java实现第三方OCR识别功能就完成了,小伙伴们可以稍作修改,集成到各自的项目里,博主已经将自己集成的项目放在上方了,小伙伴们可自己下载安装。另外都已经看了这么久就关注博主和博主一起学习吧!

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/langs/785899.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-04
下一篇 2022-05-04

发表评论

登录后才能评论

评论列表(0条)

保存