一、准备阶段
进入百度AI网址点击这里跳转 ,点击导航栏的开放能力 ---- 文字识别 ---- 通用文字识别,进入文字识别OCR界面。
在文字识别ORC界面点击技术文档进入帮助文档。
在左侧可以看到API文档 (介绍了相应的接口)、以及HTTP-SDK文档(介绍了不同的开发语言,描述百度文字识别接口服务的相关技术内容),我用的是Java语言,所以以下介绍这个了,其他语言可以自行看文档。
接下来就是下载相关jar包,可以点击这里下载。
这个jar包添加SDK工具包aip-java-sdk-version.jar和第三方依赖工具包json-0810.jar log4j-1.2.17.jar。
可以将下载的aip-java-sdk-version.zip解压后,复制到工程文件夹中。
也可以在Eclipse右键“工程 -> Properties -> Java Build Path -> Add JARs”。
如果要导入maven依赖得话:
<dependency><groupId>com.baidu.aip</groupId><artifactId>java-sdk</artifactId><version>${version}</version></dependency>
其中,version为版本号,添加完成后,用户就可以在工程中使用OCR Java SDK。其中版本号可在maven官网查询。
二、编码阶段
public class Sample {//设置APPID/AK/SKpublic static final String APP_ID = "你的 App ID";public static final String API_KEY = "你的 Api Key";public static final String SECRET_KEY = "你的 Secret Key";public static void main(String[] args) {// 初始化一个AipOcrAipOcr client = new AipOcr(APP_ID, API_KEY, SECRET_KEY);// 可选:设置网络连接参数client.setConnectionTimeoutInMillis(2000);client.setSocketTimeoutInMillis(60000);// 可选:设置代理服务器地址, http和socket二选一,或者均不设置client.setHttpProxy("proxy_host", proxy_port); // 设置http代理client.setSocketProxy("proxy_host", proxy_port); // 设置socket代理// 可选:设置log4j日志输出格式,若不设置,则使用默认配置// 也可以直接通过jvm启动参数设置此环境变量System.setProperty("aip.log4j.conf", "path/to/your/log4j.properties");// 调用接口String path = "test.jpg";JSONObject res = client.basicGeneral(path, new HashMap<String, String>());System.out.println(res.toString(2));}}
可以看到我们需要自己的APPID/AK/SK这时候就要回到百度Ai的官网创建我们自己的 APPID/AK/SK 。
点击右上角控制台 ,登录之后点击左侧 – 文字识别 – 进入应用列表创建一个应用。应用创建成功之后就会看到自己的 APPID/AK/SK 。
把这个 APPID/AK/SK 分别复制 一一对应 在上面 的代码中。path改成自己的本地的图片路径,就可以运行啦~~~
比如说我运行这个熊猫的表情包
执行结果如下图所示:
调用百度AI接口 实现图片识别文字就完成啦~
还有其他的识别接口比如说:身份证识别,车牌识别,在java文档中,自行观看吧~指路