灵云人工智能论坛

 找回密码
 立即注册
搜索
查看: 4255|回复: 0

OCR的5.2.8android&5.2.0java版本(完整) [复制链接]

lyric 非 VIP 会员 

Rank: 5Rank: 5

最佳写手 特殊贡献 终极会员 智多星 小助手 新人进步(竖)

发表于 2017-6-4 20:27:31 |显示全部楼层
OCR5.2.8android&5.2.0java版本(ocr.jpg图片,ocr.cloud.chinese能力不能用,识别效果不好,本地能力缺少so包,图片格式五个问题)

1.      官网上Ocr5.2.8版本sdk中的OCR_Example填好accountinfo后直接运行出现如下错误

                              

这是图片缺失错误,找到代码定位imageFile,最后发现代码会去assets目录下根据名为ocr.jpg的图片进行识别,而官网上没有,你只需要用你想识别的图片改名为ocr.jpg放在assts下就可解决。

2.      再次运行,如下截图,得到结果如右图,识别率非常差,


   

3.      通过查看开发文档,发现这是因为系统默认很多参数是针对拍照照片

于是在代码中我们在版面分析hciOcrLayoutAnalysis和识别Recog中修改添加了倾斜矫正,版面分析,图片类型,二值化进行设置。


4.      识别效果如图1非常准确,但是同样的配置,修改能力为asr.cloud.chinese后却运行不了,后发现该能力可能为第三方能力,有点问题,现在不能使用。

5.      云端能力可以,现在来试一下本地能力,报如下错误

6.      这是加载dll资源包功能失败错误,我们通过日志查找,真机测试,由于可读写权限等原因,有时候会转移日志位置,不在sdcard位置,而在mnt-shell-emulated-0-程序包名

7.      通过日志查找发现少了libhci_ocr_local_recog.so在sdk的lib下拷一个过来即可

8.      本地能力识别效果与云端能力一样准确,但是测试一张原始文本图片时发现报ocr本地引擎进程失败或者版面分析失败。以此推测原始图片可能由于留边留白问题,对原始图片进行截图,截不同大小和留边均识别很好。可见版面和引擎没什么问题,最终尝试发现同样的文字,版面不影响的情况下,是原始图片是tiff格式的问题,正常接收jpg和png格式的图片。

  

9.      针对一些有特殊格式的,还有图片,字母,数字交错排列,识别率不能像普通文本那么好,需要制定模板识别。



附件: 你需要登录才可以下载或查看附件。没有帐号?立即注册
踩过的脚印

举报

您需要登录后才可以回帖 登录 | 立即注册

Archiver|任务|灵云 ( 京ICP证030095号 )

GMT+8, 2020-12-4 21:29 , Processed in 0.070976 second(s), 20 queries .

Powered by Discuz! X2

© 2001-2011 Comsenz Inc.

回顶部