一文搞懂文本识别、银行卡识别、通用卡证识别、身份证识别

  查看华为开发者联盟网站的机器学习服务业务介绍(https://developer.huawei.com/consumer/cn/doc/development/HMS-Guides/ml-introduction-4)

  可以看到华为HMS把机器学习服务分成了文本类、语言类、图片类、人脸人体类四大服务,后面新特性也在不断增加中,其中有一类是文本类服务,文本类服务里面又含了文本识别、文档识别、身份证识别、银行卡识别、通用卡证识别,这些子服务之间都有哪些差异和关联呢,可能很多小伙伴会傻傻分不清,今天小编重点剖析下文本类服务,来看下这几个子服务间的差异和关联。

2 应用场景差异

首先看下文本类服务包含的子服务内容和对应的场景差异

服务 场景差异 说明
文本识别   稀疏的文本,收据、名片   支持的识别范围和场景"广",啥都能识别,只要是拉丁字符、日韩、中英的文字都可以识别。  
文档识别   含有文档的密集文本图片,比如文章、合同等   需要识别出带段落格式的文本信息,此处需要借助云端的运算能力,有更加广泛的语言种类支持能力。  
身份证识别   中国大陆二代身份证识别   支持的识别范围和场景很”专“,只识别大陆身份证,准确率高。  
银行卡识别   全球常见的银行卡(银联、运通、万事达、Visa、JCB)卡号等关键信息识别   支持的识别范围和场景很”专“,只识别银行卡,准确率高。  
通用卡证识别   任意固定板式的卡证,比如会员卡、通行证、工卡等   支持和识别范围和场景介于文本识别和身份证、银行卡识别之间,只要是卡证都可以进行识别。  
文本类服务SDK有设备端API和云侧API接口两种,      

设备端的API只在设备端进行处理和分析,使用的是设备自身CPU、GPU等器件的算力,云端的API则需要把数据送到云端,利用云端的服务器资源进行处理和分析,以上服务除了文档识别由于计算量较大需要在云端进行处理外,其他服务均有设备端API,本次为了简化分析的范围,我们只讲设备端API服务部分。

2.1 场景对比总结

通过以上对比表格我们可以看到,不同能力对应的应用场景是有所不同的:

2.1.1 文本识别:更像是一个全科考生,上知天文下知地理,只要是文本,都可以识别。

文本识别使用场景


文本识别服务本身不提供界面,界面由开发者实现

2.1.2 身份证识别、银行卡识别:更像是一个偏科生,其它不会,只会某一科,但这一科学的极好。
  针对身份证、银行卡提供了缺省的定制框,直接对准框就可以快速进行身份证、银行卡号的提取和识别。

 银行卡识别校准界面


在这里插入图片描述

2.1.3 通用卡证:则介于以上两类中间,在某一领域有一定的造诣,横向广度和纵向深度都处于中间位置。
  可以对所有的卡证进行文本类识别,同时提供了卡证类的对准框,提示用户对准待识别的卡证。

通用卡证识别校准界面

2.2 该怎么选

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zwjwyg.html