查看华为开发者联盟网站的机器学习服务业务介绍(https://developer.huawei.com/consumer/cn/doc/development/HMS-Guides/ml-introduction-4)
可以看到华为HMS把机器学习服务分成了文本类、语言类、图片类、人脸人体类四大服务,后面新特性也在不断增加中,其中有一类是文本类服务,文本类服务里面又含了文本识别、文档识别、身份证识别、银行卡识别、通用卡证识别,这些子服务之间都有哪些差异和关联呢,可能很多小伙伴会傻傻分不清,今天小编重点剖析下文本类服务,来看下这几个子服务间的差异和关联。
2 应用场景差异首先看下文本类服务包含的子服务内容和对应的场景差异
服务 场景差异 说明文本识别 稀疏的文本,收据、名片 支持的识别范围和场景"广",啥都能识别,只要是拉丁字符、日韩、中英的文字都可以识别。
文档识别 含有文档的密集文本图片,比如文章、合同等 需要识别出带段落格式的文本信息,此处需要借助云端的运算能力,有更加广泛的语言种类支持能力。
身份证识别 中国大陆二代身份证识别 支持的识别范围和场景很”专“,只识别大陆身份证,准确率高。
银行卡识别 全球常见的银行卡(银联、运通、万事达、Visa、JCB)卡号等关键信息识别 支持的识别范围和场景很”专“,只识别银行卡,准确率高。
通用卡证识别 任意固定板式的卡证,比如会员卡、通行证、工卡等 支持和识别范围和场景介于文本识别和身份证、银行卡识别之间,只要是卡证都可以进行识别。
文本类服务SDK有设备端API和云侧API接口两种,
设备端的API只在设备端进行处理和分析,使用的是设备自身CPU、GPU等器件的算力,云端的API则需要把数据送到云端,利用云端的服务器资源进行处理和分析,以上服务除了文档识别由于计算量较大需要在云端进行处理外,其他服务均有设备端API,本次为了简化分析的范围,我们只讲设备端API服务部分。
2.1 场景对比总结通过以上对比表格我们可以看到,不同能力对应的应用场景是有所不同的:
2.1.1 文本识别:更像是一个全科考生,上知天文下知地理,只要是文本,都可以识别。
2.1.2 身份证识别、银行卡识别:更像是一个偏科生,其它不会,只会某一科,但这一科学的极好。
针对身份证、银行卡提供了缺省的定制框,直接对准框就可以快速进行身份证、银行卡号的提取和识别。
2.1.3 通用卡证:则介于以上两类中间,在某一领域有一定的造诣,横向广度和纵向深度都处于中间位置。
可以对所有的卡证进行文本类识别,同时提供了卡证类的对准框,提示用户对准待识别的卡证。