卷积循环神经网络:卷积层(提取特征)、循环层(深度双向LSTM)、转录层(将RNN输出做softmax)
完整的端到端OCR流程
准备一张含有文字的原图;
对原图进行文字位置的检测,检测结果可能是水平矩形框,也可能是倾斜矩形框;
从原图中吧文字框对应的图片切下来,并旋转正,得到水平的文字块切片图;
对每个文字块切片图依次进行字符识别,每个切片图的识别结果汇总起来,就得到原图的文字识别结果。
因此完整的端到端OCR流程是:输入原图->文字检测->文字块切片->字符识别->识别结果汇总。
动手实践
本次案例下载地址
华为云ModelArts网址