数学建模论文_基于深度学习和语言模型的印刷文字 OCR 系统 - matlab数学建模 - 谷速源码
下载频道> 资源分类> matlab源码> 数学建模> 数学建模论文_基于深度学习和语言模型的印刷文字 OCR 系统

标题:数学建模论文_基于深度学习和语言模型的印刷文字 OCR 系统
分享到:

所属分类: 数学建模 资源类型:文档 文件大小: 707.18 KB 上传时间: 2016-09-01 20:47:20 下载次数: 10 资源积分:1分 提 供 者: 源码共享 20160901084711998
内容:
摘要:我们设计了一系列的算法,完成了文字特征提取、文字定位等工作,并基于卷积神经网络 (CNN) 建立了字符识别模型,最后结合统计语言模型来提升效果,成功构建了一个完整的 OCR(光学字符识别) 系统。
       在特征提取方面,我们抛弃了传统的“边缘检测 + 腐蚀膨胀”的方法,基于一些基本假设,通过灰度聚类、图层分解、去噪等步骤,得到了良好的文字特征。这部分文字特征既可以用于第二步做文字定位,又可以直接输入到第三步的模型中进行识别,而不用做额外的特征提取工作。
在文字定位方面,我们通过邻近搜索的方法先整合特征碎片,得到了单行的文字特征,然后通过前后统计的方法将单行的文字切割为单个字符。测试表明,这种切割思路能够很好地应对中英文混排的文字切割。
       在光学识别方面,我们基于 CNN 的深度学习模型建立了单字识别模型,自行生成了 140 万的样本进行训练,最终得到了一个良好的单字识别模型,训练正确率为 99.7%,测试正确率为 92.1%,即便增大图片噪音到 15%,也能有 90% 左右的正确率。
       最后,为了在前面的工作的基础上再次提升效果,我们结合了语言模型,通过微信的数十万文本计算了常见汉字的转移概率矩阵,由 Viterbi 算法动态规划,得到最优的识别组合。
       将以上四部分工作结合起来,就是一个完整的 OCR 系统. 经过测试,我们的系统对印刷文字的识别有着不错的效果,可以作为电商、微信等平台的图片文字识别工具。
关键词: 光学字符识别, 特征提取, 文本定位, 卷积神经网络, 深度学习, 语言模型

文件列表(点击上边下载按钮,如果是垃圾文件请在下面评价差评或者投诉):

数学建模论文_基于数据挖掘技术的市财政收入分析预测模型主成分/
数学建模论文_基于数据挖掘技术的市财政收入分析预测模型主成分/www.gusucode.com.txt
数学建模论文_基于数据挖掘技术的市财政收入分析预测模型主成分/【谷速代码】-免费源码.url
数学建模论文_基于数据挖掘技术的市财政收入分析预测模型主成分/基于数据挖掘技术的市财政收入分析预测模型.pdf
数学建模论文_基于数据挖掘技术的市财政收入分析预测模型主成分/说明.txt

关键词: 数学建模 深度 模型

Top_arrow
回到顶部
联系方式| 版权声明| 招聘信息| 广告服务| 银行汇款| 法律顾问| 兼职技术| 付款方式| 关于我们|
网站客服网站客服 程序员兼职招聘 程序员兼职招聘
沪ICP备19040327号-3
公安备案号:沪公网安备 31011802003874号
库纳格流体控制系统(上海)有限公司 版权所有
Copyright © 1999-2014, GUSUCODE.COM, All Rights Reserved