本文介绍文字识别软件和识别技巧,本文为个人使用心得,并非转载
首先介绍扫描是被软件:扫描识别软件用得较多和效果较好得有
ABBYY.Finereader,Readiris.Pro,尚书七号
前两个是世界最大的识别软件厂商
使用数码相机照相或者扫描仪扫描的图片的识别技巧:
用数码相机照的图片要提高识别率必须先做好以下几点:
1 照相时采用微距
2 纸张要放平
3 光线要良好
4 一定要拍正 排出的照片不能倾斜
5 一次选择拍照的文本不要太多,控制在200-300字左右就可以了
如果源文本字大又清晰,则可以选择400-500字
如果是扫描仪:
1 直接使用256灰度记忆可以了,因为文字识别并不考虑文字的颜色
2 纸张放正
拍完后或扫描后上传到电脑后的照片要做以下处理来提高识别率:
1 如果照片较暗 适当增加一些亮度
2 增加部分对比度,对比度提高有助于提高识别率,
3 如果照片上文字倾斜,适当调整,把相片调正
总体要求就是要求文字突出,并且不倾斜
不同软件对于不同对比度的图片识别率均有所变化
经过多张图片(报纸,杂志)扫描并识别,以上软件的表现依次为:
单张图片识别 ABBYY 识别率最高,尚书七号识别率次之 ,Readiris差一点
批量识别ABBYY也比Readiris要好一些,尚书七号不支持批量识别
多国语言识别英文ABBYY和Readiris差不多,其他语言未测试,尚书七号不支持多国语言识别
照片效果越好,文字越大识别率越高,但是总是难免偶尔也会有那么几个字识别错误
使用以下方法,可以得到最高的识别率,基本上只要文字清晰,识别率是100%
用相机拍照,适当亮度对比度处理后,把图片放大到文字很清晰的大小,使用
ABBYY.Finereader的Screenshot Reader直接屏幕识别功能进行识别,
照片效果较好时,识别率为100%,
使用Screenshot Reader选择画面时尽量只把需识别文字选进去,其他的空白部分不要选
照片的文字放大到清楚就可以了,太小或太大都影响识别效果.
以上是个人的一点实践经验,希望对大家有帮助
该文转摘www.goutuizi.com详细参考以上网站.