清华紫光OCR官方版是一款专业优秀的图像识别工具。清华紫光OCR最新版能够直接将图片信息提取出来,支持从TIF、BMP和PCX图片格式中读取文字内容。清华紫光OCR软件还支持简/繁体中文、英文和手写中英文,可以快速完成识别,识别率、准确率都十分的高。
清华紫光OCR软件功能
清华紫光OCR支持Windows环境下的GB、BIG5、JIS和Shift-JIS等多种内码。在印刷体汉字识别中还加入了MMX优化技术,使识别速度得到了很大提高。我们用它识别一页A4大小的印刷体中英文混排的纯文本文件,只用了几秒钟。而且识别率非常高,只有极个别的字出现了差错。
在这个版本中新增了表格识别功能。选择了识别表格的选项后,它会自动将表格的框线先识别出来,再对表格中的文字进行识别。文字全部识别出来之后会将文字按原样恢复到表格中。在这项测试中识别率也很不错。但是在测试中我们的工程师发现,当文字与表格的框线距离较近时,它的识别效果就没有那么理想了。
如果用户想对一个图文混排的文件进行识别,则清华紫光OCR还具有版面自动分析功能。它自动对扫描的版面进行分析,把应识别的文字区域划分出来,之后进行识别。对于被划分区域内的文字有很高的识别率,而且速度同样很快。不过遗憾的是,在这个版本中没有提供版面自动恢复的功能,因此如果想把文件恢复成原来的版面,则还需要重新手动排版。
它的导出功能可以将带有表格的文当导出成为RTF格式的文件,从而允许用户在Word等应用程序中继续进行编辑。它还可以将扫描进来的图像格式转换成TIFF、BMP或PCZ等格式,具有很大的灵活性。
它的批量识别功能可以让用户一次把多页文稿全部扫描之后再进行识别,避免了扫描一页识别一页带来的麻烦。这一版本最多可实现10000页的批量识别。
该版本还增加了一项非常实用的功能,就是手写体的识别。有了这一功能,许多以前手写的信件或文件就可以扫描到计算机中,识别出来后用电子文档的方式进行保存了。
不过目前的手写体识别功能还不够完全成熟,它对书写有很高的要求,如每个字之间要有一定的间隔,不能有连笔的情况等。尽管如此,手写体识别这一功能还是能够在一定程度上减轻文字录入工作的负担。
该OCR还具有自学习功能,当遇到有生僻字时,可以通过键盘输入进行学习。有了这一功能,用户就可以自由地添加一些本来不“认识”的字,大大拓宽了中文OCR系统的识别字符集。
清华紫光这一款专业版的OCR软件,不仅可以对纯文本文件进行识别,而且可以进行复杂的图文混排和图表文档的识别,最大限度地把人们从繁杂的文字再录入的工作中解脱出来。
清华紫光OCR软件特色
1、识别率高、速度快:对于被划分区域内的文字有很高的识别率,而且速度同样很快。
2、导出功能:可以将带有表格的文当导出成为RTF格式的文件,从而允许用户在Word等应用程序中继续进行编辑。
3、版面自动分析:对图文混排的文件具有版面自动分析功能,它自动对扫描的版面进行分析,把应识别的文字区域划分出来,之后进行识别。
4、转换图像格式:将扫描进来的图像格式转换成TIFF、BMP或PCZ等格式,具有很大的灵活性。
5、批量识别:可以让用户一次把多页文稿全部扫描之后再进行识别,避免了扫描一页识别一页带来的麻烦,这一版本最多可实现10000页的批量识别。
6、手写体识别:手写的信件或文件就可以扫描到计算机中,识别出来后用电子文档的方式进行保存。
7、自学习:当遇到有生僻字时,可以通过键盘输入进行学习,用户就可以自由地添加一些本来不“认识”的字,大大拓宽了中文OCR系统的识别字符集。
8、汉字和英文混排、日文和英文混排、韩文和英文混排同时识别。
9、是唯一可以识别2万多汉字的多体文字识别系统,汉字识别国内最优。
10、支持多种环境接口。文通TH-OCR支持WINDOWS环境和GB、BIG5、GBK、JIS、 SHIFT-JIS和KSC等多种内码,适合全球各个地区使用。TH-OCR还具有自学习功能,不论什么生僻字,都可以通过键盘输入进行学习,大大拓宽了OCR系统的识别字符集。
清华紫光OCR使用方法
1.文件->打开,选择要识别的文件,可以是tif、bmp、jpg格式的
2.命令->识别,会自动识别的
3.识别完成后,软件左边的树状栏里会有图像文件名,用鼠标点开哪个加号,就是识别后的文本文件
4.单击它,软件右边上方是识别后的文本,下方是被识别的图像文件
5.这时用键盘移动光标,就能查看图像和对应文本,并能直接改动文本
6.二值图像就是只有黑白两色的图像,用windows自带的画图软件就能做出来
7.先用画图打开图像,图像->属性,将颜色改成黑白,再存盘就得到二值图像了
清华紫光OCR更新日志
1.修复若干bug;
2.优化细节问题;
点击下载图形软件 >>本地高速下载
点击下载图形软件 >>本地高速下载