尚书六号汉字表格识别系统最新版是一款实用超强的汉字表格识别工具,尚书六号汉字表格识别系统最新版可以对彩色、灰度图像文件直接进行识别,同时尚书六号完善了表格识别功能,极大的提高了文本设计的时间,对于制作电子表格等方面的应用都是非常方便的!
作为全球首家将手写输入应用到手持终端上的企业,汉王科技手写识别技术、OCR技术已达到国际领先水平
扫描图像文件。
建议在桌面上直接使用SCANWIZARD 5软件,注意将软件切换到高级工作模式。原因是这样能便于用户检查扫描仪工作时的分辨率。
可对多栏多段多行的版面进行自动分析,并且能够区分中文和英文
具有很强的自适应性,支持多平台授权。
对于一些文字稿件,中间有图片的时候,我们建议采用绕开的方式,进行识别区域的设定
推荐的扫描分辨率设定在300DPI,色彩模式可以是“RGB彩色”或者“灰阶”
可对实际拍摄的彩色或灰度文本图片进行识别
1. 扫描图像文件。
建议在桌面上直接使用SCANWIZARD 5软件,注意将软件切换到高级工作模式。原因是这样能便于用户检查扫描仪工作时的分辨率。
推荐的扫描分辨率设定在300DPI,色彩模式可以是“RGB彩色”或者“灰阶”。
选择“扫描到”的文件格式是TIF或者JPG两者都可以。将扫描的文件存在用户确定的目录下面。
2. 打开尚书六号读取扫描好的图像文件。
3. 被识别图片的预处理。
这部分工作,主要包括:倾斜校正、设定正确的识别区域。
倾斜校正过程,如图所示,按下工具栏的最下面的一个工具。
按下“图像倾斜校正”工具后,会出现如下的对话窗口:
此时按下“是”按狃。系统就给予图片做水平的倾斜校正,做完后,结果如下:
注意,自动倾斜校正功能,只能对原稿做+-2.8度的倾角的校正,如果原稿的倾斜角度大于2.8度,系统会建议用户重新扫描稿件,以提高识别率。
如何正确设定识别区域,这是一个值得用户注意的地方:
如下的“海尔”一文,实际是分成两个栏目,进行阅读的,所以我们在设定识别区域的时候,注意需要将这个特点表现出来,需要设定两个识别区域,如图所示。
对于一些文字稿件,中间有图片的时候,我们建议采用绕开的方式,进行识别区域的设定,如下图:
对于表格类的图片,为了将标题栏也能识别进去,我们建议采用如下的识别区域设定,特点是表格部分必须整个框选,同时标题作为一个单独的框选区域。
4. 开始进行识别
在开始“识别”的时候,注意识别的软件的设定值是否正确,默认值如下:
5. 识别校对完成后,存盘格式的选择文件保存的类型有四种,建议一般文本的识别,用户选择TXT格式。
如果是表格识别,识别结果请选择“CSV”格式,用EXCEL能够打开。