丹青中英文文件辨识系统能快速地将大量文件资料转换成可编辑的文本文件。
加速辨公室的自动化,帮助一般的公司行号解决大量中英文印刷文件输入 (如剪报 、商业信息、技术文件…等)的负担,让使用者能以较低的成本 (不需专业的打字员即可操作) 在短时间内 (每分钟九千字),建立属于自己的情报系统。同时,也可帮助一般使用者快速地建立自己的数据库。
丹青中英文文件辨识系统能辨识的范围包括各式彩色、黑白、表格及非表格文件;能辨识的内容包括 繁体中文、简体中文、英文及阿拉伯数字。辨识后的文本文件所占的内存空间远较 未辨识前的影像档案小。在经过校对后即可储存成TXT、RTF、DOC、XLS、SLK、 CSV等各种档案格式,并且可以在一般的文字处理软件 (如小作家、MS Word、 Excel等) 中被开启和编辑。除此之外还可直接传送成电子邮件,或将档案以HTML 格式,透过网络浏览器(如Internet Explorer、Netscape Navigator等)直接开启。
影像扫描
可处理彩色、灰阶或黑白的文件影像。
倾斜校正:自动侦测文件影像倾斜角度,并提供旋转影像之功能。
辨识文件< 文件分析及辨识 >
自动辨识:轻按一钮,即可自动分析、辨识、校对影像文件,图文分离,并转换成可编辑的文件档案。
设定辨识字集:不需切换语文环境,即可辨识繁中、简中、纯英文及日文四种文件。
高辨识速率:在Pentium III 667MHz个人电脑环境下,每秒钟能辨识高达150个中文字。
多种字体辨识及重现:能够辨识多种印刷字体,如明体、黑体、仿宋体、楷书、圆体、隶书等,并在辨识后还原成原稿的字体。
原文重现编辑环境:可辨识各种表格及影像,辨识结果依照原文件的图文版面格式呈现,方便您校对、编辑,节省重新排版的时间。
< 自动校对与学习 >
再辨识功能:提供合/分字、合/分行、合/分区块、变更区块属性等再辨识功能,让您能够修正错误的辨识结果。
学习新字功能:可将易辨识错误的字元输入到学习资料库中,提高下次辨识之正确率。
候选字功能:提供原文影像供辨识后图文作校对,且针对型态相近之文字及语意上前后相连的字词提供候选字轻松更正辨识错误的文字。
自动校对:利用内建的常用词库自动校对辨识出的文字,并标示出辨识时所碰到的疑问字,节省您校对的时间。
输出档案
传送至其他应用软件:可将辨识结果直接传送至您所指定的应用软件中再处理,例如可设定辨识结果自动储存成HTML档案并直接传送至网络浏览器中。
可储存多种档案格式:辨识后的结果可储存成不同之档案格式,如TXT、RTF、DOC、XLS、SLK、CSV、HTML等,方便您做不同的应用与处理。
温馨提示:“如果根目录有CRACK或KeyGen文件夹则为破解或注册文件
本版新增“香港字集”及“快速输入”的功能。“香港字集”提供香港流通文件中特殊字的辨识;而“快速输入”则对常用标点符号或不易输入的文字提供快速输入的方法。