第一千一百零六章 跑程序(2/3)
片,然后对胶片进行扫描。这样做也是为了提高效率,大批量拍摄制片,然后集中扫描胶卷,远比只能一张字卡一张字卡读取,读一张起码需要二十秒时间的平板扫描仪,快了无数倍。将字卡胶片放入扫描仪,柳工开始操作软件,也就是大家最常说的“跑程序”。很快,终端屏幕上就出现了进程LOG,提示扫描仪工作的每一步。旁边的一台终端上,周至调出各个程序的监控调试画面,让一行过来的老同志们,能够看到工作的进展。第一步工作是扫描,将图形化的文字扫入待识别区。第二步工作是字根匹配,寻找到文字所用的字根,再将字根转化成对应的标准黑体字根。第三步工作是结字结构匹配,根据相应字体的结字规则,将文字字根的相应位置标志成数字坐标。第四步工作是将黑体矢量化标准字根和结字规则结合运算起来,构成新的矢量文字。第五步是给准备新入库的矢量字进行偏旁部首等多种标签定义,便与后续统计分析等工作使用。最后就是编码,根据新文字的标签定义,通过编码算法,给它赋予一个唯一的UNICODE编码,再根据编码的码位将新字存入字库,工作便算是完成了。过程中遇到BUG是很正常的,不过周至和柳工都是高手,分分钟就将程序调整好,让过程能够继续。辜开来名义上是工作组组长,但是之前都是把握大进度大方向,这还是第一次亲眼看着一个文字,一步步从写在字卡上“跑”到字库里,不由得倍感新奇。就连他都觉得神奇,更别说冷玉龙和韦一心两位老师兄了。周至打开文本编辑软件,切换到瀚文输入法:“现在我们的字库里就有刚刚入库的(木舟)字,两位师兄来试试?”“我来。”冷玉龙兴奋地说着,坐到周至让出的座位上,输入了NAN三个字母,在输入法的选字框上一阵翻,在最后发现了(木舟)字,一敲数字索引号,(木舟)字就跳到了屏幕上。”“哈哈哈哈……”冷玉龙很高兴:“原来字库就是这样搞出来的呀!”“这只是工作原理,我们只能在自定义区里玩玩,验证验证可行性而已。”周至笑道:“具体的实际工作,要遵循严格的软件工程管理规章制度,流程手续很多的。”“这不是耽误事儿吗?现在就能用了啊。”冷玉龙对这样的做法有些不解。“没有工艺文件,不符合国际标准,我们的产品就没法申请国际专利,别人就可以随便伸手抢夺。”周