方正电子承担“当代人名地名用字搜集与整理”工作 明年10月将完成 各领域系统升级可识生僻字
法制晚报讯(记者 马晓晴)一些人由于名字里带有生僻字,买火车票、办身份证、申领社保卡等均无法正确显示全名。到银行取钱都要被反复核实身份,耗费很多时间。
近日,《法制晚报》记者从北大方正电子有限公司(以下简称“方正电子”)获悉,该公司将承担“中华字库”中第17包“当代人名地名用字搜集与整理”工作,将收集人口信息中约3000个未编码的生僻字。该项目预计在明年10月完成,可有效解决用生僻字取名无法录入、显示的问题。
困扰 名字为乱码 难领社保卡
市民刚女士的名字中,带有一个“ ”(yan,三声)字。多年来,她办理火车票、飞机票都无法正确显示全名,“电脑打出来的是问号、方块,或者干脆是乱码。”因为电脑“不识字”,工作两年的她至今未能申领到社保卡,只能自费看病。
由于无法在支付宝上完成实名认证,刚女士用不了滴滴、快滴等打车软件,就连抢到的红包都提不了现金。记者在商务印书馆出版的第10版《新华字典》中,查到了这个“ ”字。词条解释为人名用字,是五代时期南汉的刘 为自己造的字。
刚女士说,父母为她起名时用这个“ ”字,是取“飞龙在天”的寓意,“他们真没想到会给我带来这么多麻烦”。
解决 3000生僻字 明年完成编码
生僻字取名带来的问题有望得到解决,记者近日从方正电子获悉,该公司将承担“中华字库”中第17包“当代人名地名用字搜集与整理”和第20包“字库制作一:中间字库、宋体楷体等成果字库”项目,预计在2016年10月完成。
方正电子字库业务部副总经理黄学钧介绍,“中华字库”工程于2011年启动,共分为28个包,近30家高校、科研院所和企业参与了研发工作。方正电子负责的第17包,将收集人口信息中约3000个未编码的生僻字,将“中华字库”中的汉字总量扩充到7万余个。
第20包将制作完成包含30万字的宋体、楷体成果字库以及7万多字的压缩字库,可满足我国各民族古今各类文献的出版印刷、数字化处理和传输的需要。
刚女士名字中的“ ”字,在家用电脑上可以打出,但在社保和银行的系统中无法显示。黄学钧解释说,只要是电脑里能打出的字,都是被编码过的,“也就是已经收入字库了”。
他分析认为,可能一些单位的数据库没有升级,还是用的老字库,所以显示不了“ ”字,“只要升级系统、更新字库就没问题了”。他提到,“中华字库”中的每个字都有对应的编码,“相当于门牌号”,如“ ”字的编码为“4DAE”。
黄学钧表示,生僻字的搜集范围应在公安、民政、教育、邮政、测绘、银行等领域中选取,但必须包含公安和民政部门。“我们完成项目后,也会积极向银行、社保、医疗、教育等领域推广,帮助单位、企业升级字库系统,解决生僻字带来的烦恼。”
[责任编辑:杨永青]