补正[3] [3] 、堪称中文字母系统的S码B3级部件码 S码单笔画字母D型码,已可根治拼音同音字多,不便查字打字的毛病。GB2312的近七千字中,首次尾笔D型码与P型拼音组合的DP或PD 型音形码,没有超过十个同码字的组,同DP或PD码的字必在字典的一页范围内,故可见字知页查字,不需按翻页键打字,已够小学查字打字用。但不知字音的字或上万字的大字典,只靠单笔画字母的D型码或PD码,还不太便用。西文字典是单复笔字母同时用才查字打字性能好。所以要提高D型码性能,需要用进一批复笔字母。 但中文该用多少复笔字母,是哪些,则是个难解的问题。全国评出的11 个A类码没能解决这问题。最出名的郑码、五笔字型码用到两百多字根,曾红了一阵的北大陈氏表形码声称发现了中文字母体系,且曾被微软买去装进WINDOWS。教育部专门为中小学解决打字码问题成立9 2-6组推出的92-6码,也用到300多部件。S码曾在刊物上指明300 多个的字母的陈氏码、92-6码,两百多部件的五笔字型码,都太繁多难记难用。 S码认为,各国字母与中文字母,只宜是几十个特高频单复笔部件。而且S码已优选出了离散性等比上述各码更好的几十个单复笔部件的B3级中文字母体系。 为什么S码敢把几十个B3级部件叫中文字母系统呢?是因其性能有足以解决保护原汉字又可实现汉字拼音化与数码化的字母职能。虽然这体系的发现与发明艰难不便简便说 清楚,但外行也可不难看出其优秀超群的性能。就是可用前述的只看同音字最多的i音字的B3码就够证明名符其实。 著名的王氏五笔字型码是取前三末一部件编码,很多字还要加末笔字型交叉识别码,也只能把同码字减少达百分之几。而S码B3型前三末一码只千分之几同码,从i音字的的首次尾码[见下表已可看出,连一组同码的字都没有。 ● 简易好用的《康熙字典》速查版●续[4] [4]、S码的三级中文字母 上一节说B3码表堪称一种中文字母系统,只用i音国标一二级字连一组同码的字都没有来证明。其实还可以有其它简易办法,可看出其性能的优异性。外行也不难在网上搜索到海内外最著名的打字码,每字是用几位编码。不难知道多数是用前三末一位的四位码,有的是五位码,如台湾最有名的“仓颉码”就是五位。而上例S码是用的首次尾码的三位B3码就使同音字最多的i音国标一二级字连一组同码的字都没有。因此其它码在这一项指标上,最多只能赶上B3码与它持平,而不可能超越B3码,而似乎还没有赶上的公开材料可搜索到,只有还没公开的个别研究者,是否已达这水平,更不用说有能全面赶上的。 以上三节已简介了B1级的单笔画D型码,就跳到简介B3码,没提B2级码。因B2码是由B1码加入几个复笔部件当复笔字母,可使同码字再减少但只能小幅度而不能显著提高性能。需要加几十个复笔部件的B3级才能跃升更上一层楼,使同码字少到可盲打。因一旦加入复笔部件,就大大增加编码的复杂化,先只加几个复笔部件是为了以它们为例以便讲清复笔部件法的优化优选,突破其难点后才把复笔部件增加到B3级宜有的量。所以B2级是B1到B3级间的由浅入深的教学过渡级,实用是主要用B1、B3级。 B2级虽只由B1级加几类复笔部件而成,但主要是为解决B2、B3所需的多方面难点问题作一些准备。如中文该用多少复笔字母,是哪些,怎样取复笔部件都是混乩不堪的难题。又如海内外编码赛多项夺第一的郑码,不管今天规范笔顺把“夷”按字源拆为“大弓”两个部件编码,而王码五笔字型拆为“一弓人”三个字根再加末笔与字型交叉识别码。 又如多数码不管笔顺把“或”拆为“戈口一”编码,规一个右包围的特 殊字型特条款。规老王码还要再加末笔与字型交叉识别码,但其末笔不是规范笔顺的“点”而是倒数第二笔的“撇”笔。五笔字型86版就是因这类不合规范码太多,在1986 年全国第一次30 几个上机编码评测中落选。王码只好私下大力销售,虽打开了市场,但差评怨言也不少。如云南大学成人教育学院张教授,当时正在校内外教五笔字型码,就发现不合规范的太多,不好讲不好教不好用,提出了一些改进办法到处游说力图帮助王码的改进普及。张教授当时还专信约S码参加改进王码的游说,S码曾复信说不规范还不是王码的唯一弱点,以五笔为基干就必然离散性差,而不得不挖肉补疮加末笔与字型交叉识别码来减少同码字。若用较近单笔画码优选值的十笔,同码字可能大幅度减少,又可少用些部件而不需另加末笔与字型交叉识别码。可能把86老王码两百 字根,减到几十个范围内,像这里的B3码那样,既更简明又同码率更低。 S码没参加张教授的各地游说活动,但把相关建议发到了一些电脑刊该物上,如上海《计算机教学》、《中文信息》等。S码指出各码用的部件偏多。拆字取码不简明,字型分类繁多不善,如分什么全包围、左包围、右包围、上下型、左右形、杂合型之类各用多条不合笔顺的特殊规定,难学难教难记难用。建议不宜与小学教的国家规范笔顺冲突,只把单、复笔部件间关系看成三类来优选拆字取码编码法。 S码的三分类与复笔部件拆取码编码法要点为:单、复笔部件间关系只看成相离、粘连、穿插交叉[交叉型这三类,“三、川”各单笔画部件间关系是相离,“吕、回”中两个口形复笔部件也是互不交叉或粘连的相离型。“口”中各笔是两端点粘连,“中、也、”中各笔是相互穿插交叉关系,“井”中是两个各二笔的纵横复笔部件穿插交叉关系,或各笔间各有两点交叉的交叉型。 S码并约定,不从穿插交叉关系的结构中拆取复笔部件,只能依规范笔顺拆取与周围关系是相离或粘连的复笔部件。穿插交叉关系的结构中只能依规范笔顺拆取单笔画部件供编码用。这就找到了简明的不与笔顺规范冲突的复笔部件拆取法,根治了各著名码复笔部件拆取的繁乱顽疾。 “夷”被郑码拆为“大弓”与王码拆为“一弓人”,都不合笔顺被S码的“穿插交叉关系的结构中只能依规范笔顺拆取单笔画部件”约定排斥,该依“穿插交叉关系的结构中只能依规范笔顺拆取单笔画部件”的约定,依笔顺拆取单笔画编码,B2、B3型前三末一码为“夷474a”。“或”不必不管笔顺拆为“戈口一”再把倒二笔当末笔加末笔与字型交叉识别码,按B2、B3前三末一码为“或”4ot6。很多码把“回”拆为“口口”,既不合笔顺又必然造成“回、吕”同码而不得再加识别区分码。S码依笔顺与B2、B3码表编码的前三末一码为:“口o、吕oo、回uo4”,这样并不比加识别码或加特殊字型规定难,又不影响码长,又不破坏笔顺,同码字更少。上面的i音字B3型首次尾码就是这样取码编码的,连一个同码字也没有。可见B3码实用性与规范性的优良简便性能。 再以学贯中西的赵元任大师的《施氏食狮史……试释是事》独音字文为例,来看B3码性能达到怎样一个高度。赵老在谜中用了几十个shi[P4码音的同音字,不过只是GB2312字表中这音的同音字的一半。这音的同音字之多只恰上排名的前十。shi[P4码音的同音字约70个是一、二级字,它们B3型首次尾码见下表,表中就是按上述单、复笔拆字取码约定编码的,连一个同码字也没有,B3型的BP或PB码与加注体字汉字,完全破解了赵大师故意为难人的独音字文谜语。听起来都是SHISHI[或难区别的独音字文,在汉字数码化拼音化的P4B3型首次尾音形码中,是个个别鲜明有别的《xcgjL施、X9LL氏、x9aj食、x9j1狮、x17a史……》。破这谜对P4B3前三末一码来说,更是小菜一碟,杀鸡焉用牛刀。 以后王码被迫改进推出新版,S码曾信问张教授,是否已改好,复信说不规范的是改了很多,但增加了几十个部件,仍繁难不好教。我也只好对王码仍改进不善感到遗憾。上世纪90 年代初,S码收到王码十周年京庆会邀请信,免费食宿并另有赠品。S码是支持王码但建议改进的,因此没去京赴会。因若去再重弹不用五笔不用字型交叉码老调,岂不涉嫌去砸场,五笔没有了字型没有了五笔,岂不是五笔字型全没有了。 全国第一次手机编码会前,S码再次建议单笔画不宜只用五笔,稍后手机王码已加了个复笔字母键,某院士盛赞六键王码找到了汉字基因。隔行如隔山,物理院士这编码外行话情有可说能理解。但王码若停滞于这6键基因,就可能因基因缺失病不易成长壮大。感谢王码送上千万王码查字法字典给小学生,但比200多规范部首还多的新王码字根,不可能比拼音、规范部首、四角号码这中小学老三样查字法好用。反而可能被小学生嫌弃有损改革开放杰出贡献表彰对象100人的名声。不知王老还有否兴趣与精力,来主持试推S码B型新三样查字法,造福小学生。 B3级码及加注字,也希望相关志士来通力合作,从进入小学开始,革新注音识字查字打字的陈旧落后局面。
|