●中文查字法的优选例●
●中文查字法的优选例● 2016年夏,《纽约时报》借美国莫大伟发新书的时机采访访了他,莫大伟重复他旧文《中文真TM难》 的看法,甚至认为中文难严重妨碍了中国的软实力。莫大伟说中文没西文那样简明的字母系统,查字难等。 其实汉字中虽然没有西文那样显性的字母系统,但也隐含有相当于西文字母那样的高频构字部件。把它们揭示出来,也可像西文字母一样好查字。莫氏难题不是汉字内在问题,是人们重视与分析研究不够的误解。 上世纪末,北大陈氏表形码,声称发现了汉字的字母体系。他把自定的一种框架下 300多个汉字部件,叫汉字的表形字母。虽是一家之言的字母创新探索,但与字母似乎还不太靠谱。字母必须是特高频构字部件。若只看某种形是一类把众多低频部件也定为字母,则字母数量太多,字母职能性作用不强意义不大。俄文等30几个字母,英文20几个字母,日文假名50,字母宜是几十个的数量级,多了难记难用,少了离散性不够,实用意义不大。 中易私塾圣理码(S码)从构字频度、编码的离散性、便记便用性等多个角度,对汉字结构进行了大量的分解与分析归纳,得出了10 几个到1百多部件的多级形码,其中部件数量在几十个范围内的D、Q、C三套普及类形码,当成中文字母看也许较宜,可供进一步比较筛选应用参考,它们已可根治汉字难查的顽疾。 (1)单笔画码查字法 单笔画元件必然是各种文字的基本字母,但只靠单笔画是不够千百万文字相互区分的要求,必然要用进一些由单笔画组合成的复笔部件当字母,如西文字母一二三笔的ILSZ、TtX、FHY等。因此S码首先对汉字的单笔画元件体系进行了大量的分解与分析归纳,确定了单笔画的种类数量,兼顾离散性、便记便用性等该有个优选值,这极值宜约8-12种。 林语堂大师的上下形检字法把单笔画分为30几种,每种用两位数作代码,过于繁细。内地最流行的横竖撇点折五笔形,又太粗略离散性不好。王永民五笔字型码,就是从五笔出发,发现离散性不够,又分为五类的两笔组合,得到25组双笔结构, 每组各用一字母作代码,得出25个字母的体系。5笔好记但25组就不那么好记,名为25个字母每字4位字母码,实为8位数码,但查字打字8码偏长,且离散性不够,只好又挖肉疮规定几种字型补充“末笔字型交叉识别码”,把体系变繁。虽然五笔字型码占了内地流行的形码榜首,但八位五笔码没能解决查字打字问题而默默无闻,就是因其基础的五笔太粗略。古人书法讲解也嫌五笔太粗略,才又出个永字八法。显然查字打字码基础的单笔画,宜约8-12种。在全国第一次编码评测中,北师大李金凯教授的8类笔形8位的笔形码,是被评为全国11个A类编码中唯一的笔形码。同次参评的30几个编码中的王永民五笔码落选,是有其道理的。台湾中易网校的戚桐欣先生的永字八法码,北京郑张先生的单笔画十个数码等,也当属进入优秀笔形码范围。古人已发现五种单笔画连书法描述都嫌太粗略,才又盛行永字八法,还要注重码长同码率的查字编码,当然8笔比五笔更宜。 北大中文论坛“语言文字漫谈”上,我《中文字典排序检索法民选摸底游戏》一帖中提出,现在中小学教的老三样查字法都不好,大家来为小学一年级推荐宜讲用的好的查字法前十,再评出前三去淘汰老三样。我作为样例推荐力一个戚老永字八法码,希望以此为例来推出前十。但十个月来2页十几层楼中,不但没出现前十,连第二个推荐的也没有。不知是北大中文论坛上的谦虚还是海内外真没有更好的查字法,希望这中国语言文字论坛上能解决这难题,或去北大中文论坛上这帖中探讨。这帖网址为:http://www.pkucn.com/forum.php?mod=viewthread&tid=354328&pid=1219157308&page=1&extra=#pid1219157308
页:
[1]