中国语言文字论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

只需一步,快速开始

搜索
查看: 2716|回复: 0

●中文查字法的优选例●

[复制链接]

125

主题

602

帖子

2130

积分

金牌会员

Rank: 6Rank: 6

积分
2130
发表于 2017-2-1 22:58:03 | 显示全部楼层 |阅读模式
                    ●中文查字法的优选例●
     2016年夏,《纽约时报》借美国莫大伟发新书的时机采访访了他,莫大伟重复他旧文《中文真TM难》 的看法,甚至认为中文难严重妨碍了中国的软实力。莫大伟说中文没西文那样简明的字母系统,查字难等。
        其实汉字中虽然没有西文那样显性的字母系统,但也隐含有相当于西文字母那样的高频构字部件。把它们揭示出来,也可像西文字母一样好查字。莫氏难题不是汉字内在问题,是人们重视与分析研究不够的误解。
        上世纪末,北大陈氏表形码,声称发现了汉字的字母体系。他把自定的一种框架下 300多个汉字部件,叫汉字的表形字母。虽是一家之言的字母创新探索,但与字母似乎还不太靠谱。字母必须是特高频构字部件。若只看某种形是一类把众多低频部件也定为字母,则字母数量太多,字母职能性作用不强意义不大。俄文等30几个字母,英文20几个字母,日文假名50,字母宜是几十个的数量级,多了难记难用,少了离散性不够,实用意义不大。
        中易私塾圣理码(S码)从构字频度、编码的离散性、便记便用性等多个角度,对汉字结构进行了大量的分解与分析归纳,得出了10 几个到1百多部件的多级形码,其中部件数量在几十个范围内的DQC三套普及类形码,当成中文字母看也许较宜,可供进一步比较筛选应用参考,它们已可根治汉字难查的顽疾。
                       1)  单笔画码查字法
        单笔画元件必然是各种文字的基本字母,但只靠单笔画是不够千百万文字相互区分的要求,必然要用进一些由单笔画组合成的复笔部件当字母,如西文字母一二三笔的ILSZTtXFHY等。因此S码首先对汉字的单笔画元件体系进行了大量的分解与分析归纳,确定了单笔画的种类数量,兼顾离散性、便记便用性等该有个优选值,这极值宜约8-12种。
        林语堂大师的上下形检字法把单笔画分为30几种,每种用两位数作代码,过于繁细。内地最流行的横竖撇点折五笔形,又太粗略离散性不好。王永民五笔字型码,就是从五笔出发,发现离散性不够,又分为五类的两笔组合,得到25组双笔结构, 每组各用一字母作代码,得出25个字母的体系。5笔好记但25组就不那么好记,名为25个字母每字4位字母码,实为8位数码,但查字打字8码偏长,且离散性不够,只好又挖肉疮规定几种字型补充“末笔字型交叉识别码”,把体系变繁。虽然五笔字型码占了内地流行的形码榜首,但八位五笔码没能解决查字打字问题而默默无闻,就是因其基础的五笔太粗略。古人书法讲解也嫌五笔太粗略,才又出个永字八法。显然查字打字码基础的单笔画,宜约8-12种。在全国第一次编码评测中,北师大李金凯教授的8类笔形8位的笔形码,是被评为全国11A类编码中唯一的笔形码。同次参评的30几个编码中的王永民五笔码落选,是有其道理的。台湾中易网校的戚桐欣先生的永字八法码,北京郑张先生的单笔画十个数码等,也当属进入优秀笔形码范围。古人已发现五种单笔画连书法描述都嫌太粗略,才又盛行永字八法,还要注重码长同码率的查字编码,当然8笔比五笔更宜。
         北大中文论坛“语言文字漫谈”上,我《中文字典排序检索法民选摸底游戏》一帖中提出,现在中小学教的老三样查字法都不好,大家来为小学一年级推荐宜讲用的好的查字法前十,再评出前三去淘汰老三样。我作为样例推荐力一个戚老永字八法码,希望以此为例来推出前十。但十个月来2页十几层楼中,不但没出现前十,连第二个推荐的也没有。不知是北大中文论坛上的谦虚还是海内外真没有更好的查字法,希望这中国语言文字论坛上能解决这难题,或去北大中文论坛上这帖中探讨。这帖网址为:


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|中国语言文字论坛

GMT+8, 2024-12-23 02:34 , Processed in 0.046012 second(s), 23 queries .

快速回复 返回顶部 返回列表