中华魂兮 发表于 2020-10-27 20:33:42

●为什么中文TMD如此难的的破解●

               ●为什么中文TMD如此难的的破解●   美国汉学家M博士在答纽约记者问时,重复了他在《为什么中文它妈的如此难》一文中的观点,说中文太繁难落后,影响中国软实力。这断言其实是长期盛行国内外的一种半对半误会。若不及时破除这些误会,的确会有损中国文化软实力和复兴。                  1、M博士指出的中文查字问题      M博士文中说,中文没有西语那样简明的字母系统,而且这书写系统“不太与其发音对应”,难学难查字打字……分为八节的M氏文中的第五节,专门说到查字:五. 因为连在字典里查一个字都很复杂查字典的难度都基本等于在文秘专业学一个学期。在台湾的时候我听说有时还有初中生查字典比赛。我花了一年时间才能比较顺利的在字典中找到任何汉字。而直到今天,我极偶尔还是会遇到即使查个十分钟还是查不到的汉字。
    查陌生汉字的时候还有一种四角系统的查法。有谣言说这方法很迅速,……我没见过谁能第一次就找到正确的编码……显然、《新华字典》有过的拼音、部首、四角号码这三种查法,也是中小学教的老三样查字法,全被M博士判定为难查。它们远不如西文好查,这是事实。          2、正在争鸣的笔形码查字致力于探索汉字注音识字查字打字好教好学好用的三易书院三易码(S码、三峡码、54码),多年前曾在北大中文论坛上,发起一个破解M氏查字难的“中文查字法优选前十、评选前三”活动。以高雄戚桐欣永字八法码与桂林潘氏码为例,希望再推荐八个。然后从这十个中,评出前三,去取代不好查字的老三样查字法。但很多个月过去了,直到北大中文论坛长眠不醒。没人推荐出比戚、潘码更好的查法。今年4月,S码再度在中国语言文字论坛上,发了下帖:●来为中小学推荐优选革新老三样查字法的新查字法● - 语文课堂 - 中国语言文字论坛http://yuyannet.com/thread-1446-1-1.html   帖中仍以戚、潘码为例。半年已过,仍没有更好的查字法出现。于是S码又于今年10月在百度贴吧【输入法吧】发了这文,网址为:百度贴吧, 2020-10-4●查字打字的三易码简介●。https://tieba.baidu.com/p/6997769026?pid=135432902574&cid=0&red_tag=3213945243#135432902574其下第4楼,网友红猫2蓝兔说:您这种用笔画打字或查字的方法,与国家的统一标准不相符。笔画类输入法国家是有统一标准的,那就是不论汉字有多少种笔画都必须归并为五类,具体每种笔画归属于哪一类也有十分明确的规定,任何以笔画输入依据的输入法,不论取笔画顺序是否按书写顺序,也不论是单笔画还是笔画组合取码,都必须遵循这个强制标准。国内的任何一个公司做的笔画输入法都符合此规定,以前像老摩托罗拉手机那种把笔画分到8个键的输入法已经强制淘汰了。笔画查字法的发明人是民国名人陈立夫先生,与笔画查字法同期出现的一种更“先进”的四角号码查字法,则是当时任商务印书馆馆长王云五先生。十分感谢红蓝君对这课题的关注,但一棍子打死戚、潘、S码中的笔形码,则值得商榷。欢迎大家先对笔形码各抒己见。这对“中文查字法推荐前十,评选前三”是至关重要的。                  3、笔形码与单笔中文字母

jhz001 发表于 2020-10-28 16:56:41



北大中文论坛长眠不醒,的确苦了不少年长的坛友。

中华魂兮 发表于 2020-11-1 10:53:07

             ● 从同音字最多的i音字看查字打字码●(答网友“红猫2蓝兔”)
百度贴吧【输入法吧】中,三易码(S码)的《查字打字的三易码简介》一文,说到几种约十类单笔画的S码。其下的第3楼,网友“红猫2蓝兔”复帖中说:“您这种用笔画打字或查字的方法,与国家的统一标准不相符。笔画类输入法国家是有统一标准的,那就是不论汉字有多少种笔画都必须归并为五类,具体每种笔画归属于哪一类也有十分明确的规定,任何以笔画输入依据的输入法,不论取笔画顺序是否按书写顺序,也不论是单笔画还是笔画组合取码,都必须遵循这个强制标准”。
    S码中早已有过五类笔形的D00码,在与9类笔形的D0码、13类笔形的D1码对比后,发现D1、D0码比D00码性能好得多,因此淘汰了D00码,向学前班推荐教D0码,向小学一册推荐教D1码.。现在简介五类笔形的D00码与13类笔形的D1码的一种对比法。
    拼音码因同音字多,不便像西文查字那样可见字页,打字要频繁按翻页键在同音字中找需要的那字。因此S码有不管字音不用按翻页键找字的单笔画B1码(D0、D1码)等。
国标GB2312字表的近7千字中,同音字最多的i音节,有上百个同音字。若这些i音字按五种笔形的单笔画D00码表各取首尾码,凡首尾D00码相同的就集中在同一组(同一行),就得出如下的21行(21组)编码表。

首尾D00码的21行(21组)码中,只3组没有同码字,这3组字及其首尾码分别是:峄11、一4、乙7。它们约占21组中十分之一组,或占这上百字的3%,其它占90%的字都有同码字。拼音也是90%的字都有同码字(同音字)。因此、五笔首尾码的同码字区分效率,字集码离散率,与拼音码相近,都属低等级码。
D00首尾码为96的首码是撇笔9、尾码是点与捺的6,有如下13个同码字:“逸迤镱移臆铱依佚嶷仪胰疑役”。而《新华字典》之类的小字典,每页约十个字头,这13个字可能分散在两页中。查字定页性能不好。要能像西文查字那样见字页,就需要查字码没有超过十个同码字的组。电脑与手机打字,还宜用没有超过5个同码字的组的体系。因此S码不用同码字多的五笔码,探索能见字知页查字、不用按翻页键便小学一册用的单笔画码。
从D00首尾码为96的13个同码字 “逸迤镱移臆铱依佚嶷仪胰疑役”中,可以看出,要首码为撇笔9、尾码6不出现十个同码字的组,撇笔不易再分为明显的两类, 而宋体字的点、捺较易分为区别仂较明显的点与捺两类。因此要首尾码为96的组的同码字少于10个,不便再细分撇笔而较便打挤在一起的点与捺笔。把们各用相互不同的代码,就可不出现超过十个同码字的组。所以S码D1型单笔画码中,乾脆把不区分点与捺的五笔码,改为点6、斜捺A、平捺S这样三个小类。就消灭了 这13个同码字的96点与组。这点捺组变为如下的96、9a、9a三个小组:
1、

中华魂兮 发表于 2020-11-1 10:59:46

从D00首尾码为96的13个同码字 “逸迤镱移臆铱依佚嶷仪胰疑役”中,可以看出,要首码为撇笔9、尾码6不出现十个同码字的组,撇笔不易再分为明显的两类, 而宋体字的点、捺较易分为区别仂较明显的点与捺两类。因此要首尾码为96的组的同码字少于10个,不便再细分撇笔而较便打挤在一起的点与捺笔。把们各用相互不同的代码,就可不出现超过十个同码字的组。所以S码D1型单笔画码中,乾脆把不区分点与捺的五笔码,改为点6、斜捺A、平捺S这样三个小类。就消灭了 这13个同码字的96点与组。这点捺组变为如下的96、9a、9a三个小组:1、 镱96移96臆962、 铱9a依9a佚9a嶷9a仪9a胰9a疑9a役9a3、 逸9s迤9s已没有十个同码字的组,但仍有个起过5个的斜9a组“铱9a依9a佚9a嶷9a仪9a胰9a疑9a役9a”。已不可能由笔形分类解决,只疽由增加码位或加进复笔部件或用进音码辅助的形声码、音形码之类编码法来改善查字打字性能。       因此、网友“红猫2蓝兔”复帖中说“不论汉字有多少种笔画都必须归并为五类”的论断和依据的标准,值得大家再作精益求精的探讨。 http://yuyannet.com/data/attachment/album/202011/01/105450es4z3mqlzemqczmq.png
页: [1]
查看完整版本: ●为什么中文TMD如此难的的破解●