汉字拼写化(或称罗马化、拉丁化)方案之cao版 作者:曹信江,手机&微信15867800962,QQ &E-Mail:157361662@qq.com,欢迎交流。 为节省大家时间,这是一个方案的简介,全文详见《汉字拼写化方案之cao版》。 以下是本方案的简述: 1、以现代汉语和简化字为基础,拉丁化后,所有的说话声音与当前完全一样,仅在容易引起歧义的字、词、语法方面进行调整。古代汉字的字形、字义的源流演变供参考,繁体字供参考。。。。坚决杜绝这种情况,有声母没韵母,声音无法响亮地发出的,如英文中的tom,but,right,left,等等,本人对这些无法响亮发音的字词深恶痛绝。另外,发音难的,嘟噜音,吐舌咬舌音,不在正常语言中使用。 2、基本构字方法采用与“形声字”类似的“音形”拼法,即以拼音+形部,字可组词。完整的罗马化(拉丁化)汉字的构成采用: “拼音(声母+韵母+音调)+形部+修饰性标识(可选)”形式。方块汉字是单音节字,汉字大约415种拼音,算上四声音调,大约1600个不同的音,而汉字总数量很大,常用字也在3000个以上,因此同音字多,作为单节字,汉字的读音是不够用的,通过类似形声字的“拼音+形部”的方法,即可区分绝大部分同音字,发生碰撞的,可通过双(多形部)及修饰性标识区分。 汉字多音字也很多,通过多音字的拼音自然分立,也不再是问题。即,仅仅通过“拼音(声母+韵母+音调)+形部”的形式,即可创设与现行方块汉字接近一一对应的拼音汉字,并且既表音,也表义,发音与拼写标准,对应性好,易学易用。 汉字的一字多义的情况也很多,通过对字义、词性、语法等等的修饰,即可区分(简化字中有些将不同的字用笔划少的代替,可以重新分立)。 只有拼音部分发音,形部和修饰性标识不发音,只在书面文字中体现。修饰性标识应统一规定并由字典固定,并明确哪些必须标识,哪些可由作者自定是否标识,大多数情况下不用标识,主要在想避免歧义时标识。对于最简单的字,或可当作形部使用的字,为元初字,可不用形部,或作特殊规定。 拼音部分就用现行的拼音方案,即“声母+韵母+音调”形式,仅做小的调整(音调可以用现行的横、提、勾、捺的形式,也可以用1、2、3、4表示四声调写在拼音的后面,但轻声要改,不写表省略,备用于高频字)。轻声改为在韵母上加小圈(或其他方案),韵母上无声调符号时为省略,用于高频字的简写,此方案为备用。 改革现行字母表,创设新的字母。 沿用现行的英文字母,作一些改革。对于大小写字母字形相同或相似的(如Cc,Kk,Pp,Ss,Vv,Ww,Xx,Zz等)作小的修改,并与常用符号、数字、其他字母系统等均相区别,一种可行的方案是在大写字母内加一点,具体方案过程中定。字母Oo与数字0易混,字母O的大小写内部加笔划区分,可选方案为小写的内部加7形笔划,大写的内部加L形笔画。字母I,i,L,l与数字1字形易混,改造字母的字形,其他的易混的也要改,如X与乘号、叉号易混,改造字母字形。可创设新字母,但并非最迫切。 4、简写。按文字使用频率,这是提高汉字效率的重要方法。 使用频率最高的,用一个字母简写,通常在某个字母开头的字中选择使用频率最高的字,用首字母代替。比如高频的字的、一、是、了、我,分别用 d 、y 、s 、l 、w表示,是否大写,综合研究后再定,也可以规定大、小写的单个均可定为简写。如果这样,则表示字母本身时反而需要加某种简要的标识,以表示并非高频字简写,而是字母本身,具体方案需过程中综合比选,主要看是否会与其他方案产生冲突和歧义。 单字母若在文中为高频字的简写,则字母本身需用符号标明是字母,比如用单引号括起来,或其他方案。如何不造成混淆,需要再研究。 次高频的,用 “拼音(声母+韵母(省略音调))”形式 简写。 双声母,本人估计双字母的应用有较大可能弊大于利。 再次高频的,“声母+韵+声调”。 再其次,写全字,即“拼音(声母+韵母+音调)+形部(+修饰性标识)”。 高频的简写方案需在定义单字的基础上,试用一下,看是否会引起歧义、冲突、记忆量增加或其他问题。 5、形部。形部即相当于现代汉语中的偏旁部首,为表示某一类或与某类事物相关的意思。现代汉语中意义明确的部首,一般直接沿用(或研究一套按另外规则分类的形部);意义不明确的,另行研究。可以在现代知识体系的基础上,创设新的形部。高频使用的,用单个大写字母,次高频的,用多个字母,首字母大写,形部的高频,既要考虑形部本身的使用频率,又要考虑在文章中的含相关形部的字的使用频率(即加权频率)、还要考虑因简码写法造成的对频率的影响,需综合考虑。形部首字母大写,即形部同时用作分界。
修饰性标识。相当于版本号,1、可用于汉字向拼音文字转化中冲突的情况,2、可用于一字多义的情况,可用于表示从属的类别。 7、组词或短语。字可组词或短语,这涉及语法问题。综合考虑 词性、词类、构词方法(经济发展、发展经济、确定目标(确定的目标,确定一个目标),负负得正,错误,失败,几个词构词法不同。),主动、被动,主语、宾语,阴、阳、广义、狭义、中性,褒义、贬义,省略,倒装,宾语前置(如,发展经济,经济发展),方向、次序、从属范围与范围的次序(从局部向整体、或从整体向局部,如年月日时分秒或秒/分/时/日/月/年)、反语,时态,单数复数,复杂长语句,从句,组词或词组的修饰关系,省略,倒装、层次,语法构词的不同关系。组词,可以对构词法进行修饰,词义、词性、从属类别进行修饰。。。汉语中的级别标识有些易乱,一、二、三级,A、B、C级,究竟数字小是好还是坏,不同的领域是不同的,应作统一的原则。 修饰性标识一般为非强制性的,用于防止歧义时用。 主宾、阴阳、词性等也可以直接修饰,具体方案另定。
其他问题 创设新的标点符号,以利更丰富并精确地表达,应形象、简单。也可考虑采用现行键盘中的符号组合,便于书写和录入。 创设表层次的符号,可用空心单引号,或其他方案。例如:‘余秋雨解读《道德经》’的100个错误,余秋雨解读‘《道德经》的100个错误’。 创设重音符号,可选方案为,下面加点。 分隔符,用于可能造成混乱时用。 重点,印刷体可用下划波浪线、不同颜色、加粗字体,可用一种或几种组合等表示,手写用下划波浪线表示。 多个句号可用于分隔相关性略小的同一自然段的文字(例如:甲。。。乙。。。); 组词问题。字可以象现在汉字一样组词,组词其实类似外语中的“字根+前后缀”的构字法,但汉语的组词相当于每个字都可以看作是字根或前后缀,所以汉字的组词远远比外语的丰富,是巨大的优势,但构词法太过灵活,歧义多。构词法可以采用符号或字母进行修饰。两字词最多,字的首字母是否大写需过程中综合考虑。高频的双字词,可简写为每个字的首字母,但需注意与双字母的单字拼音混淆问题(在创设不发音的声母后,混淆问题会较小,需具体过程中研究),见前面的简码部分。组词的字之间连写不空格,不同的词之间加空格。词的多义性、词性、构词方法等,可用修饰性标识区分。可用户自定义。 为区分拼音与形部、修饰性标识等,对于可能造成歧义的,形部的首字母或修饰性标识首字母可大写,或使用分隔符。 同音字自动分立。但是否应设一个简易的标志用于表示其来源于汉字的同音字,过程中研究。 易混的字,可增设新字,如飞机的机,受,授,买,卖,中、终,进,禁,沽(居然有“买”、“卖”两个完全相反的意思),纳(有“接受”和“收入、放进”、“缴付”接近相反的意思),夕、曦,等等,权利,权力,其实总体的不算多。特殊处理。很常用的词,产生读音相同的,强制规定组词时的读音的改变,如权力和权利,可改权利读音为权利(音里)。 强调的字词句,重点,书面加修饰,具体方案另定,印刷体可考虑采用粗体、彩色、下划波浪线,手写可采用下划波浪线。 重音。谁从北京来?我从北京来。创设新的符号。 很多现有的形声字很容易确定罗马化(拉丁化)的字,例如,清,笋,杆,草,花,河,等等,现有的字如果是独体字的,或难以确定形部声部的,确定罗马化(拉丁化)的字,应过程中研究,根据其具体情况,可能需要专门设计形部的类种。也可能产生碰撞,例如,做、作,任、仁、人,伟、伪,携、撷,江、浆,看、瞰,捍,撼,等等,具体过程中研究处理方案。 新兴科技或行业常用词新增单字或简语,以利表达,如人工智能,计算机,物种、基因、蛋白质、有机化合物、星名等各种命名规则可另定。 译名和外来语的问题,另行研究。科学技术用词、如物种命名,化学式,数学公式等,化学元素,可沿用。外语中有些汉字不用的音,可用组合字母的方法,备用于翻译,如,dl可用于表示嘟噜音。外文翻译规则另定。各民族文字也可与本方互相参考借鉴。 古字、古音、偏僻字问题,保留,同样的规则,但因不常用,可用稍长的拼写、修饰性标识等。 简语的问题,另行研究。 分隔符的使用,用于可能产生歧义歧解的地方。 大写字母,采用原英文字母的,继续沿用,新创的字母,大小写字母相近并明显区别,不得与现行数字、符号、字母系统相混淆。 各种个体名字,如人名,地名,国名,网名,公司名,机构组织名,某个小狗小猫的名字,可用单引号括起来,或另定方案。个体的名字的表面含义可能与实际完全不同,所以应予以提示,例如把一只猫起名叫‘狗狗’,把一只狗偏偏叫‘阿猫’,网名叫‘我也不知道我是谁’,台风的名字叫‘烟花’,星名叫‘祖冲之’、计算机品牌叫“苹果”等等。 9、字的数量的宏观估计, 新字的创设,必须非常谨慎,慎之又慎。。。。人名、地名、公司名、译名等,要求必须以现有汉字的形式起名(不合规定者不予登记),不能任意拼写,否则单是新的各种名字的拼写就会形成巨量的新字。
总结。现在,回过头看前文所说的本方案的特点: 规则统一,与现代汉语对应性较好,几乎可一一对应,读音完全相同,并保留四声音调,完全继承汉字拼音方案(含四声调),继承汉字的形声字造字法(汉字的象形、会意、指事造字法也很好,但拼写化方案难以继承),并解决了方块字形声字不规范、不表音调的问题,拼写化汉字以拼音替代了声部,以拼写化形部替代了偏旁部首,既表音,又表义,规则统一。完全继承全部汉字及读音,仅仅改方块字为拼写化字。 简洁,简单易学,规则统一,拼音部分不用学,只需学记几十上百形部的拼写,即可读、可写、可用。 精确,本方案既表音,又表义,读音无歧、形部表义、修饰性标识区分。 丰富,汉字本身就可灵活应用,每个字可作前缀、后缀、字根,通过词或短词的简单修饰,避免歧义。 高效,高频字可简写。 易扩展,拼写化汉字极易扩展,反而需要特别约束,在新兴科技领域可更易应用。 本方案,避免了前文中提到的关于英文的问题(不规则变化、读音与拼写不一致、发音困难的音存在并高频、极多有声母没韵母无法响亮发音等),也避免了汉字的问题(形状复杂,笔画多,不表音,形声字不规则、不表音调,彻底解决多音字问题,彻底解决多义字问题,彻底解决同音字多的问题,解决组词歧义问题(通过字、词的义、词性、语法的修饰),解决句子歧义问题(通过表层次符号)、并保留了汉字字正腔圆、四声音调、发音响亮清晰的优点,吸收了拼音文字的易书写的优点,吸收了世界语规则统一的优点,对中国人来说,学习、转换的成本极低。拼音本来就人人就会,不需要学习,只需学记几十上百个形部的拼法,就已经能读能写能用了。按上述方案制定拼写化汉字,可使现有的所有白话文、古文、文言文、经史子集、诗词歌赋等几乎无损地转译为拼写化汉字,计算机批量处理也很简单。 声调是一个独立的变量,应该明标声调,汉字很多的多音字,通过声调的变化,演变出相关但不同的字义,如,中,种,少,背,称,倒,和,啊,分,为,量,数,作,差,好,难,看,干,发,应,待,更,要,兴,等等,还有,买,卖。另外如诗,识,试(与谥碰撞),形部相同,可以通过声调区分。 但本质上是要创造一种全新、标准、精确、高效、表达力生动形象、丰富多彩、优美、易学、适用广泛、既相对稳定又便于扩展的语言,是一种人造语言。 如果不用拼音字方案,仍然采用现行的方块字。。。
一个重要问题:拼音字和方块字是否可混用????。。。。 我觉得可以采取一个这样的折中方案:过渡期后,保留100~500个方块字,最好是笔画简单、包括各种典型的造字法(如象形、会意、指事、形声等)的字,允许永久使用、与拼写法汉字混用,并要求必须在某种数量或比例上混用,以此让中国人记得,中国的文字的根是方块字。 在此方案基础上,集合语言专家,经过充分讨论、对比、研究、取舍,可以创设完美的罗马化(拉丁化)汉字。 作者:曹信江,saga2411387,15867800962,QQ &E-Mail:157361662@qq.com,有兴趣或问题可以交流讨论,拍砖也行。 2022年2月7日
|