现有的语音学是基于西方无调语言创立的,许多理论都不适合有调语言,西方语言中的变音在拼写中只是作为变读来处理,并没有系统的拼调方法,只是在变读的字母上下加符号,因为他们是无调语言变音较少,这种权宜之计也能凑合,但这种方法用到有调语言上比如越南语,效果并不理想。我国的《汉语拼音方案》也采用这种方法,书写麻烦不必说,快速阅读理解不可能,且文字缺乏形象性,相似形太多,严格地说《汉语拼音方案》的拼式根本就不像文字。由于一直以来受无调语言语音学的局限,人们没有认识到“拼调”是有调语言拼音不同于无调语言的方式。直到迈阿密大学的语言学家对有调语言的调查研究公诸于世,以及香港朱晓农教授近年在中国人民大学出版社出版的《语言学》中指出:“国外的语言学基本理论是在欧洲的语音基础上建立的,并为认识欧洲及同类语音而服务的。它对具有声调、发声态,尤其是既有声调又有发声态的音系,那就无能为力了。”“因为过去的框架是在欧洲语言的基础上建立的,他们的语音比较简单,以调音为主,碰到声调就很麻烦,碰到发声态就更不知所云了,要是一大群语音系统中有发声态兼声调,那就是最困难的了。……那么是什么问题需要重新考虑语音学的基本理论呢?主要是进近来的一系列发现使得建立新的基本理论成为必须。”有调语言拼音的研究才得以正名。 重庆市葛遂元先生的文章:《中西语音结构差别对语文的影响》(载香港《语文建设通讯》35期、1992年3月。第33-40页)中说:“单音节多音词是由词末辅音或连缀的辅音即复辅音(如speaks中的sp和ks)造成的。现代汉语中没有词末辅音(除个别鼻韵外)与复辅音,因此没有单音节多音词,西方语言则有。所以单音节单音词与单音节多音词是中西语言的关键区别,它对中西语言文字特点起到了根本的影响。西方复元音不像汉语复元音复合得那样干脆,不便判断是一个音还是两个音,西方不划分单音节单音词与单音节多音词有其语言特点方面的原因,但要说明中西语言文字异同与各自特点,以及要概括世界语言规律,就不能局限于只套用西方语言学,否则就会认为中国话不像话,只有学舌西方了。” 这表明早在上世纪90年代就有学者认为,西方语音学的诸多规则不符合东方语言的特点。科学的证明大概是在2016年美国每日科学网站1月23日登载的迈阿密大学语言学家的调查研究文章“气候影响人类语言发展”,调查了3700多种语言,发现有629种是有调语言,它们分布在地球气候湿润的地带(当然讲的是人类语言形成时期的情况,而不完全是现在)。生活在干燥草原的游牧民族,很难发出抑扬顿挫的声音,因而他们的语言由较平滑的多音节构成,生活在湿润地带的农耕民族,能够发出抑扬顿挫的有调语音,因而他们发育了有调语言,他们的“音元”显然多于游牧民族。以汉语为例,配调以后汉语的1200多个不同单音就能区别早期人类的概念,因而汉语的单音节具有给语素分类的意义,最终发育出“语素拼义、归类表述”的现代汉语。用多音素组合区分概念与用单音配声调区分概念是无调语言与有调语言的根本区别。所以有调语言的拼音必须立足于拼写带声调的单音语素。
首先,要认识到有调语言的拼音形式是不同于无调语言的拼音形式。声调字母是有调语言的拼音字母,它是管拼调的,重要性高于其它拼音字母,声调必需在拼式中有明确的标识,使其有利于整体认读。因而除了有拼调字母外在字形上还应有所区别,这样就不会陷入《汉语拼音方案》那种纯音文的相似形,比如《施氏食狮史》全都是shi 。用设计无调语言、音素语言文字的方法来设计有调语言、语素语言的文字,这就是现行《汉语拼音方案》既不能快速阅读又不能完整表达汉语的根本原因。汉语要实现拉丁化就不仅要有语音表达的拉丁化,还要有语义表达的拉丁化。印欧语的词性大多在语音上有反映,汉语没有,但汉语的大多数单用字还是有词性的,新编的《汉英词典》都有汉字的词性标注。拉丁汉语用词性调符字母在表声调的同时兼表语素的词性,以及韵母变式表抽象义,专有名词开头大写等,就是汉语语义表达拉丁化的尝试。 汉语语音、语义表达拉丁化举例: 汉字是讲究“切音”的,wn 就是“巫恩切”,fn就是“佛恩切”汉字是讲究声调的,汉字是有词性的,拉丁汉语的表示方法用名词调符 k 放在声母与韵母之间表示名词第二声调,是最简洁的了:wkn=文,fkn=坟,重要的是这种表示方法通用于所有类似的拼音形式。拼音汉字不是没有元音而是在有的情况下省写元音 wn=wen ,同理,jn=jian(基恩切),qn=qian(期恩切),xn=xian(希恩切),用形容词调符r 放在声母前表示形容词第一声调就有 rjn(尖),rqn(谦),rxn(鲜)。三个辅音字母就能表达:语音含声调、词性、词义、字形这么多信息,这在其他语言文字中不多见。 对比: 拉丁汉语 英语 wkn character fkn grave rjn solid rqn modest rxn fresh 在上例中,表达同样的意义,英语比拉丁汉语用字母平均多一倍且词性标志不明显,这就是有调语素语言的优势,因为它的音元多。 无调语言语音学对有调语言拼音研究的干扰 : 1、有调语言大多是单音节语言,以汉语为例,除了个别零声母以外,大多数汉语语素都是由声母和韵母拼音而成,它们发一个音。ok 在汉语里不算相拼是发两个单音的,而在无调语言的英语里只算一个音节,甚至asks也只算一个音节,无调语言语音学承认这种现象是拼音,而带声调字母的有调语言拼音却被认为是不符合语音学。 2、无调语言语音学不承认拼调字母是拼音字母,认为它没有参与拼音,只承认附加在字母上下的变音符号。把有调语言的调当成变音处理,而有调语言的声调已经改变了整个音节的读音,使音节表示完全不同的语素分类,更重要的是,汉语的声调几乎无处不在。由于在无调语言语音学的指导下,《汉语拼音方案》被设计成“变音表示大集会”,完全不能胜任表达汉语。 3、汉语的字以单音节为语音单位,存在“切音”规律,即可以用两个字的音来确定另一个字的音。无调语言没有这种规律,现在的(无调语言)语音学也没有反映这种语音现象。在其指导下的《汉语拼音方案》也没有反映这一汉语规律。 4、汉语的单音节有给语素分类的作用,而无调语言没有这种功能,《汉语拼音方案》完全抹杀了汉语语素。 5、无调语言存在一字母多音,一音多字母现象,从而破坏了拼音规则的一致性。比如: 史无前例的 unprecedented [Λn’prεsIdεntId] 没有总统的 unpresidented [Λn’prεzId∂ntId] e和i不同却都读[I],有时e又读[ε]或[∂],前者c读后者s又读[z]。难怪特朗普总统拼错了。(见澳大利亚2017.9.18.“对话网站“文章,作者:菲利普.萨金特)。而有调语言的汉语拼写基本没有这种现象,拉丁汉语更符合拼音规则一致性原则。因而,正如朱晓农教授指出的那样,建立新的能反映全人类语音规律的语音学理论成为必要。世界上有629种语言是有调语言,由于使用有调语言的东亚、东南亚人口众多,几乎占了半壁江山。 汉字沉淀了中国五千年厚重的历史文化,“奴”“偶”“劇”这些字都有历史故事。但是人类文化发展到了用词语语音表达的阶段,文字只是语言的“视觉编码”,人们已不再需要通过文字的象形形体来理解语义。尽管vku中看不到汉字“哭”的两只眼睛,但人们仍然能理解那是“哭”,人们是通过拼出读音来理解的,其中v是动词调符,放在字首表示动词第一声调,就表达了“哭”。因而理解汉语最好的方法是通过能表达语音、词性的字母,然而它必须是有调语言的拼音形式,而不是无调语言的拼音形式;必须是语素语言的拼音形式带有语义的信息,而不是单纯表音的音素语言的拼音形式。也就是说,并不要求百分之百是音素字母拼,可以有表音节的字母,可以利用汉语的切音规律以简化拼式,但却不可以随意省去拼调字母,因为这既是语音元素又是为表词义而增加的词性信息。拼式表达的是汉语的语素,既是表达概念的汉字又是表达语音的拼式。而不是像英语单词那样不讲求语素组义的囫囵的多音词。也不是像方块汉字那样与语音无关囫囵的形体。用拉丁字母按字的音、义组成字代替要囫囵记忆的汉字;用表示基本概念的字组成单词代替要囫囵记忆的英文单词。这是拉丁汉语与上述两种文字的主要区别。 汉语多音节词的词义早已突破了单音节语素的局限,它用语素拼义表达新概念时有一个语义再创造的拼义过程,有丰富的表现力。汉语特有的语素拼义造词方式,是汉语对人类语言的重大贡献,它能利用已有的知识、概念建立起与新概念的联系,甚至对新概念进行分类。比如“DNA”,看不出英语与原有概念的联系,它并非是横空出世与已有概念无关的概念,而是存在于细胞染色体上的生物体遗传基本单位。汉语用“基因”表示,定义与DNA相同,但语素“基”和“因”使新概念“基因”与原有概念“基本”、“因素”相联系。比如汉语用两个基本概念“信”和“用”组合表达trustiness 。尽管“信用”的概念是重新定义的,但与trustiness相比,组成它的语素“信”和“用”能帮助理解记忆单词,它和原有概念“信誉”和“用途”相联系。比如语素vho(豁) 表示豁口、敞开,语素dva(达)表示通达,汉语用它们组成词vhodva(豁达)表达了:心胸开阔,新的信息进得来,事情看得开的意思。英语就不存在这样的词,只能用短语 open and clear 或generous or magnanimous表示。分类例如 naau-jis’uiyrn(脑脊髓炎)汉语是用“部位”和“病”来分类。它可以避免如英语不断用字母造新词以致记忆不堪重负的弊病如encephalomyelitis。汉语的语素拼义造词方式使汉语具有扩充性,更能适应知识爆炸性增长的信息时代。汉语既可以用语素组合造新词也可以用音素字母组合造新词比如CT、X光、pm2.5……。详细的论述见云南大学出版社出版的《拉丁汉语-未来的语言文字》中“汉语构词的语素组义方式是否没有英语表达精确”一节。 宇宙是由基本粒子依照“编码规则”构成的。比如人类基因组有大约2.5万个,就是由超过30亿对基础分子构成的(汉字无法表达这些分子式)。由拉丁字母依照“编码规则”组成拼音文字就符合宇宙构成模式,因而也最有利于人类认识自然界的思维发展,拼音文字国家的发明创新远远多于非拼音文字国家就是证明。依规章治理的法治思想也是产生于拼音文字国家。这里说的“编码规则”泛指一切自然规律。英国《每日邮报》网站2017年6月26日报道题《研究人员展示会“读心术”的人工智能》: 美国卡内基—梅隆大学的研究人员研发出一种脑成像技术,能识别复杂的想法,比如“证人在庭审期间大喊大叫”。 这种“读心”技术表明,复杂的思维是由大脑的不同子系统形成的,而且并非居于词语。这项研究提供了新证据证明,大脑以不同部分实现概念表征具有跨越民族和语言的普遍性。由卡内基—梅隆大学心理学教授马塞尔•贾斯特博士带头开展的这项研究显示,要处理像“证人在庭审期间大喊大叫”这样的句子,大脑需要使用42个基本的“语义要素”,它们由人、环境大小、社交互动和身体行动等要素组成。.......贾斯特说:“人脑的一大进步在于能将单个概念组合成复杂的想法,不只是会想‘香蕉’,还会想‘我晚上想和朋友们一起吃香蕉’。”汉字所提炼的“语义要素”,汉语的语素拼义,就是这一自然机制的表现。我认为人类语言文字的发展趋势是:文字结构的基本单元字母化,表语音为主;词语结构的基本单元语素化,用基本概念(语素)的组合来表示复杂概念,类似汉语的语素拼义,归类表述。 我的专著《汉语速成之路-拼音汉字创新》出版后,“ 汉语拼音之父”周有光老前辈以110岁高龄两次到访我的博客,虽没有提出意见只留下了他睿智的头像,但已使我感动不已。遗憾的是先生已看不到本书的出版。《汉语拼音方案》推行了60年还不能完整表达汉语。目前,语委是想通过资助南开大学马庆株教授组织课题组这种计划经济的方式来解决这个问题,这是完全不可能解决的。因为马教授他们的知识结构不适合解决这种涉及文字学、语音学、符号学、编码学、信息学、统计学、统筹学、应用数学等类似编写密码偏理科的课题。解决这个问题,必须建立起一个用拉丁字母解析汉字的模型,人们只要根据汉字的语音、声调、词性、字义类型,就能写出汉字的拉丁字母拼式。 比如: “悟”根据: 语音:wu 声调:第四声,调符后置 词性:动词,调符v 字义类型:抽象行为,用韵母变式, u的韵母变式是eu 就能得到 weuv
“民”根据: 语音:min 声调:第二声,调符中置 词性:名词,调符k 字义类型:实词 就能得到 mkin
“新”根据: 语音:xin 声调:第一声,调符前置 词性:形容词,调符r 字义类型:实词 就能得到 rxin k, r,v这三个调符是通过统计筛选出来的,在各种位置都不会混淆,v不发音,k, r在声母位置时才发音,但有其它声母在它就是调符。
马教授他们的方案我大体了解过,由于他们是在西方无调语言语音学的错误指导下,更是南辕北撤。比如他们大量采用印欧语“一字母多音、一音多字母”的表示方法,想通过声、韵母异拼的方法,人为规定或添加与字音字义无关的字母来解决同音字和声调的问题,比如tong(通)、tonq(痛) ,jin(进)、gin(近),sheng(生)、sreng(声)……。这完全是错误的,因为它既没有立足于汉字的字音、词性、词义这些固有特征,又破坏了构字规则、拼音规则的一致性。这是20多年前我淘汰的方案。可见他们的研究才刚刚起步,据说还通过了鉴定!而我进行的拉丁汉语研究历经30年,并在北大中文论坛上进行了七年的答辩,已出版了两本专著,目前已进入了实践检验的阶段。好的汉语拼音文字方案必须是在对外汉语教学、汉字输入法、盲文教育、旗语通信、汉语信息处理、提高汉语教育效率等方面,经过竞争脱颖而出的方案。现在如果要修改《汉语拼音方案》就必须慎重,因为这是一个多学科的课题,不能仅局限于几个专家。 汉语拼音文字的科学性应表现为文字的三级结构: 一级:用来构建基本概念表达式(字)的带有音值的字母。(最好是世界通用的拉丁字母) 二级:按照该基本概念对应的语音、词性、词义进行编码构成的字母拼式(字)也就是基本概念表达式。(比如拉丁汉语的拼音汉字。) 三级:由上述基本概念表达式(字)复合组成的词汇。(类似汉语复合词) 这里面必须强调规则的一致性,例外不能太多。 这样,人们只用学习26个拉丁字母就能按语音规则写出所有的字;只用学习2840多个字(基本概念表达式),就几乎能组合表达人类所想的一切,这就是汉语特有的“拼义”方法。我认为只有这样才能产生既拼音又拼义且可能为世界接受的通用文字。 不论字母也好其它符号也好表音表义都是人为赋予的,区别是:你这个赋予有没有规则,它的简明性,规则一致性,是否立足于该语言的固有特征。比如就汉语来说,如何用字母配套来表现汉语韵母的规律、以及汉语的声调、汉语语素的词性,这些都需要统筹兼顾有统一规则,尽可能减少人为规定,最好能使用义音合一字母表示。有几点是必须考虑的: 1、必须是基本上的音素制,既能表达语音又能准确标识汉语基本语素,也就是“字本位”。 2、要去除26个拉丁字母以外的附加字符。单字的字母数最好在四字母以内以便于复合词。要尽量避免一字母多音、一音多字母,保持拼音规则的一致性。 3、区分汉语同音语素应该用汉语语素的声调、词性、词义等固有特征,而不是人为添加主观规定的标识符。 4、不是另起炉灶而是以现有的《汉语拼音方案》为基础进行优化。因为《汉语拼音方案》已经有了群众基础。 5、新方案提供了实际上的“统一汉字输入编码”。2840个单用字外的其它用字比如姓氏用字,可使用特殊编码。 6、目的是形成简体字、繁体字、拼音汉字在各自应用的领域自由发展,自由竞争,让今后的信息社会去取舍的局面。 我研究的拉丁汉语提供了一个符合条件的选择。我的研究实践发现,影响“汉语拼音”快速阅读的主要原因是拼式太长、相似形太多和区别不了语素,解决办法就是采用义音合一字母,在不影响拼音和区别同音语素的情况下缩减拼式以适应汉语的拼义(许多研究者的做法正好相反,是增加字母加长拼式), 最终做到了动态平均3个拉丁字母表达一个汉字。许多人未经语言生活中的统计研究,仅根据汉字总数就断言汉语拼音文字无法区分汉字同音字。据我编的《拉丁汉语字表》中统计,在覆盖汉语99%以上的2682个汉语常用字中,同音、同调、同词性的字446个占16.6%(这些字经拉丁汉语用韵母变式区分后实际给2840多个汉语单用字定型),而汉语多音因而多义的字(方块汉字无法区分)占16.7%(《文字改革》总154期王凡:让我国中小学语文教材的编写工作更加科学化),这又是拉丁汉语根据语音完全区分的,前者实际高于后者的区分度水平。经过多年研究我找到了如下方法: 1、只给2840多个汉语单用字定型(已包括了所有常用字和词根字)。其余非单用字在词组中表达,如sanxauv(讪笑),vhuiho(挥霍),yamdomv(佯动),xuetkou(噱头),pimeei(媲美),jiyu(觊觎)……它们对汉语的覆盖率不到1% 。在词组中、在语言文章中、在动态中解决同音字、多音字问题。比如虚词直接拼音,覆盖汉语10%的12个高频字使用简化拼式。没有必要每个汉字都给一个拼式,只有单用语素才需要区分同音字。目标是现代汉语的拉丁化,其中涉及到古汉语的成语可定型为词组如:琳琅满目 linlam-maanmuk 。这种做法在日语中已得到了验证,日语只使用2100多个(定型)汉字配以假名拼音就能表达自如。详细见《拉丁汉语-未来的语言文字》“2315个常用汉字所代表的汉语基本语素能否表达99%的汉语语义”一节,以及《汉语速成之路-拼音汉字创新》“拼音汉字的表现力”一节。 2、汉语韵母缩短到2字母以内仍然是音素制。(见30韵图)。 3、利用调符字母在表示声调的同时表达词性。(使用义音合一字母) 4、利用韵母变式区分表示抽象义的字义类型,如方位词、数词等。 5、充分利用汉语的反切法、辅音读音隐含元音的特点,借鉴阿拉伯文省写元音技巧大量缩减拼式。
清华大学图书馆对我的专著《汉语速成之路-拼音汉字创新》的评价: 将对我校的人才培养及科学研究发挥重要作用。
日本东方书店对我的专著《汉语速成之路-拼音汉字创新》面对日本读者的介绍: 本书指出,学习汉语时,理解(“多少”)汉字的意思,就能理解(“多少”)文章的思想。从以上观点看,(掌握)“字”是学习(汉语)的方法。(对于)拼音汉字,最重要的是把握声调和词性。由拉丁字母表示2300个汉字代表的词根以及通过(语素)组合就能读懂文章的意思。 (原文:本書は中国語を学ぶ際に漢字の意味や働きを理解していれば多くの文章を理解することができる、という見地から「字」そのものに着目した学習法を提示する。漢字のピンインを簡略化することで、重要な声調と品詞を把握し、少ないラテン字母により2300個の漢語の詞根(語幹)を表している。それらの組み合わせを通じて、多くの単語や文章を読むことが可能になるとしている。) 最近据查池网公布,俄罗斯书目第28页列入了我的专著《汉语速成之路-拼音汉字创新》。 (节选自即将由云南科技出版社出版的专著《全球化时代中国语言文字的挑战》)
|