Diingum 发表于 2016-7-30 19:26:23

普通话水平测试用普通话词语表中的 单音节词 2类

普通话水平测试用普通话词语表中的 单音节词 2类


jì        15个
计                 记                 忌                 剂
季                 既                 济                 继
寂                 寄                 祭                 暨
冀                 髻                 系
------------------------------------
yì        18个
义                 亿                 忆                 艺
议                 亦                 异                 役
抑                 译                 邑                 易
疫                 益                 逸                 意
溢                 翼
======================
如果你有志于 拼音化汉文,先搞定这两类再说......
这拼音化汉文的 重点于难点之所在


Diingum 发表于 2016-7-30 19:59:19


我在百度上的文章
https://wenzhang.baidu.com/page/view?key=750fb159ac051797-1426806339

同音词的分化问题__周有光分享:更多 (《辞书研究》1983年第1期)‥‥‥‥‥‥‥‥‥‥‥‥‥‥‥‥‥‥‥‥‥‥‥‥‥‥‥‥‥‥‥‥‥‥      要想了解什么是同音词,先要了解什么不是同音词。      1,除去二千多个"字词"以外,其它同音汉字都不是同音词。如“哀”和“挨”不是一组同音词,因为"哀"是词素字,而"挨"是词字(词儿)。      2,同音异调的词儿不是同音词。      3,古词语和今词语同音,不是一组同音词。      4,词组和词儿同音,不成为同音词。例如“浇/水”(两个词儿)和“胶水”,前者分写,后者连写。      5,略语和完整的词儿同音,不成为同音词。      此外,还要去除汉字相同的同音词,因为人们不要求在拼音中区分这样的同音词。例如“仪表”(人的外表)和“仪表”(仪器和计表)。      以上这些除去以后,只有汉字不同而声韵调相同的现代汉语一组词儿才是所谓的同音词。      为了解除对同音词的广泛误解,这里再举例说明如下:      在《现代汉语词典》(1979)里,读yi(去声)的同音汉字有84个。义,议,易,益,亿,艺,意,忆,毅,译,谊,异,艺,役,抑,亦,驿,翼,溢,逸,邑,绎,衣,屹,奕,翌,疫,佚,泆,诣,怿,缢,轶,肄,昳,食,仡,羿,佾,峄,挹,刈,翊,浥,×,埸,艾,弋,呓,嗌,噫,杙,弈,裛,悒,貤,枻,裔,蜴,懿,瘗,勚,鹝,镒,饐,镱,鹢,熠,薏,殪,曀,螠,癔,劓,賹,臆,鮨,寱,斁,嫕,鶂,鹥,翳,虉.       区别古今以后,其中只有35个是现代汉语用字,另外49个都是文言古语用字和异体字。在35个现代汉语用字中,只有4个是现代“字词”,它们能够独自构成词儿:      亿(万万)。      勚(磨损:螺丝扣~ 了。口语常说,不常写。)      议(商议:请你们 ~ 一 ~ 。评议)      译(翻译:你 ~ 吧,我没功夫 ~ 。转译)      此外有27个是现代“词素字”,在现代汉语中可以合成词,不能独自成词。正义,记忆,艺术,刈草机(割草机,“刈”要划入古字中),异同,抑制,役使,贸易,瘟疫,利益,安逸,洋溢,意见,后裔,肄业,蜥蜴,毅力,友谊,薏米,白翳,臆测,羽翼,癔病,演绎,梦呓,驿站,城邑。      还有4个特种用字,其中一个是地名专用字(峄,~ 山,~ 县),两个是生物学专用字(螠,一种虫无脊椎动物;鱼旨,鱼类一属),一个化学元素专用字(镱,Yb)。这4个特种用字如果归入“词字”,那么,现代“词字”也不过只有8个读yi(去声)。      此外,读yi的文言文古语用字41个和异体字8个,从略不列举。      以上分析是否正确,还得研究。不过从以上的分析已经可以明白,现代汉语中同音词的数量,绝不是象一般所想象得那样庞大。根据统计,关于同音词的数量,现代日语和现代汉语相比是3:1,日语同音词比汉语多两倍。      分化同音词有多种方法。其中一种可以用于拼音电报的方法是,在拼音后面附加“定字”的规则,可以分化拼音电报中的同音词,也可以分化同音汉字(包括古字)。在分词连写的拼音电报中,需要夹用“定字”字母的音节,估计只有1%。“定字”规则可以放在附录或副刊中,不放在正文中。在正文中,同音异调加一个星,同音同调加两个星,作为标记。(《辞书研究》1983年第1期)………………………===============      现在看来, 周老近 30 年前的观点还是那么先进, 思路无可挑剔, 佩服啊!

Diingum 发表于 2016-7-30 19:34:20

<普通话水平测试表>中的 单音节词 共有3118个,

只要你把这些单音节词 搞定了,你基本就算成功了,


剩下的是 非单音节词 中的 同音词, 比如:
公式公示攻势公事工事宫室供事


还有你方案对 字母词 缩写词 的 定义 等等


如果还想更完善,你还要提出一套拼写规则,
就像<汉语拼音证词法2012>那样的东西









Diingum 发表于 2016-7-30 20:03:21

我在百度上的文章
https://wenzhang.baidu.com/page/view?key=01262cac98608ea2-1426806885
汉语普通话HPH 单音节词 3127个


比<普通话水平测试词表>中3118 多9个,


看来,只要你的方案能处理3200个 单音节词 那就OK了




中华魂兮 发表于 2016-8-13 12:06:19

Diingum 发表于 2016-7-30 19:59
我在百度上的文章
https://wenzhang.baidu.com/page/view?key=750fb159ac051797-1426806339



周先生的论述很有道理。任重而道远~:loveliness:
页: [1]
查看完整版本: 普通话水平测试用普通话词语表中的 单音节词 2类