《通用规范汉字表》三级字表分析
本帖最后由 yangming 于 2020-2-3 20:11 编辑《通用规范汉字表》共收字8105个,分为三级。
一级字表为常用字集,收字3500个,二级字表为次常用字集收字3000个,三级字表为罕用字集收字1605个。
中日韩越统一表意文字目前包含七个块:
一、普通表意文字块,范围4E00-9FFF,含20902字,1991年随Unicode 1.0版本发布;
二、表意文字扩展A, 范围3400-4DBF,含6582字, 1999年随Unicode 3.0版本发布;
三、表意文字扩展B, 范围20000-2A6DF,含42711字,2001年随Unicode 3.1版本发布;
四、表意文字扩展C, 范围2A700-2B73F,含4149字,2002-2006年间提交IRG,随Unicode 5.2发布;
五、表意文字扩展D, 范围2B740-2B81F,含222字, 2006-2009年间提交IRG,随Unicode 6.0发布;
六、表意文字扩展E, 范围2B820-2CEAF,含5762字,2006-2013年间提交IRG,随Unicode 8.0发布;
七、表意文字扩展F, 范围2CEB0-2EBEF,含7473字,2012-2015年间提交IRG,随Unicode 10.0发布。
《通用规范汉字表》三级字表共1605字,其中1340字落在中日韩统一表意文字的基本区内,
其他有69字落在扩展A区,34字落在扩展B区,有44字落在扩展C区,有8字落在扩展D区,107字落在扩展E区,
此外有3个字落在扩展F区之外,它们分别是6774 ⿰土夅、7146 ⿰石达、7373 ⿰钅麦。
附件为《通用规范汉字表》PDF文件:
附:CJKV表意文字扩展区字符对应的字号、字型及Unicode码位
一、表意文字扩展A区含69字:
1、6549 䜣(0x4723)
2、6567 㧑(0x39D1)
3、6592 㕮(0x356E)
4、6602 㑇(0x3447)
5、6618 㳇(0x3CC7)
6、6633 䢺(0x48BA)
7、6657 䢼(0x48BC)
8、6664 㭎(0x3B4E)
9、6686 㟃(0x37C3)
10、6700 㑊(0x344A)
11、6750 䌹(0x4339)
12、6757 㛃(0x36C3)
13、6797 㭕(0x3B55)
14、6806 䴓(0x4D13)
15、6814 䶮(0x4DAE)
16、6865 䏡(0x43E1)
17、6879 㶲(0x3DB2)
18、6884 㳚(0x3CDA)
19、6896 㳘(0x3CD8)
20、6955 䓖(0x44D6)
21、7088 㛚(0x36DA)
22、7098 䂮(0x40AE)
23、7118 㙍(0x364D)
24、7124 䓫(0x44EB)
25、7126 䓬(0x44EC)
26、7132 䓨(0x44E8)
27、7134 䓛(0x44DB)
28、7152 䴕(0x4D15)
29、7158 㫰(0x3AF0)
30、7169 䎃(0x4383)
31、7198 㿠(0x3FE0)
32、7209 䝙(0x4759)
33、7213 䏲(0x43F2)
34、7224 䴔(0x4D14)
35、7242 㥄(0x3944)
36、7292 㙘(0x3658)
37、7402 䐃(0x4403)
38、7410 㺄(0x3E84)
39、7431 㴔(0x3D14)
40、7450 㛹(0x36F9)
41、7465 䴖(0x4D16)
42、7508 䃅(0x40C5)
43、7516 䣘(0x48D8)
44、7520 㬊(0x3B0A)
45、7540 䅟(0x415F)
46、7560 䲟(0x4C9F)
47、7660 䃎(0x40CE)
48、7668 䴗(0x4D17)
49、7672 㬎(0x3B0E)
50、7698 㙦(0x3666)
51、7729 㽏(0x3F4F)
52、7736 㮾(0x3BBE)
53、7747 㻬(0x3EEC)
54、7772 䗖(0x45D6)
55、7782 㠇(0x3807)
56、7795 䴘(0x4D18)
57、7815 㵐(0x3D50)
58、7862 㬚(0x3B1A)
59、7865 䗛(0x45DB)
60、7868 㠓(0x3813)
61、7936 㘎(0x360E)
62、7960 䲠(0x4CA0)
63、7970 䗪(0x45EA)
64、8000 䗴(0x45F4)
65、8014 䲢(0x4CA2)
66、8024 䎖(0x4396)
67、8029 䴙(0x4D19)
68、8032 㰀(0x3C00)
69、8064 㸌(0x3E0C)
二、表意文字扩展B区含34字:
1、6506 ⿶了凵(0x20676)
2、6529 ⿰支⻏(0x28678)
3、6612 ⿰氵无(0x23C98)
4、6613 ⿰氵韦(0x23C97)
5、6637 ⿰弁⻏(0x28695)
6、6658 ⿱艹只(0x26B5C)
7、6794 ⿱艹那(0x26C21)
8、6867 ⿰月古(0x26676)
9、6976 ⿰车光(0x28408)
10、7084 ⿰阝兒(0x28E99)
11、7219 ⿱亠思(0x20164)
12、7300 ⿰土扁(0x2139A)
13、7354 ⿰足母(0x27FF9)
14、7377 ⿰钅求(0x28C47)
15、7425 ⿰氵贲(0x23E23)
16、7470 ⿰⺩帝(0x249DB)
17、7568 ⿰月娄(0x2677C)
18、7635 ⿰土康(0x21413)
19、7650 ⿰木党(0x235CB)
20、7663 ⿰石咢(0x25532)
21、7678 ⿰钅荅(0x28C4F)
22、7708 ⿰鱼安(0x29F7E)
23、7799 ⿰鱼免(0x29F83)
24、7851 ⿰石曹(0x25562)
25、7873 ⿰钅黄(0x28C51)
26、7918 ⿰⺩献(0x24A7D)
27、7944 ⿰钅尊(0x28C54)
28、7979 ⿰纟需(0x26221)
29、7996 ⿰石喿(0x255A8)
30、8020 ⿰童羽(0x2648D)
31、8043 ⿰鱼康(0x29F8C)
32、8057 ⿰瞿⻏(0x287E0)
33、8063 ⿱斌金(0x28B49)
34、8075 ⿰⺩燮(0x24AC9)
三、表意文字扩展C区含44字:
1、6576 ⿱艹为(0x2B1ED)
2、6586 ⿰车兀(0x2B404)
3、6640 ⿰马文(0x2B61C)
4、6643 ⿰马夬(0x2B61D)
5、6730 ⿰⻈同(0x2B363)
6、6820 ⿰目见(0x2AFA2)
7、6839 ⿰山曲(0x2AA30)
8、6844 ⿰钅夫(0x2B4E7)
9、6922 ⿰纟延(0x2B127)
10、6932 ⿰责力(0x2A7DD)
11、6995 ⿰黾⻏(0x2B461)
12、6999 ⿱⿱山大车(0x2AA36)
13、7039 ⿰饣束(0x2B5E7)
14、7094 ⿰纟希(0x2B128)
15、7177 ⿰钅圭(0x2B4EF)
16、7250 ⿰⻈咸(0x2B36F)
17、7255 ⿰⻈叟(0x2B372)
18、7276 ⿰马匋(0x2B626)
19、7281 ⿰马录(0x2B627)
20、7299 ⿰土娄(0x2A8FB)
21、7343 ⿰车兒(0x2B410)
22、7367 ⿰岂页(0x2B5AE)
23、7378 ⿰钅肙(0x2B4F6)
24、7399 ⿰兆页(0x2B5AF)
25、7408 ⿱狂鸟(0x2B6ED)
26、7457 ⿰马是(0x2B628)
27、7513 ⿰车柔(0x2B413)
28、7529 ⿰钅其(0x2B4F9)
29、7580 ⿵门臬(0x2B536)
30、7602 ⿰礻责(0x2B300)
31、7610 ⿰君页(0x2B5B3)
32、7617 ⿰马原(0x2B62A)
33、7618 ⿰马奚(0x2B62C)
34、7638 ⿰土翏(0x2A917)
35、7667 ⿱此鱼(0x2B696)
36、7701 ⿰鱼师(0x2B695)
37、7828 ⿰⻈睘(0x2B37D)
38、7870 ⿰山献(0x2AA58)
39、7890 ⿰饣亶(0x2B5F4)
40、7916 ⿰纟意(0x2B137)
41、7940 ⿰钅番(0x2B50D)
42、7946 ⿰钅矞(0x2B50E)
43、7980 ⿰纟熏(0x2B138)
44、8100 ⿰鱼巤(0x2B6AD)
四、表意文字扩展D区含8字:
1、6752 ⿰马玄(0x2B80A)
2、6967 ⿰支页(0x2B806)
3、7178 ⿰钅共(0x2B7F9)
4、7180 ⿰钅达(0x2B7FC)
5、7278 ⿰纟京(0x2B7C5)
6、7622 ⿰⺩⿱艹两(0x2B7A9)
7、7854 ⿰车遂(0x2B7E6)
8、7856 ⿰齿兒(0x2B81C)
五、表意文字扩展E区含107字:
1、6520 ⿰⻈于(0x2C8D9)
2、6547 ⿰氵万(0x2C1D5)
3、6551 ⿰⻈㝉(0x2C8DE)
4、6553 ⿰纟川(0x2C613)
5、6560 ⿱止土(0x2BB60)
6、6564 ⿱爻土(0x2BB63)
7、6594 ⿰山历(0x2BD77)
8、6616 ⿰氵贝(0x2C1D9)
9、6623 ⿰⻈戋(0x2C8E1)
10、6630 ⿰弓区(0x2BE29)
11、6642 ⿰纟冘(0x2C618)
12、6670 ⿰车氏(0x2CA02)
13、6671 ⿰日韦(0x2C029)
14、6672 ⿰日见(0x2C02A)
15、6688 ⿰钅弋(0x2CB29)
16、6731 ⿰⻈艮(0x2C8F3)
17、6732 ⿰寻⻏(0x2CA7D)
18、6737 ⿰阝岂(0x2CBBF)
19、6739 ⿰阝齐(0x2CBC0)
20、6744 ⿰女⿱大大(0x2BC1C)
21、6747 ⿰马丕(0x2CCF5)
22、6749 ⿰马冋(0x2CCF6)
23、6761 ⿰⺩乐(0x2C35B)
24、6791 ⿱艹问(0x2C72C)
25、6846 ⿰钅长(0x2CB2E)
26、6847 ⿰钅斤(0x2CB31)
27、6848 ⿰钅仑(0x2CB2D)
28、6919 ⿰纟因(0x2C621)
29、6920 ⿰马先(0x2CCFD)
30、6921 ⿰纟廷(0x2C629)
31、6937 ⿰⺩寻(0x2C364)
32、6941 ⿰土罗(0x2BB7D)
33、6951 ⿱艹两(0x2C72F)
34、6959 ⿰木夹(0x2C0A9)
35、6979 ⿰牙合(0x2C317)
36、7004 ⿰钅术(0x2CB38)
37、7006 ⿰钅卢(0x2CB3B)
38、7007 ⿰钅申(0x2CB39)
39、7008 ⿰钅召(0x2CB3F)
40、7009 ⿰钅母(0x2CB41)
41、7019 ⿰亻宠(0x2B8B9)
42、7053 ⿰火寻(0x2C288)
43、7070 ⿱(学字头)石(0x2C488)
44、7093 ⿰马余(0x2CCFF)
45、7097 ⿰纟完(0x2C62B)
46、7114 ⿱阿土(0x2BB84)
47、7161 ⿰由页(0x2CC56)
48、7166 ⿰虫东(0x2C7FD)
49、7234 ⿰氵国(0x2C1F9)
50、7241 ⿱汤玉(0x2C361)
51、7249 ⿰⻈垔(0x2C907)
52、7254 ⿰⻈是(0x2C90A)
53、7260 ⿰阝贵(0x2CBCE)
54、7273 ⿰纟青(0x2C62C)
55、7274 ⿰纟林(0x2C62D)
56、7275 ⿰马非(0x2CD02)
57、7279 ⿰纟享(0x2C62F)
58、7326 ⿰木质(0x2C0CA)
59、7334 ⿰甫鸟(0x2CDD5)
60、7347 ⿰齿介(0x2CE7C)
61、7361 ⿰山带(0x2BD87)
62、7375 ⿰钅杜(0x2CB4A)
63、7382 ⿰钅宏(0x2CB4E)
64、7405 ⿰危页(0x2CC5F)
65、7414 ⿸广钦(0x2BDF7)
66、7421 ⿵门垔(0x2CBB1)
67、7423 ⿰火单(0x2C2A4)
68、7456 ⿰马砉(0x2CD03)
69、7503 ⿰酉农(0x2CAA9)
70、7506 ⿰石肯(0x2C494)
71、7512 ⿰车酋(0x2CA0E)
72、7519 ⿰步合(0x2BAC8)
73、7534 ⿰钅享(0x2CB5A)
74、7537 ⿰钅波(0x2CB5B)
75、7541 ⿱⺮汞(0x2C542)
76、7561 ⿰鱼句(0x2CD8B)
77、7562 ⿰鱼它(0x2CD8D)
78、7654 ⿰匽鸟(0x2CE18)
79、7661 ⿰石览(0x2C497)
80、7682 ⿰钅侯(0x2CB64)
81、7706 ⿰鱼兆(0x2CD90)
82、7707 ⿰鱼危(0x2CD8F)
83、7712 ⿱狱鸟(0x2CE1A)
84、7737 ⿰⻈惠(0x2C91D)
85、7746 ⿰纟寅(0x2C642)
86、7789 ⿰钅翁(0x2CB69)
87、7824 ⿱(寒字头)鸟(0x2CE23)
88、7831 ⿰马⿱米舛(0x2CD0A)
89、7841 ⿱艹频(0x2C79F)
90、7855 ⿰齿奇(0x2CE88)
91、7872 ⿰钅彗(0x2CB6C)
92、7874 ⿰钅敝(0x2CB6F)
93、7894 ⿱族鸟(0x2CE26)
94、7937 ⿰钅喜(0x2CB73)
95、7939 ⿰钅黑(0x2CB76)
96、7943 ⿰钅⿱米舛(0x2CB78)
97、7945 ⿰钅遂(0x2CB7C)
98、7958 ⿰番鸟(0x2CE2A)
99、7961 ⿰鱼剌(0x2CD9F)
100、7963 ⿰鱼柬(0x2CDA0)
101、7974 ⿱既鱼(0x2CDA8)
102、7987 ⿱艹鹝(0x2C7C1)
103、8030 ⿰纟墨(0x2C64A)
104、8042 ⿰鱼祭(0x2CDAD)
105、8062 ⿰鱼喜(0x2CDAE)
106、8073 ⿰纟襄(0x2C64B)
107、8079 ⿰齿楚(0x2CE93)
本帖最后由 jhz001 于 2020-11-16 16:39 编辑
普通表意文字块含有20902字符(十六进制51A6),因此编码范围为:0x4E00..0x9FA5,而不是0x4E00..0x9FFF。
随着Unicode版本的不断升级,0x9FA6..0x9FFF的码位也不断地被定义,其中Unicode8.0定义了⿰土夅(0x9FCD)、⿰石达(0x9FCE)、⿰钅麦(0x9FCF)三个字符,至此《通用规范汉字表》的8105个字符全部被Unicode标准定义。
目前,《通用规范汉字表》的所有8105个字体能够正常预览的仅Windows 10中文版,其他版本的操作系统需要附加安装相关的字体文件才能预览。
楼主提供的CJK扩展字符集中存在个别字符的偏移,譬如扩展E区:
5、6560 ⿱土区(0x2BB5F)
6、6564 ⿱土仑(0x2BB62)
20、6744 ⿰女⿱泾右半(0x2BC1B)
32、6941 ⿰土劳(0x2BB7C)
41、7019 ⿰亻单(0x2B8B8)
经测试安卓系统、IOS系统现在都支持《通用规范汉字表》中字符的预览,但不包括扩展字符B、C、D、E区的其他字符。
页:
[1]