本帖最后由 yangming 于 2019-12-21 19:54 编辑
随着二十世纪七十年代末至八十年代初个人计算机(Personal Computer)的诞生和应用,中国国家标准总局于1980年发布了《信息交换用汉字编码字符集》GB2312-1980,适用于汉字处理、汉字通讯等系统之间的信息交换,通行于中国大陆地区。GB2312-80基本字符集收入汉字6763个和非汉字图形字符若干,整个字符集分成94个区,每个区有94个位,这种以可用所在的区和位来对汉字进行编码的方法,称为区位码法。中国大陆几乎所有的中文系统和国际化软件都支持GB2312标准,新加坡等地也采用此编码。
Big5又称大五码,是台湾地区在1983年12月推出的个人电脑中文共通内码,是最常用的繁体中文电脑汉字字符集标准,共收录13060个汉字。由于大部分台湾产的电脑都使用了Big5码,加上後来倚天中文系统的高度普及和微软Windows 3.X的采用,Big5码已发展为使用繁体中文的标准,香港、澳门及使用繁体汉字的海外华人都普遍使用此编码。
GBK即“国标”、“扩展”汉语拼音的第一个字母,英文名称:Chinese Internal Code Specification(《汉字内码扩展规范》),是中华人民共和国全国信息技术标准化技术委员会于1995年12月1日制定的指导性文件。GBK编码是在GB2312-80标准基础上的内码扩展规范,使用双字节编码方案,共23940个码位,收录了21003个汉字,完全兼容GB2312-80标准,并包含了Big5编码中的所有汉字,支持国际标准ISO体系结构与基本多文种平面,已被应用于Windows 95系统之後的微软视窗操作系统。
Unicode1.0版本CJK统一区基本兼容GBK编码,包含了其中的20902个字符,从0x4E00至0x9FA5连续编码:
部首 字符 起始码 终止码
⼀ 40 0x4E00 0x4E27
⼁ 14 0x4E28 0x4E35
⼂ 9 0x4E36 0x4E3E
⼃ 26 0x4E3F 0x4E58
⼄ 44 0x4E59 0x4E84
⼅ 7 0x4E85 0x4E8B
⼆ 20 0x4E8C 0x4E9F
⼇ 26 0x4EA0 0x4EB9
⼈ 645 0x4EBA 0x513E
⼉ 38 0x513F 0x5164
⼊ 6 0x5165 0x516A
⼋ 23 0x516B 0x5181
⼌ 20 0x5182 0x5195
⼍ 21 0x5196 0x51AA
⼎ 53 0x51AB 0x51DF
⼏ 21 0x51E0 0x51F4
⼐ 11 0x51F5 0x51FF
⼑ 155 0x5200 0x529A
⼒ 94 0x529B 0x52F8
⼓ 28 0x52F9 0x5314
⼔ 5 0x5315 0x5319
⼕ 30 0x531A 0x5337
⼖ 9 0x5338 0x5340
⼗ 27 0x5341 0x535B
⼘ 13 0x535C 0x5368
⼙ 25 0x5369 0x5381
⼚ 52 0x5382 0x53B5
⼛ 18 0x53B6 0x53C7
⼜ 27 0x53C8 0x53E2
⼝ 756 0x53E3 0x56D6
⼞ 72 0x56D7 0x571E
⼟ 460 0x571F 0x58EA
⼠ 23 0x58EB 0x5901
⼡ 8 0x5902 0x5909
⼢ 11 0x590A 0x5914
⼣ 18 0x5915 0x5926
⼤ 76 0x5927 0x5972
⼥ 477 0x5973 0x5B4F
⼦ 48 0x5B50 0x5B7F
⼧ 120 0x5B80 0x5BF7
⼨ 23 0x5BF8 0x5C0E
⼩ 19 0x5C0F 0x5C21
⼪ 22 0x5C22 0x5C37
⼫ 54 0x5C38 0x5C6D
⼬ 3 0x5C6E 0x5C70
⼭ 362 0x5C71 0x5DDA
⼮ 10 0x5DDB 0x5DE4
⼯ 12 0x5DE5 0x5DF0
⼰ 13 0x5DF1 0x5DFD
⼱ 116 0x5DFE 0x5E71
⼲ 8 0x5E72 0x5E79
⼳ 5 0x5E7A 0x5E7E
⼴ 117 0x5E7F 0x5EF3
⼵ 10 0x5EF4 0x5EFD
⼶ 13 0x5EFE 0x5F0A
⼷ 8 0x5F0B 0x5F12
⼸ 61 0x5F13 0x5F4F
⼹ 17 0x5F50 0x5F60
⼺ 18 0x5F61 0x5F72
⼻ 80 0x5F73 0x5FC2
⼼ 581 0x5FC3 0x6207
⼽ 46 0x6208 0x6235
⼾ 21 0x6236 0x624A
⼿ 740 0x624B 0x652E
⽀ 5 0x652F 0x6533
⽁ 83 0x6534 0x6586
⽂ 16 0x6587 0x6596
⽃ 13 0x6597 0x65A3
⽄ 21 0x65A4 0x65B8
⽅ 39 0x65B9 0x65DF
⽆ 5 0x65E0 0x65E4
⽇ 267 0x65E5 0x66EF
⽈ 24 0x66F0 0x6707
⽉ 32 0x6708 0x6727
⽊ 1016 0x6728 0x6B1F
⽋ 66 0x6B20 0x6B61
⽌ 23 0x6B62 0x6B78
⽍ 58 0x6B79 0x6BB2
⽎ 24 0x6BB3 0x6BCA
⽏ 9 0x6BCB 0x6BD3
⽐ 7 0x6BD4 0x6BDA
⽑ 52 0x6BDB 0x6C0E
⽒ 5 0x6C0F 0x6C13
⽓ 32 0x6C14 0x6C33
⽔ 1079 0x6C34 0x706A
⽕ 447 0x706B 0x7229
⽖ 12 0x722A 0x7235
⽗ 5 0x7236 0x723A
⽘ 4 0x723B 0x723E
⽙ 8 0x723F 0x7246
⽚ 18 0x7247 0x7258
⽛ 2 0x7259 0x725A
⽜ 81 0x725B 0x72AB
⽝ 216 0x72AC 0x7383
⽞ 5 0x7384 0x7388
⽟ 339 0x7389 0x74DB
⽠ 10 0x74DC 0x74E5
⽡ 50 0x74E6 0x7517
⽢ 7 0x7518 0x751E
⽣ 9 0x751F 0x7527
⽤ 8 0x7528 0x752F
⽥ 91 0x7530 0x758A
⽦ 7 0x758B 0x7591
⽧ 228 0x7592 0x7675
⽨ 7 0x7676 0x767C
⽩ 49 0x767D 0x76AD
⽪ 17 0x76AE 0x76BE
⽫ 47 0x76BF 0x76ED
⽬ 237 0x76EE 0x77DA
⽭ 7 0x77DB 0x77E1
⽮ 17 0x77E2 0x77F2
⽯ 327 0x77F3 0x7939
⽰ 126 0x793A 0x79B7
⽱ 6 0x79B8 0x79BD
⽲ 182 0x79BE 0x7A73
⽳ 87 0x7A74 0x7ACA
⽴ 46 0x7ACB 0x7AF8
⽵ 378 0x7AF9 0x7C72
⽶ 133 0x7C73 0x7CF7
⽷ 574 0x7CF8 0x7F35
⽸ 27 0x7F36 0x7F50
⽹ 57 0x7F51 0x7F89
⽺ 51 0x7F8A 0x7FBC
⽻ 68 0x7FBD 0x8000
⽼ 11 0x8001 0x800B
⽽ 6 0x800C 0x8011
⽾ 33 0x8012 0x8032
⽿ 76 0x8033 0x807E
⾀ 10 0x807F 0x8088
⾁ 346 0x8089 0x81E2
⾂ 7 0x81E3 0x81E9
⾃ 9 0x81EA 0x81F2
⾄ 9 0x81F3 0x81FB
⾅ 16 0x81FC 0x820B
⾆ 15 0x820C 0x821A
⾇ 4 0x821B 0x821E
⾈ 79 0x821F 0x826D
⾉ 4 0x826E 0x8271
⾊ 6 0x8272 0x8277
⾋ 981 0x8278 0x864C
⾌ 30 0x864D 0x866A
⾍ 469 0x866B 0x883F
⾎ 12 0x8840 0x884B
⾏ 23 0x884C 0x8862
⾐ 283 0x8863 0x897D
⾑ 13 0x897E 0x898A
⾒ 71 0x898B 0x89D1
⾓ 46 0x89D2 0x89FF
⾔ 567 0x8A00 0x8C36
⾕ 15 0x8C37 0x8C45
⾖ 15 0x8C46 0x8C54
⾗ 35 0x8C55 0x8C77
⾘ 37 0x8C78 0x8C9C
⾙ 199 0x8C9D 0x8D63
⾚ 12 0x8D64 0x8D6F
⾛ 67 0x8D70 0x8DB2
⾜ 248 0x8DB3 0x8EAA
⾝ 31 0x8EAB 0x8EC9
⾞ 209 0x8ECA 0x8F9A
⾟ 21 0x8F9B 0x8FAF
⾠ 5 0x8FB0 0x8FB4
⾡ 220 0x8FB5 0x9090
⾢ 184 0x9091 0x9148
⾣ 125 0x9149 0x91C5
⾤ 6 0x91C6 0x91CB
⾥ 5 0x91CC 0x91D0
⾦ 934 0x91D1 0x9576
⾧ 9 0x9577 0x957F
⾨ 156 0x9580 0x961B
⾩ 154 0x961C 0x96B5
⾪ 3 0x96B6 0x96B8
⾫ 47 0x96B9 0x96E7
⾬ 105 0x96E8 0x9750
⾭ 13 0x9751 0x975D
⾮ 4 0x975E 0x9761
⾯ 7 0x9762 0x9768
⾰ 98 0x9769 0x97CA
⾱ 34 0x97CB 0x97EC
⾲ 6 0x97ED 0x97F2
⾳ 14 0x97F3 0x9800
⾴ 167 0x9801 0x98A7
⾵ 51 0x98A8 0x98DA
⾶ 4 0x98DB 0x98DE
⾷ 183 0x98DF 0x9995
⾸ 3 0x9996 0x9998
⾹ 19 0x9999 0x99AB
⾺ 252 0x99AC 0x9AA7
⾻ 48 0x9AA8 0x9AD7
⾼ 7 0x9AD8 0x9ADE
⾽ 70 0x9ADF 0x9B24
⾾ 10 0x9B25 0x9B2E
⾿ 3 0x9B2F 0x9B31
⿀ 10 0x9B32 0x9B3B
⿁ 30 0x9B3C 0x9B59
⿂ 395 0x9B5A 0x9CE4
⿃ 400 0x9CE5 0x9E74
⿄ 10 0x9E75 0x9E7E
⿅ 38 0x9E7F 0x9EA4
⿆ 22 0x9EA5 0x9EBA
⿇ 8 0x9EBB 0x9EC2
⿈ 10 0x9EC3 0x9ECC
⿉ 4 0x9ECD 0x9ED0
⿊ 40 0x9ED1 0x9EF8
⿋ 4 0x9EF9 0x9EFC
⿌ 17 0x9EFD 0x9F0D
⿍ 5 0x9F0E 0x9F12
⿎ 13 0x9F13 0x9F1F
⿏ 27 0x9F20 0x9F3A
⿐ 15 0x9F3B 0x9F49
⿑ 8 0x9F4A 0x9F51
⿒ 59 0x9F52 0x9F8C
⿓ 15 0x9F8D 0x9F9B
⿔ 4 0x9F9C 0x9F9F
⿕ 6 0x9FA0 0x9FA5
由此可见,Unicode标准CJK统一表意文字基本区是按照康熙字典214个部首先後顺序编码的。
|