|
怎样才能建立汉字代码的电脑?
很多中国人都问,为什么在电脑上能用汉字编辑文件,却不能用汉字编制电脑程序呢?为什么只能用英文来编制电脑程序呢?为什么中国没有汉字代码的电脑呢?
因为中国没有汉字代码的电脑。为什么没有汉字代码的电脑呢?原因如下:
在1983年之前,中国在电脑的研制上,基本上是与美国、日本的研制进程平行的。
在电子电脑发明初期,人们在编制电脑应用程序时,是用“0”、“1”组成的二进制编码,来作为电脑指令的。人与电脑的关系是:人---“0”、“1”编码。多位“0”、“1”编码,对于99%的广大普通民众来说,是很难掌握的,所以,使用“0”、“1”编码作指令的电脑,是不能普及于广大民众的。 为了让电脑普及于广大普通民众,就在“人”与“0”、“1”编码之间,夹上一个过渡“桥梁”-----“人、机信息交换代码”。最适宜作这种“桥梁”的,就是人们日常熟悉的“文字”。方法是:如果让某组“0”、“1”编码,表示一个组成文字的基本元件,例如,让二进制16位编码“0010011000101010”代表英文字母K ,人们按下英文键盘的K按钮,就能使用“0010011000101010”编码了。
于是,电脑的设计者,就把“文字的基本构字元件”,作为“人、机信息交换代码”了。这样,就把早先的“人---0、1编码”关系,改成“人---ASCII码--- 0、1编码”关系了。
“0、1”编码,相对“代码”来说,被称为“源码”
把“源码”的电脑升级为“代码”的电脑后,普通大众就可以用一种文字的有限的“基本构字元件”,用电脑键盘在电脑上组建出无限的文字,再用文字组成电脑的指令,组成电脑的各种“软件”,来操作电脑了。从此,文字就成为设计制造电脑的硬件和软件的一个要素了。
美国编程者发明了“代码”编程方法以后,美国国家标准学会(American National Standard Institute , ANSI ),为了解决各个编程专业部门使用代码不一致的问题,在1961年,就制定了“美国标准信息交换代码(ASCII码)”。它是标准的单字节字符编码方案,用于基于英文文本的数据。它最初是美国国家标准,供不同电脑在相互通信时用作共同遵守的西文字符编码标准,在1967年定案。后来又被国际标准化组织(International Organization for Standardization, ISO)定为国际标准,称为ISO 646标准。
“ASCII”码,既是设计电脑芯片的一个依据,也是编制电脑“程序”的基础。美国设计的电脑CPU芯片架构MIPS、Alpha等等,都以ASCII码为依据的,并且只支持“ASCII”。
但是,不是任何文字都可作为“源码”的“代码”的。能够成为“源码”的“代码”的文字,必须具有“规律性、规范性和标准性”,以便适合电脑的工作的特性-----“规律性、规范性和标准性”。 否则,电脑就不能用这种文字的几十个基本组字元件,作为“人、机信息交换标准代码”。这样,就不能用这种文字的组字元件,在电脑上组建出无限的文字;也不能用这种文字作为指令,编制电脑的操作程序和应用程序。
因为英文具有“规律性、规范性和标准性”,所以,英文字母就可以作为“人、机信息交换代码”。
美国的电脑,使用了“ASCII”码后,中学生都可以用26个英文字母,在电脑上随机组建出无限的英文单词编辑文章;用英文指令,编制各种程序。
中国研制电脑的专家,也知道中国自己研制的电脑,为了便于广大普通民众的使用,应该用汉字的构字元件作为电脑的“人机信息交换代码”;也看到了正在使用的“汉字楷体系统”,因为没有“规律性、标准性和规范性”,所以其构字元件不能作为电脑的“代码”。
为什么不把汉字楷体系统升级更新成可以作为电脑的“人、机信息交换代码”的新体汉字呢?
因为,从1900年以来,在中国的语言文字学界,就出现了两派----“汉字罗马派(又叫汉字拉丁派)”和“汉字保守派”。
“汉字保守派”,不承认汉字楷体系统在现代社会中凸显的一切缺点和问题,说汉字楷体是“完美无缺的”,“是汉字发展的顶峰”,“是不必改进的,不可改变的”。
“汉字拉丁化派”,“邯郸学步”地搬用西方“拉丁文字”国家的片面的错误的语言文字“理论”,极力推行“拉丁化汉字”,完全违反了汉字发展的客观规律,根本没有“实用价值”,所以不能作为汉语人使用电脑的 “人机信息交换代码”。然而,“汉字拉丁派”,却只同意把汉字“拉丁化”,坚决反对把楷体汉字更新成“非拉丁化”的适用于电脑作“人机信息交换代码”的新体汉字。
掌握中国语言文字问题发言权的“权威”、“专家”们,不是属于“汉字保守派”就是属于“汉字拉丁派”。这两派都没有正确的系统的关于“语言文字发展”的理论指导,双方只是“以错怼错”的混战,所以谁也说服不了谁。这两派,又都极力排斥和打击正确的语言文字理论和正确的升级更新楷体系统的“新体汉字方案”,致使适应现代社会发展需要的克服了楷体系统的一切缺点,继承了楷体系统的一切优点,并能与楷体系统实现“无缝转换”的“新体汉字系统”,不能出现。
在这种情况下,中国的电脑研制专家,就不得不借用美国的“ASCII”码,作为中国自造的电脑的“人机信息交换代码”。这样一来,就使中国自造的电脑,不论在硬件上、软件上和在功能上,都与美国制造的机算计相近,而在制造成本上,却远高于美国的电脑。
1979年中国实施“改革开放”以后,美国的先进廉价的电子产品大量涌向了中国市场。于是,主持电脑制造的决策者,不看中国自主研制电脑的长远战略意义,只看眼前的经济利益的得失,就认为“中国自造电脑不如购买美国的电脑合算”。所以,就在1983年,把自主研制电脑的项目,与集成电路和半导体研发一起停掉了。这些科研队伍解散后,除了出国的以外,有的下海经商,有的回高校教书,更有甚者竟然被调去看机房。这样,中国就彻底废止电脑的研制工程。中国的独立自主的电脑产业体系就中途夭折了。
从20世纪70年代起,世界各主要发达国家和新兴发达国家的政府、企业等部门,都看到了一种崭新的战略发展机遇,纷纷增加对电子、电脑产品研发经费的投入,使电子、电脑等新兴产业崛起。今天全球最大的半导体芯片制造商美国的英特尔公司,成立于1968年,在1971年推出了全球第一个微处理器。微处理器所带来的电脑和互联网革命,改变了整个世界;世界开始进入信息化时代。而中国却在这一关键时刻,放弃了在电脑和微电子电路制造方面的自主创新。这样,中国从1984年开始,电脑和半导体电子器件工业的发展模式从过去的“创新为主,引进为辅”,转变为单纯地引进。从此,只能跟在在美国、日本屁股后边爬了。从此,国产电脑、通信设备、手机、家电、网络服务器、凡是用电脑控制的一切民用、军用机器设备,全都没有了“中国芯”。
而“电脑芯片”,是电脑、消费类电子、网络、通信、汽车、舰船、飞机、大炮、导弹、卫星等等所有机器的“大脑”,起着“生死攸关”的作用。
中国在自阉电脑核心部件(CPU)制造能力以后,电脑底层软件的编制的权力也自然随之丢失了。中国再没有了独立自主的电脑产业体系。由此,使中国失去了跟上“信息化时代”的最佳机会,使中国比美国落后一个“信息化时代”。 中国的电脑核心硬件和核心底层软件领域,就完全让美国占据了,中国在“信息领域”的自主权,完全丧失了。汉字信息,只能挂接在美国的电脑信息系统上,成为英文信息的附庸,随时遭到美国的监控和破坏。中国的电脑厂,全是美国的零件组装厂。中国每年付给美国日本的电脑软件、硬件的专利费和购买零件的费用,多达千亿美元,比中国进口石油的费用还多。
中国政府于2002年,投资50亿美元,扶持“龙芯”企业,来制造“电脑中央处理器(CPU)”芯片。“龙芯”企业购买了美国的MIPS架构的CPU芯片专利,做出一种所谓中国的“龙芯”。中国首台超级电脑神威蓝光MPP的“申威处理器”CPU芯片,是买了美国Alpha架构的芯片专利的。所制造的“龙芯”和“申威芯片”, 是不能被改造成汉字代码的芯片的。它们的性能与美国产的芯片一样,只支持美国的ASCII码,是不支持汉字代码的。所以,只能让汉字信息挂接在英文信息系统上;还是不能用汉字编写电脑程序;仍然不能摆脱美国的监控和破坏;中国的网民对网络的使用权和利益,仍然完全掌握在美国人的手里。
因为电脑的核心芯片和核心程序,它们不像步枪一样,谁拿了它,它就听从谁的支配,为谁服务。而电脑的核心芯片,是谁设计的就听谁的指挥,为谁服务。
电脑的“核心软件”也是一样,美国卖给你的电脑“核心软件”,全是用“源码”编制的,他也不会把每组“源码”的功能和修改方法全部告诉你。
因为,一个指甲盖大的芯片,里面布置的电子元件,相当于一个纽约市的房屋和街道那么多;每一间屋的功能是什么,如何使用,只有设计者自己知道,他不告诉你,你是无论如何也弄不懂的。
如果设计者在芯片上或操作程序里夹上病毒入侵“后门”,仿造者也会盲目地予以仿造出来。设计者如果利用病毒入侵的“后门”和远程遥控“暗道”,来偷袭时,仿造方一点反抗的办法都没有。
所以,中国购买美国的电脑芯片“架构”的专利,生产这种电脑芯片的工厂,等于替美国在中国扩建了一个这种芯片的分厂。
这样,中国就被美国的电脑绞索套住了,成了美国的“科技殖民地”,不单每年被美国掠去上万亿美元的财富,并且中国的国防“第5领域----信息领域”的安全,都被美国监控了。
面对这种情况,很多中国人也想创建中国“独立自主的电脑产业体系”,以彻底摆脱美国的“绞索”。
中国要想创建“独立自主的电脑产业体系”, 其主要障碍不在于电脑芯片的制造技术,而在于没有规律性、规范性和标准性的不可用作电脑代码的汉字楷体系统。唯有把汉字楷体系统升级更新成具有规律性、规范性和标准性的能与楷体系统实现“无缝转换”的可用作电脑代码的“新体汉字系统”,才能使中国建立起“独立自主的新体汉字代码的电脑信息系统”。
今天,中国不把汉字楷体系统升级更新成具有规律性、规范性和标准性的能与楷体系统实现“无缝转换”的可用作电脑代码的“新体汉字系统”呢?
因为,从1955年以来,“汉字拉丁派”,就一直占据着中国语言文字主导权。为了压制反对派,在2000年,搞出了一个完全违背汉字发展规律的、漏洞百出、脱离实际的《中华人民共和国国家通用语言文字法》,这个《法》,使中国的“语言、文字的学术领域”成了研究商讨的禁区,在保护错误的同时,又堵死了汉字楷体系统科学升级之路,把汉语、汉字引向退化、衰落、灭亡之路。因此,中国70年以来,就一直不能出现汉字代码的电脑信息系统了。
在此,有人会问:汉字在目前的美国ASCII码的电脑上,是怎么使用的呢?
是通过“ASCII码”从汉字库里调出的,不是像英文那样用组字元件随机组建的。
具体方法是:
第一步,把每个汉字做成一个“小图片”。
第二步,给每一个汉字赋予一个唯一的“汉字字模库”的区位码(例如:灯---2138,登---2139,等---2140
邓---2141,凳---2142,瞪---2143 。。。。。。。)然后存入“汉字字模库”里。
第三步,编制一种从字库里调取“汉字”整体的“汉字输入程序”。
第四步,把 “汉字字模库”的使用方法程序,嵌入到“ASCII码”的电脑操作系统(Windows)内。
第五步,在电脑操作系统的管理下,通过“汉字输入程序”,把英文键盘代码(又叫“输入码”),与汉字字模库里的汉字区位码(又叫“汉字内码”)关联起来 ,把汉字从“汉字字模库”里调出。
在英文代码的电脑上,“汉字输入程序”,最基本的有两种:
第一种、汉语拼音输入法。
这种输入法,适合“见字会读音”的人们使用。这种输入法的制作思路是:首先,给每一个楷体汉字,赋予表示这个字的汉语读音的“键盘代码”。在英文键盘上,就设定用“英文字母”来表示“汉语拼音字母”,然后用“英文键盘代码”,来拼写每个汉字的读音。这样,表示一个汉字读音的“键盘代码”,就作为这个汉字的“命名”。然后编一个《汉字拼音输入程序》,把每一个字的“命名”与这个字在字库里的区位码关联起来。例如:楷体字“灯、登、等、邓、凳、瞪。。。。。。”,这些同音字的汉语拼音都是“德鞥(没有含‘声调’)”。在英文键盘上,用英文键盘代码“d”取代声母“德”,用“eng”三个键盘代码取代“鞥”。
“灯、登、等、邓、凳、瞪。。。。。。”在汉字字库的区位码,分别设定为“2138, 2139, 2140,2141, 2142, 2143 。。。。。。。”。 《汉字拼音输入程序》把英文键盘代码“deng”与“2138, 2139, 2140,2141, 2142, 2143 。。。。。。。”都关联起来。当打开《汉字拼音输入程序》时,要调出“登”字,就在英文键盘上连续按下“d、e、n、g”键钮,就把汉字库里凡是与键盘代码组“deng ”相关联的汉字“灯、登、等、邓、凳、瞪。。。。。。”,都调出在列表中了。打字者可以从这个列表中选取所需用的汉字“登”。
第二种、汉字笔画输入法。
这种输入法,适合见字不会读音的人们使用。《五笔字输入法》就是“笔画输入法”。这种输入法的制作思路是:
首先对楷体汉字的结构,进行分解,例如“登”字,可以分解为“ ”、“ ”、 “ ”、“ ”。这些被分解的零件,称作“字根”。
然后给每个“字根”赋予一个英文键盘代码。例如:“ ” 的代码为弯w ,“ ” 的代码为g , “ ” 的代码为K ,“ ”的键盘代码为u。这样,“登”字的英文键盘代码命名就是“wgku ”。
再编一个“汉字笔画输入法程序”,把“登”字的“wgku ”命名与“登”字在汉字字模库中的区位码“2139”关联起来。
要调出这个字时,只要输入键盘命名“wgku ”,就把汉字库里凡是与键盘代码组“wgku ”相关联的汉字,都调出在列表中了。打字者可以从这个列表中选取所需用的汉字“登”。
由于汉字楷体字数很多,字根数量远远超过26个英文键盘的英文字母代码,所以,每个英文键盘按钮代码,就只能表示几个字根了。
《五笔输入法》,就是按这种思路编制的。下图就展示了构字部件与键盘代码的对应关系:
这种处理汉字的方法,与英文处理方法,有着根本的区别。主要表现如下:
在美国的以“ASCII”码为基础的电脑上,使用英文字母组建英文单词的;汉字是用“ASCII”
码,从汉字库里调取整字的。所以,在美国设计制造的电脑上,可以用26个英文字母,组建出无限的英文单词,单词怎么写,键盘就怎么打。而使用楷体汉字,不能在电脑上组建汉字;就必须先建立一个汉字库,然后在编一个从汉字字库里调取汉字的程序----例如“五笔输入法”或“拼音输入法”。
这两种方法,都是“整字调取法”,不是“元件组字法”。这种处理汉字的方式,就是早先的汉字机械打字机的处理方式。只是把铅字盘换成了字模库,拾字机械手换成“英文指令”, 印字蜡纸换成显示屏,选字还得靠人工。机械打字机存在的那些缺点,在电脑打字中依然存在;并且,如果没有英文信息系统的支持,采用整字调取法,在电脑上也实现不了。
所以,在使用汉字的情况下,汉人与机器的关系是:“人---汉语拼音符号(或五笔画)----ASCII码--- 0、1编码----汉字”关系
所以,汉字只能在英文代码的电脑上显示出来,是不能当作电脑指令,用汉字来编制电脑程序的。
因此,没有汉字代码的电脑,就没有中国独立自主的电脑信息系统和电脑产业体系,中文信息,只能通过英文来调取使用,只能成为英文信息系统的附庸;中国的电脑产业,也只能作为美国电脑产业的附庸才能生存。
今天,中国要想创建出“汉字代码的电脑信息系统”,就必须做到如下4点:
1、废止2000年的《中华人民共和国国家通用语言文字法》。允许在语言文字问题上,展开“学术争鸣”。
2、语言文字学术界与电脑科技学术界,要密切合作,来解决中国电脑的汉字代码问题。不要各自“闭门造车”,成为“两股道上跑的车”。
3、破除学术界、科技界,长期形成的“固守既得利益的小圈子”的坏风气,提倡以国家利益为宗旨的全局思想。
4、消除“买办势力”的阻挠,既要虚心学习外国的先进的理念和科技成果,也要消除“崇洋媚外”的奴才思想,要始终坚持独立自主地发展科技的战略思想。
做到上述4点,完全适应信息化时代的替换楷体系统的“新体汉字系统”,就会被中国人很快创造出来了。
那时,中国就可以自己设计制造出支持“新体汉字构字元件”为代码的电脑芯片体系。抛弃外国架构的芯片体系。中国就可以自己编制出“新体汉字代码”的软件体系了。
这样,就建立起“中国独立自主的纯汉字代码的电脑产业体系”,建立起覆盖全球的“汉字信息的电脑网络体系”。
这样,中国就追回了电脑信息主权,完全跟上信息化时代的步伐了。这不单完全彻底地摆脱了美国的电脑绞索,确保了中国的全面安全,还能每年增加亿万元的财富,成为世界强国。
|
|