中国语言文字论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

只需一步,快速开始

搜索
查看: 3535|回复: 14

为什么中国的程序员不能用汉字编制电脑程序?

[复制链接]

284

主题

766

帖子

4332

积分

论坛元老

Rank: 8Rank: 8

积分
4332
 楼主| 发表于 2021-2-10 19:43:29 | 显示全部楼层 |阅读模式
     为什么中国的程序员,不能用汉字编制电脑程序?
   为什么中国的程序员,不能用汉字编制电脑程序?原因有2:
1是汉字问题。2是技术问题。
先说汉字问题:
电脑是用电子管的“通电”、“断电”的两种状态,来表达“0”、“1”数码的。人们利用四个电子管的通、断两种状态,就可以使用“0、”“1”,来进行“二进制”“四位编码”,可以做出16组编码来:
0000     0001      0010      0011     0100    。。。。。。。。。。。。。。。。 1111
通通通通  通通通断  通通断通  通通断断  通断通通  。。。。。。。。。。。。。。。。断断断断
   零       一         二        三       四      。。。。。。。。。。。。。。。。。十五
人们可以随意设定“0”、“1”二进制的任何一组编码,来代表任何一种东西,例如让0000代表“零、水、狗、秒、走、作用、启动发动机、红、先、A、 a、tapotement、 %、 ?、にほんご  、 ......等等。
人们把“0”、“1”组成的二进制编码,称为“源码”;在电脑上,把某一个可以替代某一个“源码”功能的“符号”,称为该“源码”的“代码”。
    当然,要让“代码”起到代替“源码”的作用,还必须使用一种“电子逻辑电路”,来把二者,关联起来。
在电子计算机发明初期,人们在编制电子计算机程序时,是用“0”、“1”组成的二进制编码,来作为电子计算机的输入、输出信息形式的。这时的“0、1二进制编码组”,就如“电报数码组”一样;要知道每个“编码组”的含义,就必须查对事先编好的“编码含义对照表”。这时,人与电脑的关系是:人---“0”、“1”编码组---含义。多位“0”、“1”编码组和成千上万的各种含义,对于99%的广大普通民众来说,是很难掌握的,所以,使用“0”、“1”编码组作电脑输入、输出信息形式的操作方式,是不能普及于广大民众的。为了让电脑普及于广大普通民众,就在“人”与“0”、“1”编码组之间,夹上一个过渡“桥梁”-----“人、机信息交换代码”。最适宜作这种“桥梁”的,就是人们日常熟悉的“文字”和“图符”。方法是:
让某个“0”、“1”编码组,来表示一个组成文字的基本元件,例如,让二进制16位编码“0010011000101010”代表英文字母K ,人们按下英文键盘的K按钮,就能使用“0010011000101010”编码了。人们把“0、1编码组”称为“源码”,把“文字或图符”称为“代码”。
这样,电脑的设计者,就把“文字的基本构字元件”和一些“图符”,作为“人、机信息交换的“源码”的“代码”了。这样,就把早先的“人---0、1编码组”的关系,改成“人----文字、图符----0、1编码组”的关系了。
把“源码”的电子计算机升级为“代码”的电子计算机后,普通大众就可以用一种文字的有限的“基本构字元件”,用电子计算机键盘组建出无限的文字,再用文字组成电子计算机的指令,编制电子计算机的各种“软件”,来操作电子计算机了。从此,文字、图符就成为设计制造电子计算机的硬件和软件的一个不可或缺的要素了。
把“源码”的电子计算机升级为“代码”的电子计算机后,充分发挥了广大民众的创新潜力,使电子计算机不断得到改进,功能不断加强,不断接近或超过人脑的能力。于是,人们就改称“电子计算机”为“电脑”了。
美国采用了“代码”操作电脑方法以后,美国国家标准学会(American National Standard Institute ,ANSI ),为了解决各个编程专业部门使用代码不一致的问题,在1961年,就制定了“美国标准信息交换代码(ASCII码)”。它是标准的单字节字符编码方案,用于基于英文文本的数据。它最初是美国国家标准,供不同电脑在相互通信时用作共同遵守的西文字符编码标准,在1967年定案。后来又被国际标准化组织(International Organization for Standardization, ISO)定为国际标准,称为ISO 646标准。
“ASCII”码,既是设计电脑芯片的一个基础,也是编制电脑“程序”的基础。美国设计的电脑CPU芯片架构MIPS、Alpha等等,都以ASCII码为依据的,并且只支持“ASCII”。
   电脑是按事先设计好的“工作标准、工作规范和工作程序”来运行的,因此,只有具有“规律性、标准性”和“规范性”的文字,才可作为电脑的“人机信息交换标准代码”。
  26个英文字母,具有““规律性、标准性”和“规范性”,所以它就可作电脑的键盘代码;英文单词,都是用英文字母,从左至右依次排列组建的,所以组建英文单词的方式,是具有“规律性”的。因此,电脑就能够用带有26个英文字母代码的键盘按钮,按照英文单词的排列顺序规律,组建出任何英文单词和英文指令。
  而中国的从甲骨文到楷体的各种体式的汉字,是方块结构的,其组字基本元件,在不同的字上,具有不同的大小、不同安置角度、不同的粗细、不同的长短、不同的连接方式,所以,组字元件没有“标准性”和“规范性”,例如:丿在大夭、幺、爻、春、走等字上的形状和安置角度,各不相同;楷体汉字的组字方式,也是多种多样,没有统一的“规律性”。例如,音与昱,元件一样,上下位置改变了,字义就变了;巳、己、已,三字的区别,只是左边开口不同;马,在“码、妈、玛、杩”字上,为“表音”部件,在“驼、驾、驭、驰”字上有为“表意”部件,在“冯、凴”字上,只起到区别字形的“符号”作用。
所以,电脑就不能用楷体汉字的几十个基本组字元件,作为“人、机信息交换标准代码”。这样,就不能用楷体汉字的组字元件,在电脑上组建汉字;也就不能用楷体汉字作为指令,编制电脑作程序了。
从技术方面说,因为汉字不能作为电脑的“人机信息交换标准代码”,中国的电脑设计制造工程师,就不能设计出支持汉字的芯片架构,所以,中国即使具有了设计和制造电脑芯片的技术能力,也还是制造不出支持汉字的电脑芯片。所以,中国制造电脑芯片时,都是买了美国和英国的支持美国“ASCII”码的芯片架构专利和芯片刻录机器。这样,中国的电脑程序员,就不能用汉字编制电脑程序了。
此时,有人会问:我们在电脑屏幕上,看到的汉字,是怎么回事呢?
  在美国的电脑上,显示出汉字办法是这样的:
第一步,把每个汉字做成一个“小图片”。
第二步,给每一个汉字赋予一个唯一的“汉字字模库”的区位码(例如:灯---2138,登---2139,等---2140
邓---2141,凳---2142,瞪---2143  。。。。。。。)然后存入“汉字字模库”里。
第三步,编制一种从字库里调取“汉字”整体的“汉字输入程序”。
第四步,把 “汉字字模库”的使用方法程序,嵌入到“ASCII码”的电脑操作系统(Windows)内。
第五步,在电脑操作系统的管理下,通过“汉字输入程序”,把英文键盘代码(又叫“输入码”),与汉字字模库里的汉字区位码(又叫“汉字内码”)关联起来 ,把汉字从“汉字字模库”里调出。
在英文代码的电脑上,“汉字输入程序”,最基本的有两种:
第一种、汉语拼音输入法。
这种输入法,适合“见字会读音”的人们使用。这种输入法的制作思路是:首先,给每一个楷体汉字,赋予表示这个字的汉语读音的“键盘代码”。在英文键盘上,就设定用“英文字母”来表示“汉语拼音字母”,然后用“英文键盘代码”,来拼写每个汉字的读音。这样,表示一个汉字读音的“键盘代码”,就作为这个汉字的“命名”。然后编一个《汉字拼音输入程序》,把每一个字的“命名”与这个字在字库里的区位码关联起来。例如:楷体字“灯、登、等、邓、凳、瞪。。。。。。”,这些同音字的汉语拼音都是“德鞥(没有含‘声调’)”。在英文键盘上,用英文键盘代码“d”取代声母“德”,用“eng”三个键盘代码取代“鞥”。
“灯、登、等、邓、凳、瞪。。。。。。”在汉字字库的区位码,分别设定为“2138, 2139, 2140,2141, 2142, 2143  。。。。。。。”。《汉字拼音输入程序》把英文键盘代码“deng”与“2138, 2139, 2140,2141, 2142, 2143  。。。。。。。”都关联起来。当打开《汉字拼音输入程序》时,要调出“登”字,就在英文键盘上连续按下“d、e、n、g”键钮,就把汉字库里凡是与键盘代码组“deng ”相关联的汉字“灯、登、等、邓、凳、瞪。。。。。。”,都调出在列表中了。打字者可以从这个列表中选取所需用的汉字“登”。
第二种、汉字笔画输入法。
这种输入法,适合见字不会读音的人们使用。《五笔字输入法》就是“笔画输入法”。这种输入法的制作思路是:
首先对楷体汉字的结构,进行分解,例如“登”字,可以分解为“file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image002.jpg”、“file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image003.gif”、 “file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image004.gif”、“file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image005.gif”。这些被分解的零件,称作“字根”。
然后给每个“字根”赋予一个英文键盘代码。例如:“file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image002.jpg” 的代码为弯w ,“file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image003.gif” 的代码为g , “file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image004.gif” 的代码为K ,“file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image005.gif”的键盘代码为u。这样,“登”字的英文键盘代码命名就是“wgku ”。
再编一个“汉字笔画输入法程序”,把“登”字的“wgku ”命名与“登”字在汉字字模库中的区位码“2139”关联起来。
要调出这个字时,只要输入键盘命名“wgku ”,就把汉字库里凡是与键盘代码组“wgku ”相关联的汉字,都调出在列表中了。打字者可以从这个列表中选取所需用的汉字“登”。
由于汉字楷体字数很多,字根数量远远超过26个英文键盘的英文字母代码,所以,每个英文键盘按钮代码,就只能表示几个字根了。
这种处理汉字的方法,与英文处理方法,有着根本的区别。主要表现如下:
在美国的电脑上,是用英文字母组建英文单词的,即用26个英文字母,随机地组建出无限的英文单词,单词怎么写,键盘就怎么打。
而楷体汉字,不是在电脑上用汉字元件组建的,而是“调取整字”的。这种处理汉字的方式,就是早先的汉字机械打字机的处理方式。只是把铅字盘换成了字模库,拾字“机械手”换成“英文指令”,印字蜡纸换成显示屏,选字还得靠人工。机械打字机存在的那些缺点,在电脑打字中依然存在;并且,如果没有英文信息系统的支持,采用整字调取法,在电脑上也实现不了。
在使用楷体汉字的情况下,汉人与机器的关系是:“人---汉语拼音符号(或五笔画)----ASCII码--- 0、1编码----汉字”关系
在英文代码的电脑上使用的汉字只可以显示出来,是不能当作电脑指令,来编制电脑程序的。
因此,没有汉字代码的电脑,就没有中国独立自主的电脑信息系统和电脑产业体系,中文信息,只能通过英文来调取使用,只能成为英文信息系统的附庸;中国的电脑产业,也只能作为美国电脑产业的附庸。


回复

使用道具 举报

70

主题

1587

帖子

4565

积分

论坛元老

Rank: 8Rank: 8

积分
4565
发表于 2021-2-11 15:24:28 | 显示全部楼层
最早以前是8位的cpu。用ASCII码。现在unicode。64位或128位。可以用汉字编制电脑程序。比如:易语言。

回复 支持 反对

使用道具 举报

16

主题

506

帖子

2446

积分

金牌会员

Rank: 6Rank: 6

积分
2446
发表于 2021-2-11 17:27:53 | 显示全部楼层
古代读书人不能使用儒家经典成侯称王,儒家学说只能成为封建统治阶级维护其利益的工具,难道就应该升级改造儒家学说,建立王侯将相成功说,可见中国程序员不能用汉字编写电脑程序,并不影响电脑世界的完美性。
回复 支持 反对

使用道具 举报

284

主题

766

帖子

4332

积分

论坛元老

Rank: 8Rank: 8

积分
4332
 楼主| 发表于 2021-2-14 16:53:07 | 显示全部楼层
人类制造动力机器,是为了延伸体力,从而实现了工业化革命;制造电脑,是为了延伸脑力,从而实现了信息化革命。电脑是“智力工具”,它的主要功能是帮助人们解决人脑很难解决的问题的,写文章或作统计,仅仅是电脑的一个附属功能。英文代码的电脑,使美国的中学生都会编制应用程序,来解决自己所遇到的难题。
由于中国今天不能制造出“独立自主的纯汉字代码的电脑”,只能使用美国的ASCII码的电脑,所以,绝大多数的不精通英文的汉语人,在英文代码的电脑上,就不会用英文编制电脑程序,随时解决自己所遇到的难题了。
这样,中国的绝大多数的普通大众,在美国的ASCII代码的电脑上,既得不到电脑的根本的好处,也发挥不了编程才能。这就阻碍了中国大众创新潜力的发挥。这相当于买了一匹千里马,不会骑,只能当毛驴用了。

回复 支持 反对

使用道具 举报

284

主题

766

帖子

4332

积分

论坛元老

Rank: 8Rank: 8

积分
4332
 楼主| 发表于 2021-2-20 03:20:22 | 显示全部楼层
附件:
语言文字发展论.rar (2.49 MB, 下载次数: 364)
回复 支持 反对

使用道具 举报

16

主题

506

帖子

2446

积分

金牌会员

Rank: 6Rank: 6

积分
2446
发表于 2021-7-14 14:30:01 | 显示全部楼层
ASCII码(American Standard Code for Information Inerchange),是基于拉丁字母用于显示现代英语和其他西欧语言的计算机编码系统。
计算机这个学科是从美国发展起来的,20世纪二战之後,美国超越法国、德国成为全球科技中心,美国的通用语言是英语,而代表当时最发达生产力的西方世界对计算机使用英语是没有抵触的,因此信息交换标准代码采用美国英语字符发表时在1967年,解决在电子计算机中数据在存储和运算时使用二进制数表示的符号编码一致性,避免相互通信之间造成的信息混乱。
标准ASCII码(也称基础ASCII码)使用一个字节中的7位元,表示美式英语中使用的特殊控制符、标点符号、大写字母、数字和小写字母,最高位元常用作奇偶效验,是在代码传送过程中检验是否出现错误的一种方法。1986年ASCII规范最後一次更新,定义所有的128个字符(即ANSI字符集,ISO 8859-1-1987),新规范使用全部8位元,当最高位元为1时可增加128个字符,这些字符成为Extended ASCII,扩展ASCII码允许将附加的128个字符用于特殊字符、外来语字符和图形符号,譬如法语中字母上方的注音符号,欧洲国家使用256个的字符扩展ASCII码作为编码体系指定各自的标准,但基本ASCII码的规范保持一致。
20世纪80年代亚洲国家引进西方计算机技术,由于东亚、西亚地区的文字符号远远超过256个字符,ASCII码的字符数量局限性被暴露出来,各国首先通过增加字节数量来满足字符数量上的要求,用两个字节表示一个符号,字节最高元置1区别于标准ASCII码,然後跟随第二个字节,因此理论上可表示128*256=32768个字符,其中有中国大陆的GB2312简化汉字码,中国台湾地区的BIG5繁体汉字码,日本电脑的Shift_JIS码,在整个世界范围内出现了数百中编码方案。
在创建UNICODE标准前,对软件开发者而言,基于一个国家编码方案开发的程序移植到另一个国家,标准ASCII码之外的字符转换经常出现错误,必须重新检查修改,因此世界需要统一的编码标准替代上百种相互冲突的字符编码方式。1991年诞生了第一个Unicode版本,为世界上所有的字符设置一个唯一的码点CodePoint,通过这个整数ID来访问和操作字符。世界各国多个语种的字符放在UCS(Universal character Set)中形成了多语种字符集,一个平面字符集由两个字节表示,可容纳256*256=65536个字符,其中0号平面为基本多语种平面,其余为辅助多语种平面。
UTF(Unicode Transformation Format)针对基本多语种平面字符可采用UTF-16编码格式,即用两个字节表示。对于辅助多语种平面字符则需采用UTF-32编码格式,即四个字节表示。由于不同计算机体系结构采用的字节排列顺序不同,UTF-16、UTF-32编码格式分别有big-endian和little-endian两种结构,为了避免与基本ASCII码发生冲突,UTF-16、UTF-32编码格式必须加上前置字符说明以示区别。
UTF-8(eight bit Unicode transformation format),汤普逊Thompson和罗布-派克Rob Pike一起开发基于UNIX的新操作系统Plan 9,作为工作的一部分他们创造了UTF-8这种可变长度的字符编码,1992年9月在新泽西州一列餐车上描绘出UTF-8设计要点。UTF-8可以用来表示Unicode标准中的任何字符,而且其编码中的第一个字节仍与基本ASCII码相容,使得原来处理ASCII字符的软件无需变动,或者进行少部分修改後即可继续使用。
utf8.png
UTF-8有单字节、双字节、三字节和四字节四种结构,单字节采用7位元的ASCII码,最高有效位元为0,其他三种结构第8位最高有效元均置1,区别于标准ASCII码,使原ASCII码成为UTF-8编码格式的一个真子集。UTF-8多字节变长结构可以容纳除基本平面外所有辅助平面的字符数量,而且具有编码自我同步特点,即不必从字串的首字节读取,也能找到字符间的分界,同时规避不同架构中字节排列顺序的结构问题。
UTF-8编码已发展成为当今计算机和网路世界中通用的字符编码格式。

回复 支持 反对

使用道具 举报

70

主题

1587

帖子

4565

积分

论坛元老

Rank: 8Rank: 8

积分
4565
发表于 2021-7-18 14:50:17 | 显示全部楼层
jhz001 发表于 2021-7-14 14:30
ASCII码(American Standard Code for Information Inerchange),是基于拉丁字母用于显示现代英语和其他西欧 ...

jhz001评价一下言氏拼音汉字方案:,http://www.yuyannet.com/thread-1783-1-1.html
回复 支持 反对

使用道具 举报

16

主题

506

帖子

2446

积分

金牌会员

Rank: 6Rank: 6

积分
2446
发表于 2021-7-19 09:30:31 | 显示全部楼层
文字改革的初心是什么,开启民智;以陈独秀、李大钊、蔡元培、胡适、钱玄同、刘半农、周树人等领导的新文化运动,
以白话文替代文言文,以简体字替代繁体字,以注音字符表示汉字,都是想尽快开启民智,开启什么民智,开启德先生、赛先生的民智,这就是初心。
回复 支持 反对

使用道具 举报

16

主题

506

帖子

2446

积分

金牌会员

Rank: 6Rank: 6

积分
2446
发表于 2021-8-13 10:09:20 | 显示全部楼层
纵观历史上的文字改革运动,有一个明显的特点:自上而下的运动能成功,自下而上的运用多失败。

譬如:秦朝李斯统一小篆文字,得到了秦始皇朝的支持成功了,新中国汉字简化远动,得到了毛泽东为首的党中央支持成功了,而新文化运动钱玄同的简体字没有得到北洋军阀的支持失败了。
回复 支持 反对

使用道具 举报

70

主题

1587

帖子

4565

积分

论坛元老

Rank: 8Rank: 8

积分
4565
发表于 2021-8-13 14:16:29 | 显示全部楼层
jhz001 发表于 2021-8-13 10:09
纵观历史上的文字改革运动,有一个明显的特点:自上而下的运动能成功,自下而上的运用多失败。

譬如:秦朝 ...

这是必然的。所以民主化后,百姓有发言权后,就会迎来了汉字改革的春天。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|中国语言文字论坛

GMT+8, 2024-11-15 12:18 , Processed in 0.090960 second(s), 44 queries .

快速回复 返回顶部 返回列表