基元字母156
如果构字元件采用向量存储法能够得到更大的信息压缩比,其样板集中的构字元件还可以进一步压缩到只有156个。即在样板集中(字库)只需保存一种尺寸的基本元件(基元字母)信息,需要组合字形时,把组成该字的基元字母从存储器取出,经过信息还原、选择压缩、对准位置后,就可以得到相应的字形。
基元字母的高和宽可以压缩,位置可以变动,但其拓扑结构不可改变。魔拼的基元字母来源于过渡性声母符号以及纯韵独体字结构中的所有构字元件,其音素基元108个(24声母+24韵首+60韵末),另外加上48意符总共合计为156个基元字母。
魔拼共有三种组合格式,格式间各自对应的构字元件的拓扑结构完全相似,不同之处在于它们相互间存在的压缩比例,如下面是纯韵独体(包含过渡性声母)、声韵独体、形声合体三种格式的字母元件压缩比:
三者的垂直方向比例:3:2:2,水平方向比例:3:3:2。(意符没有压缩比)。
每个基元字母的高和宽都只有一次被压缩的机会,而压缩比都是3:2的恒量数据。基元字母用于声韵独体字结构时,其字母垂直方向被压缩;基元字母用于形声合体字结构时,垂直与水平两个方向都同时被压缩,而且所有的压缩比都是3:2的比例尺。
魔拼的每个构件都是标准化、通用化的几何数据,而且都有固定的、精准的坐标位置。其构件的位置、方向、大小的变量也都是单一的极为可控的数据模式,而这些简单的数据模式都是魔拼能够简单的进入计算机的前提条件。
魔拼是系统化、规范化的二维平面数据结构,通过撮合算法使得魔拼的几何图形文字做到字母元件结构的公式化和格式化,很方便电脑通过元件组装整字。
魔拼不与汉字争夺Unicode字库编码资源,只需在字库(元件库)中存储少量有限的156个基元编码(刚好是52个英文字母的3倍),就能组建出无限且数量庞大的语言文字系统。
魔拼的字体存在于构字部件中,通过156个构字部件的每一次风格的改变,就可以在很短的时间内诞生一种新的字体文件。而无需去做几千上万个整体字形的字库文件。
|