(2)《构字规则》

1)《音节》

(一)声符

表示声母的字符

(二)韵符

表示韵母的字符

(三)音节组合

将《汉语拼音方案》简化成 双拼 方案

每个音节由声符 + 韵符,共 2 位组成

共计:406 个

2)《声调分组》


三级简码和四级编码,根据 字频 使用 声调分组

声调分组:即同一音调最多 6 种编码为一组,共计 4 组 24 种编码

# 详见《拼音规则》->《声调表》#

(一)三级简码

理论码位:406*4*6=9744

实际使用:4797 个(不是所有音节都有 4 声调,同声调也有很多大于 6 个汉字的情况)

利用率:49.23%

(二)三级简码扩展

理论码位:270*4*6=6480

实际使用:1847 个

利用率:28.50%

3)《一、二级简码》


按照 字频 将最常用的汉字以最少码位表示

(一)1 位编码(表示最常用字)

理论码位:26 个

实际使用:26 个码位(对应 26 个英文字符)

利用率:100%

# 一级简码为所在声符最常用字,大部分为对应声符

(二)2 位编码(表示次常用字)

理论码位:26*26=676 个

实际使用(音节):406 个码位(对应 406 个汉字音节)

利用率:60.06%(剩余码位由于不与汉语语音对应,不容易记忆,所以放在扩展表使用)

# 二级简码为所在音节(不含声调)最常用字

(三)2 位编码扩展(充分利用码位)

理论码位:26*26=676 个

实际使用(总):406+215=621 个码位(其中 406 个音节编码,215 个扩展编码)

利用率:91.86%(剩余码位由于不与汉语语音对应,不容易记忆,所以暂未使用)

# 二级简码扩展为所在音节(不含声调)最常用字补充

4)《三级简码》


3 位编码形式

理论码位:26*26*26=17576 个

实际使用:4797+1847+21=6665 个

利用率:37.92%(在有规律且容易记忆的情况下已经是较高的利用率了)

# 三级简码为所在音节(含声调)最常用字,按照字频编码

分为两种情况:

(一)同音少于等于 6 个汉字(三级简码)

声符 + 韵符 + 声调(字频序)

示例:埃 aic 哀 ain | 癌 aio 挨 aiu | 矮 ais 蔼 | 碍 aie 艾 aiz

(二)同音多于 6 个汉字(三级简码扩展)

使用 借音位 的方法处理

借用 676-406=270 个(部分)未使用音节编码

大部分借用韵符位,少量借用声符位或声符 + 韵符位

示例:巴 bac -> 捌 bqc

示例:利 lie -> 厉 oie -> 沥 oee

5)《四级编码》


四级编码用于处理不可 3 位编码用字,多为罕用字

在三级简码的基础上,增加一个 符号位,共计 4 位编码:

声符 + 韵符 + 合成字符 (') + 声调(字频序)

或

声符 + 合成字符 (') + 韵符 + 声调(字频序)

共计:1220 个

示例:熬 aoo -> 嶅 ao'o

6)《五级编码》


《通用规范汉字表》表外汉字,通过已编码字合成:

借助合成字符 " 表示

示例:壝 = 土(tus) + 遗(yiw) = tus"yiw

# "五级编码" 几乎等同于万能构字法 #

(3)《构词规则》

点击查看


技术支持:XinHanzi.com