(一)声符
表示声母的字符
(二)韵符
表示韵母的字符
(三)音节组合
将《汉语拼音方案》简化成 双拼 方案
每个音节由声符 + 韵符,共 2 位组成
共计:406 个
三级简码和四级编码,根据 字频 使用 声调分组 声调分组:即同一音调最多 6 种编码为一组,共计 4 组 24 种编码 # 详见《拼音规则》->《声调表》# (一)三级简码 理论码位:406*4*6=9744 实际使用:4797 个(不是所有音节都有 4 声调,同声调也有很多大于 6 个汉字的情况) 利用率:49.23% (二)三级简码扩展 理论码位:270*4*6=6480 实际使用:1847 个 利用率:28.50%
按照 字频 将最常用的汉字以最少码位表示
(一)1 位编码(表示最常用字)
理论码位:26 个
实际使用:26 个码位(对应 26 个英文字符)
利用率:100%
# 一级简码为所在声符最常用字,大部分为对应声符
(二)2 位编码(表示次常用字)
理论码位:26*26=676 个
实际使用(音节):406 个码位(对应 406 个汉字音节)
利用率:60.06%(剩余码位由于不与汉语语音对应,不容易记忆,所以放在扩展表使用)
# 二级简码为所在音节(不含声调)最常用字
(三)2 位编码扩展(充分利用码位)
理论码位:26*26=676 个
实际使用(总):406+215=621 个码位(其中 406 个音节编码,215 个扩展编码)
利用率:91.86%(剩余码位由于不与汉语语音对应,不容易记忆,所以暂未使用)
# 二级简码扩展为所在音节(不含声调)最常用字补充
3 位编码形式
理论码位:26*26*26=17576 个
实际使用:4797+1847+21=6665 个
利用率:37.92%(在有规律且容易记忆的情况下已经是较高的利用率了)
# 三级简码为所在音节(含声调)最常用字,按照字频编码
分为两种情况:
(一)同音少于等于 6 个汉字(三级简码)
声符 + 韵符 + 声调(字频序)
示例:埃 aic 哀 ain | 癌 aio 挨 aiu | 矮 ais 蔼 | 碍 aie 艾 aiz
(二)同音多于 6 个汉字(三级简码扩展)
使用 借音位 的方法处理
借用 676-406=270 个(部分)未使用音节编码
大部分借用韵符位,少量借用声符位或声符 + 韵符位
示例:巴 bac -> 捌 bqc
示例:利 lie -> 厉 oie -> 沥 oee
四级编码用于处理不可 3 位编码用字,多为罕用字
在三级简码的基础上,增加一个 符号位,共计 4 位编码:
声符 + 韵符 + 合成字符 (') + 声调(字频序)
或
声符 + 合成字符 (') + 韵符 + 声调(字频序)
共计:1220 个
示例:熬 aoo -> 嶅 ao'o
《通用规范汉字表》表外汉字,通过已编码字合成: 借助合成字符 " 表示 示例:壝 = 土(tus) + 遗(yiw) = tus"yiw # "五级编码" 几乎等同于万能构字法 #
技术支持:XinHanzi.com