表意文字描述字符

本页使用了标题或全文手工转换,现处于中国大陆简体模式
求闻百科,共笔求闻
表意文字描述字符
Ideographic Description Characters
范围U+2FF0–U+2FFF
(16个码位)
平面基本多文种平面BMP
字符通用
分配17个码位
未分配-1个保留码位
来源标准GB 2312-80
Unicode版本历史
3.012 (+12)
15.017 (+5)
注:15.1版本更新时,由于原区块只有4个空位,因此赋予第5个新增IDC码位为U+31EF,置于中日韩汉字笔划区间[1][2][3]

表意文字描述字符(英:Ideographic Description Character,IDC),自Unicode3.0版本后加入,至15.1版本再次加入5个字符。

Unicode对于汉字编码的处理大致为先搜集汉字,给予每个汉字一个数字编码。然而,汉字数量庞大,往往字集不完全。再加上汉字本身具有组合以及开放的特性,汉字用户很有可能自造新字,因此不可能有一个字集可以搜集到所有汉字,所以用这样的字符来描述某一个“字”是如何被更基本的部件组合起来。

码表

表意文字描述字符
Ideographic Description Characters
[1][2]
Unicode 联盟官方码表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+2FFx ⿿
注释
1.^ 依据 Unicode 15.1
中日韩笔画
CJK Strokes
[1][2]
Unicode 联盟官方码表 (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+31Cx
U+31Dx
U+31Ex
注释
1.^ 依据 Unicode 15.1
2.^ 灰色区域为未分配码位

另有收录 U+303E IDEOGRAPHIC VARIATION INDICATOR 表意文字指示符,以用来表示形似但不相等的字。

表意文字描述序列

表意文字描述序列(英:Ideographic Description Sequence,IDS)是Unicode标准定义的汉字结构描述语法,一个描述序列是由一个描述符号与所需数量的特定字符(通常为汉字)组合而成,用来表示一个汉字的抽象结构。

Unicode定义了17种组合字符:

编码 字符 意义 例字 序列 例字 序列
U+2FF0 左右结构 ⿰木目 𠁢 ⿰丨㇍
U+2FF1 上下结构 ⿱木口 𪧷 ⿱夕寸
U+2FF2 左中右结构 ⿲彳氵亍 𠂗 ⿲丿夕乚
U+2FF3 上中下结构 ⿳亠口小 𠋑 ⿳亼目口
U+2FF4 全包围结构 ⿴囗口 𠀬 ⿴㐁人
U+2FF5 上包围结构 ⿵几皇 𧓉 ⿵齊虫
U+2FF6 下包围结构 ⿶乂丶 𱐍 ⿶凵米
U+2FF7 左包围结构 ⿷匚斤 𧆬 ⿷虎九
U+2FF8 左上包围结构 ⿸疒丙 𤆯 ⿸耂火
U+2FF9 右上包围结构 ⿹戈廾 𢧌 ⿹或壬
U+2FFA 左下包围结构 ⿺走召 𥘶 ⿺礼分
U+2FFB 嵌套结构 ⿻工从 𣏃 ⿻木⿻コ一
U+2FFC 右包围结构 ⿼ユ十 𫜹 ⿼コ一
U+2FFD 右下包围结构 ⿽十⺀ 𠥼 ⿽十十
U+2FFE 左右镜像 ⿰⿾臣臣 𨙨 ⿾邑
U+2FFF ⿿ 上下翻转 𮗙 ⿺見⿿鬼 𰒥 ⿱⿿戈戈
U+31EF 减去笔画 ㇯曰一 𠀃 ㇯且二

IDS的运算方式是前缀表示法,即运算符号在前,对应数量的汉字元素在后。这种方式不须使用括号等字符辅助即可无歧义地表示运算顺序。

Unicode标准中,规范的IDS应由汉字部首笔画、全角问号字符(U+FF1F),以IDC连接而成。[4]

限制

  • Unicode定义规范IDS序列为前缀表达式,但尚未规定每个汉字的唯一表述方式,即一个汉字可用多种IDS表达,例如“巫”可以表示为“⿻工从”或“⿷⿼工人人”,

“鸂”可以表示为“⿰氵鷄”或“⿰溪鳥”。

  • IDS主要目的在于表达汉字的抽象结构,而不是像组合字符一样用于动态组字。实务上组合汉字的字形绘制有许多复杂要素须考量,光用IDS尚不足以绘出符合一般要求的合成字。例如,组合汉字上下、左右比例往往并非1:1,而是按二部件的实际外形调整;左上-右下、三方包围等组合字的比例计算则更复杂;上下交叠的两部件也需要依赖对汉字的一般认识才能正确解读,例如“⿻工从”是将两个“人”放到“工”的左右两个开口里,而非简单地将“工”和“从”上下叠合。

历史

以下的Unicode相关文件记录了本区段中出现之字符的提议及定稿。

另见

参考文献

  1. U+2FF0-2FFF (PDF). The Unicode Standard. [2023-10-04]. 
  2. U+31EF (PDF). The Unicode Standard. [2023-10-04]. 
  3. Enumerated Versions of The Unicode Standard. The Unicode Standard. [2016-07-09]. 
  4. The Unicode StandardVersion 6.0 – Core Specification (PDF). [2020-02-10]. 

外部链接