Unihan数据库是统一码联盟在中日韩统一表意文字中维护的数据库文件。
内容
数据库中包括统一码标准中全部经过编码的统一汉字,具体有:
- 统一码与各国家、地区标准及各工业标准的映射。
- 依据重要字典(如康熙字典)的排序索引。
- 经过编码的异体字。
- 汉字在各种语言中的发音。
- 英文释义。
实现
数据库的发布方式有:
- 统一码联盟维护的网站版本[1]。
- 可供下载的txt文本文件。
- 基于上述文件开发的第三方版本。
- libUnihan项目开发了一套可供调用的c函式库,和一个SQLite格式的Unihan数据库。[2]前者以LGPL协议发布,后者以MIT协议发布。
参见
参考资料