本仓库仅梳理常见的汉字字表和字符集(汉字来自CJKV)
数据以纯文本方式展示,file.txt
文件格式(UTF-8
格式编码)如下:
# 注释:字表名
# 注释:汉字数
# 注释:其他说明
# 空行分隔
汉 # 每字一行(或一组字,以括号表示繁体、异体字、旧字形等)
字
简〔繁〕
- 字表的PDF文档汇集参见:🔗 zispace/hanzi-docs
- 更多字表参见:🔗 zispace/hanzi-chars-ext
- 《通用规范汉字表:8150 字(一级字3500,二级字3000,三级字1605)
- 《义务教育语文课程》(2022年版)
- 识字写字教学基本字表:300 字
- 常用字表:3500 字(同《通用规范汉字表》一级字,分为字表一2500字和字表二1000字)
- 《汉字应用水平等级及测试大纲》字表:5500 字(《通用规范汉字表》全部一级字3500个+二级字2000个)
- HSK(汉字水平考试/国际中文教育):
- 《国际中文教育中文水平等级标准》汉字表:3000 字(《通用规范汉字表》一级字2967个+二级字33字)
- 《国际中文教育中文水平等级标准》手写汉字表:1200 字
- 香港《常用字表》:约 4761 字(组)
- 香港《小學學習字詞表》:4804 字
- 香港《小學分級常用字表》:2600 字(组)
- 臺灣《常用國字表》:4808 字
- 臺灣《次常用國字表》:6329 字
- 日本《常用漢字表》:2136 字(组)
- 日本《学年別漢字配当表》:1026 字
- 韩国《漢文教育用基礎漢字》:1800 字
- 《汉语水平词汇与汉字等级大纲字表》(2001年版)字表(汉语水平考试HSK):约 2900 字
- 《现代汉语通用字表》(1988年):7000 字(包括《现代汉语常用字表》(1988年)全部 3500 字)
- 《现代汉语常用字表》(1988年):3500 字
- 语体文应用字汇(4261字) 1928年6月 陈鹤琴
- 常用字选(2000字) 1946年8月 四川省教育科学院
- 常用汉字登记表(1017字) 1950年9月 中央人民政府教育部社会教育司
- 常用字表(2000字) 1952年6月 中央人民政府教育部公布
- 识字正音3500字表(3559字) 1954年7月 中国大辞典编纂处
- 普通话常用字表(3000字) 1958年8月 山东省教育厅
- 常用字表(3100字) 1965年3月 北京市教育局中小学教材编审处
- 4500字表(4444字) 1975年 中国文字改革委员会汉字组
- 汉字频度表(6376字,常用字部分4152字) 1976年12月 七四八工程查频组
- 增订2500字表 1979年7月 中国文字改革委员会汉字组
- 六年制小学语文统编教材生字表(3189字) 1984年 人民教育出版社
- 常用构词字典(3994字) 1984年3月 中国人民大学语言文字研究所
- 社会科学自然科学综合汉字频度表(7754字,常用字部分3500字) 1985年3月 北京航空学院计算机科学工程系 中国文字改革委员会汉字处
- 汉字频率表(4574字) 1985年7月 北京语言学院语言教学研究所
现代汉语词典 1978年8月 中国社会科学院语言研究所新华字典 1979年 商务印书馆- 信息交换用汉字编码字符集·基本集(6763字,一级字3755个) 1981年5月 国家标准局发布【GB/T 2312-1980】
- 标准电码本(7292字) 1983年 邮电部 【《标准电码本》】
- 印刷通用汉字字形表(6196字) 1965年1月 中华人民共和国文化部和中国文字改革委员会联合发布 【《印刷通用汉字字形表》】
- 1986年度新闻信息流通频度(6001字) 1987年1月 新华社技术研究所
- 《简化字总表》(1986年新版):2235 字(组)
- 《标准电码本》(1983年修订本):7079 字
- 《简化字总表》(1964年版):2236 字(组)
- 《印刷通用汉字字形表》(初版1965年):约 6000 字(组)
- 《第一批异体字整理表》(初版1955年):原 810 组
- 日本《当用漢字表》(1946年):1850 字(组)
- Unicode CJK 汉字合集:98682 字(包括“〇”)
- 细分:基本汉字、基本汉字扩展 A ~ I 等(Unihan)
- 以及:汉字部首、注音、笔画等
- GB/T 2312-1980 “国标码”(GB0):6763 字
- GB/T 12345-1990 “国标码繁体版”(GB1):6866 字
- GBK 1.0 “国标扩”:21003 字
- GB 13000-2010:70207 字 (等同ISO/IEC 10646:2003=Unicode 4.0)
原 GB 13000.1-93:20902 字(等同ISO/IEC 10646-1:1993=Unicode 1.1,包含CJK统一汉字共20902字)- GB 13000-202X (等同ISO/IEC 10646:2020=Unicode 13.0):正在批准中
- GB 18030-2022:87887 字
GB 18030-2000:27533 字GB 18030-2005:70244 字
- Big5 “大五码”:13058 字
- CNS 11643(臺灣)中文標準交換碼(全字庫):约 10 万字
- HKSCS《香港增補字符集》:4602 字
- MSCS《澳門增補字符集》:427 字
- 日本《JIS X 0208》:6355 字(辅助集、扩充集增加 3695 字)
- 韩国《KS X 1001》:4888 字
- IICore《国际表意文字核心》:9810 字
- 《古籍印刷通用字规范字形表》:14250 字
- 《现代常用独体字规范》:259 字
- 臺灣《本土語言成果參考字表》(台語客語):6792 字
- 香港《常用外字表》:约 1300 字(不含【ㄅ級】【ㄆ級】常用臺灣閩客漢字) 🔗 ichitenfont/suppchara