仓颉输入法
中文输入法

仓颉输入法的正体中文取码
发明人朱邦复
发明年份1976年
类别字形输入法

仓颉输入法是一种常用的中文输入法,由有“中文计算机之父”美誉的朱邦复先生于1976年创制。初期只有繁体中文版本,原名“形意检字法”,用以解决计算机处理汉字的问题,包括汉字输入、字形输出、内码存储、汉字排序等。朱邦复发明此输入法时正值他为三军大学发展中文通信系统之际,时任三军大学校长的蒋纬国为纪念上古时期仓颉造字的精神,乃于1978年将此输入法重新定名为“仓颉输入法”。

1982年,朱邦复登报公开放弃仓颉输入法专利权,并且极力推动计算机的汉化。现今大部分操作系统,甚至一些电子辞典皆附有仓颉输入法,繁体中文键盘也大多印有仓颉输入法的字根。在繁体中文世界里,仓颉输入法是最为普及的形码输入法之一。

仓颉输入法适用于多种平台,主流的中文操作系统和大部分电子辞典均有内置。一些字典、辞典或在线中文字典亦采用仓颉编码作为检索工具。

简介

历史

在仓颉系统中,仓颉码不仅用来输入固有字,也可以组合、输出字形,甚至呈现虚构字。

1973年春季,朱邦复返回台湾后,欲改良中文打字机,钻研中文检索方式。花了约三年时间,并且在研究后期得到国立台湾大学中文系毕业生沈红莲女士协助担任助手,于1976年底发布“形意检字法”,最初使用52个中文字母作检索字母,每个汉字分拆成3个字母的编码。当时,三军大学需要无给职人员发展中文通信系统,40岁的朱邦复立即接受此一职务,这时的他并不懂计算机,至此才开始接触编程语言。

1978年8月,朱邦复和助手沈红莲重新规划拆取字根的方法,采用“首二身三”的规则,使检索字母数由52个减至26个,以适应一般计算机键盘。在减省字母前,原先的设计是在同一键中安置两个中文字母,以Shift键区分两者。

1979年,三军大学的有线短程中文通信实验成功,朱邦复实现以中文字母作为内码,存储汉字字矩信息,解决计算机处理汉字的问题。时任三军大学校长的蒋纬国先生为其赐名“仓颉输入法”。朱邦复在同年12月开始,与宏碁计算机合作,开发内置编程语言、中文系统及应用软件的“天龙中文计算机”,于翌年起在市面上销售,备受市场欢迎。此中文系统以仓颉码为其根本,收字数万,效率甚高。朱邦复因此获颁发“行政院长奖”。

朱邦复继续改进仓颉输入法。同年,由他成立的零壹公司发表第二代仓颉输入法,使用在他为Apple II计算机设计的“汉卡”产品上。“汉卡”为该机提供中文接口,售价新台币1500元,使得华人利用计算机处理中文的成本更低。

1982年,朱邦复在《康熙字典》里选取四万多字,改良第二代仓颉,使它适应大字集的输入,并把成果发表为第三代仓颉输入法。同年,他登报公开放弃仓颉输入法专利权,并且极力推动计算机之汉化。现今大部分操作系统,甚至一些电子辞典皆附有仓颉输入法,为繁体中文世界最普及的形码输入法。

朱邦复本来想根据其“汉字基因”理论,创建一套“仓颉系统”,用仓颉码统一处理汉字的形、音、义、码、序、辨等六大问题。其中仓颉码的原始目的是汉字检索及排序,其取码具有前缀及字身的概念,以前缀做为分类,字身做为补充,如此便可让计算机“理解”汉字,进而达到组字、字义理解,甚至与人沟通的功能。

由于本以汉字检索为目的,仓颉取码依据视觉识别原理,能反映汉字的细微特征,同一汉字的不同字形或异体字,许多时都会有不同的编码,因此重碼率为当今中文输入法最低者。仓颉输入法亦为一般系统中支持字库最大者,几乎所有系统可见的汉字,皆可用仓颉输入法(系统)键入,因此也成为汉字文化工作者选用的主要输入法。然而,当今主流计算机系统只提供仓颉输入法,没有采用整套仓颉系统,因此许多原先的设计理念,如仓颉内码、字体产生器与极大字库等,都没有实现。

优缺点

由于开发甚早,又无著作权,仓颉输入法的普及度在中文计算机系统中十分高,号称“只要有中文系统,就必定有仓颉输入法的存在”,所以人们学习仓颉后,理论上是不用担心无法使用它的。此外仓颉的重码率为所有中文输入法中最低,这就让用户只需要看着稿子或键盘就能打字,不需要紧盯着萤光幕来选字,实现“盲打”。仓颉输入法字根较许多形码输入法少和简单,容易记忆。它不依靠四排按键——即使没有把键盘上的数字键、符号键都用作中文字根键,输入时手指活动幅度与英文打字相若也免除输入符号、数字时的困扰,以及在笔记本电脑键盘上遇到的移位问题。它对汉字的拆分规则清晰严谨,只要熟悉拆码规则,绝大多数汉字的拆码都没有争议。仓颉输入法支持的字库极大,能输入几乎所有系统能呈现的汉字。

仓颉输入法虽然具备以上优点,但也受到许多批评,例如为了顾及检索而令编码规则相对较繁复,没有容错编码,取码字形问题,版本差异问题,导致规则略显繁琐、取码或遇问题,而被一些人视为畏途。另外仓颉输入法并未为常用字之快速输入设计简快码,没有类似于五笔的词组输入方法,标点符号之输入也略嫌不便,因此没有成为最快速的中文输入法。

不过,仓颉输入法有一些派生版本,改进了上述的批评点,例如加入容错编码、不同字形的取码、简快码、词组输入,同时容许不同版本的取码等。它们都标榜可以由传统仓颉输入法轻松跳至派生版本。当中有一些版本更提升了输入速度。例如大新仓颉输入法,是当前中文计算机输入最快速纪录的优胜者。

仓颉还有一些特色,常被竞争对手或批评者视为缺点,但有研究输入法的人士并不同意有关批评。包括:依字形来取码,而非依书写的笔画和笔顺取码;同一笔画可以剪开等。批评者认为它违反汉字逻辑,令汉字走上“歧途”,是缺点。反驳者则指汉字在分析构形字理、字典部首归部时,都是按形状分析,会不依笔顺甚至剪裁笔画,因此这只是主观上接受与否的问题。有些竞争对手如呒虾米的发明人或拥护者甚至以攻击仓颉输入法来作为文宣,一些输入法硏究者对此不予认同。

最新版本

当前仓颉输入法通行的最新公开版本是第五代,而流传最广泛、最常使用版本是第三代。三代仓颉与五代仓颉相差不大。

朱邦复的多年助手沈红莲,另行设计苍颉检字法,坊间多称之为“第六代”仓颉,但实际使用上,一般都不把它视为仓颉输入法的新版本,相反更像另一款由仓颉派生而来的新输入法。它与三代仓颉或五代仓颉相差较大,字根明显增多,拆码规则也有不少改变。它应用于朱、沈二人开发的仓颉系统上,该系统字库完整收录了历代文献用字十万以上,以苍颉码作为内码,重码率低于5%。虽然仓颉输入法爱好者向朱邦复工作室索取到苍颉检字法编码,但它尚未正式发布。

输入接口

Microsoft Windows
播放媒体 在Ubuntu之下,以Gedit利用仓五输入中文播放媒体 在Android设备输入中文
維基百 
这样的小框于文字旁边。
廿  
结果会与速成输入法出来的结果一样。
OS X
維基百竹重重十
維基百科

版本与平台

版本演进

由“面”、“非”两字即可辨别是第三代、第五代仓颉或者苍颉检字法:
  • 三代:“面”字取码MWYL( );“非”字取码LMYYY(
  • 五代:“面”字取码MWSL( );“非”字取码LMSY( 
  • 苍检:“面”字取码MWS(  );“非”字取码LSY(  

软件支持

Windows 95/98/NT/ME/2000/XP等操作系统中内置的仓颉输入法是第三代的修改版;Windows Vista/7/8内置的仓颉输入法则兼容第三代和第五代(默认情况下,仅支持第三代;设置使用CNS11643中文标准交换码字根后,可同时支持第三代和第五代)。Windows 10 内置的仓颉输入法则仅支持三代,并不兼容五代。
Mac OS X 10.4内附的为第五代。
SCIM、gcin及iBus同时提供第三代和第五代,部分如OXIM只提供第五代。
电子辞典等平台,中文全字库[永久失效链接]、汉字构形数据库等汉字数据库检索系统,皆采用第三代。而朱邦复推广的汉文库典,则采用第五代。
此外网络上还有许多自制的仓颉输入法,第三代和第五代皆有,例如马来西亚。仓颉之友所制作的仓颉第五代通用版、国际版与香港版等,采用了五代仓颉。

取码方法

这里仅提供简介,详情可见 维基教科书中有关仓颉输入法的文本。

仓颉键盘

仓颉输入法所有字根在计算机键盘上的排列 只备仓颉字母的键盘,这种设计类似007电影《明日帝国》中出现的中文计算机键盘

仓颉字母即仓颉输入法的主要字根(主根),分为四大类,共24个,另有2个特殊键。这些键与26个英文字母一一对应(以下括号内的中文字为字母之代表字):

哲理类笔画类人体类字形类特殊键
  • 日(A)
  • 月(B)
  • 金(C)
  • 木(D)
  • 水(E)
  • 火(F)
  • 土(G)
  • 竹(H)
  • 戈(I)
  • 十(J)
  • 大(K)
  • 中(L)
  • 一(M)
  • 弓(N)
  • 人(O)
  • 心(P)
  • 手(Q)
  • 口(R)
  • 尸(S)
  • 廿(T)
  • 山(U)
  • 女(V)
  • 田(W)
  • 卜(Y)
  • 難(X),用于特殊的“难字”,如:      等。注︰输入    并不会输出“難”字。
  • 重(Z),原本用于重码字,但从第三代开始不再使用。部分系统改用作输入标点符号,如句号 ,或者被一些自制仓颉当作特殊键用,写法不一,有写作“重”、“片”、“符”、“標”等。

举例说,“妲”字由仓颉字母“女、日、一”组成,输入时就敲打“女(V)、日(A)、一(M)”三键。

这24个仓颉字母还可再变化、派生出“辅助字形”(辅助字根、辅根),来组合所有的中文字。例如:“水”派生出“氵”;“手”派生出“扌”;“中”派生出“丨”;“弓”派生出“亅”;“田”派生出外围的“囗”(框内有东西,与‘口’不同)等等。详情可见维基教科书上的说明。

这里举出一个运用辅助字形的例子:“泗”字由辅根“氵、囗、”组成,由于“氵”隶属“水”,“囗”隶属“田”,“”隶属“金”,输入时就敲打“水(E)、田(W)、金(C)”三键。

实际应用时,仓颉字母和辅助字形通常会混用,比如“烟”字由主根“火”、辅根“囗”(隶属“田”)和主根“大”组成;“桐”字由主根“木”、辅根“冂”(隶属“月”)和主根“一”、“口”组成;“銀”字由主根“金”、“日”和辅根“”(隶属“女”)组成。

取码概要

仓颉输入法的取码示例

凭视觉(非字义或笔顺)把汉字分割为前缀及字身,前缀为最左、最上、最外部分,剩余部分为字身。若字身可以再分,则分为次前缀和次字身。各部分再分拆为有限个字码(中间部分省略),以不破坏字形特征和视觉容易辨识为准。

前缀最多取二码,字身最多取三码;无法明确分割为前缀、字身者(如“东”),则全取。一个汉字最少用一码输入,最长则为五码。取码以后再按下空白键(组字键),即可输出字符(字形)。

例如:

汉字分割码数取码键盘上的按键
整体字,无法分割最多取 4 码中中LL
前缀:王 . 字身:里最多取 2 . 3 码一土 . 田土MGWG
前缀:艹 . 次前缀:女 . 次字身:古最多取 2 . 1 . 2 码廿 . 女 . 十口廿TVJR
前缀:言 . 次前缀:五 . 次字身:口最多取 2 . 2 . 1 码卜口 . 一一 . 口YRMMR
注︰以上数字为取码类型。基本上,只要将字形一分为二,最左、最上、最外的前缀部分,取首、尾二码;其余的字身部分,依规则取三码,则可拆解所有汉字。

正简输出

仓颉输入法是少数能同时输出正、简体的输入法,但部分平台(如微软Windows)上的简体仓颉拆字并不标准,部分违反了原本的拆码规则,或者使用了非简体字习惯字形,用户需要稍作适应。一些外挂的仓颉输入法会改用朱邦复工作室的标准仓颉编码,不会出现下述的问题码;或者采取加入容错码,令同一字可能有超过一种拆码方法。

例如:

简体字字码注译
金一大微软依照字的传统写法来拆码,首码为“金”而非“廿”,全码为“金一大”。标准仓颉依简化字习惯写法,取“廿大”。
戈弓言字旁作前缀时,微软取码为“戈弓”,如“订”的编码是“戈弓一弓”。但标准仓颉取“戈女”,如“订”字取“戈女一弓”。

不过,大部分字如                等,均符合繁体仓颉的取码原则,毋须重新适应。

其他特色

以下是字形输入法的比较
输入法时间
(年)
辅助字根数大五码常用字重码率
共5401个字
仓颉1976140个(含难字根)三代: 434 5401 = 8.04 % {\displaystyle {\frac {434}{5401}}=8.04\%}
郑码1980约170个不明
五笔1983约200个
大易1988约250个三码: 2115 5401 = 39.16 % {\displaystyle {\frac {2115}{5401}}=39.16\%}
四码: 613 5401 = 11.35 % {\displaystyle {\frac {613}{5401}}=11.35\%}
呒虾米1989基本字根约350个
简速字根约150个
2515 5401 = 46.57 % {\displaystyle {\frac {2515}{5401}}=46.57\%}
行列1992超过300个 1064 5401 = 19.70 % {\displaystyle {\frac {1064}{5401}}=19.70\%}

仓颉和速成也能输入标点符号,方法是输入 ,速成则取头尾码,或选择全角后直接按键盘上相应的半角标点符号。另外同时按下 Ctrl+Alt+, 会弹出符号表。

第一个只能为 A、B、C 其中一个,
第二个只能为 A 至 Y 其中一个。

比较常用的为 ,以及 

使用状况

派生

有众多输入法皆源自仓颉输入法,如下所示:

  1. 免费公益软件(支持Windows Vista/7)
  2. 使用全新的“TSF”输入技术,全面支持32位/64位Windows平台。
  3. 依据Windows第三代仓颉为基础
  4. 支持及更正统一码字根的编码
  5. 含有词组输入,大幅提高输入速度

输入法表格:

  1. 选字范围以国家语委早期发布的现代汉语通用字表和2013年发布的通用规范汉字表及其征求意见稿为蓝本。在此基础上略有扩展。整理编码字数超过8700字。实际可录入字数超过17000字(含单字全拼输入,拼音方案采用谷歌输入法开源码表)。
  2. 取码以简化字宋体字体为标准。
  3. 取码基本沿用仓颉五代的取码规则,在左右结构和上下结构的判断上采用了更直观的方式。
  4. 字根以网上流传的苍颉检字法为基础,为便于简化字录入进行了一定改进。
  5. 对取码有争议或有难度的字设立了容错码,容错码的设置以不增加常用字重码为原则。
  6. 一、二级汉字中的五码字均可四码输入。
  7. 在不增常用字重码的情况下设置大量简码,多数常用字可在三码内完成录入。
  8. 码表内容以 CC-BY-NC-SA-3.0 协议授权。

以下是商业软件:

需要著作权持有人重新发布或开放源码的输入法:

www.zuoweixin.com
问题反馈联系QQ:暂无联系方式,也可发qq邮箱。