Skip to the content.

徐码·尔雅输入法·2022版·简明教程

forFudan 写于 2022年5月31日 https://zhuyuhao.com/xuma/tutorial

点此阅读简体版本

1. 初识徐码

1.1. 汉字输入法

输入法,顾名思义,就是汉字(或其他字符)录入进电脑中的方法。大多数时候,输入的过程,有两个阶段:

  1. 用户将汉字,用一定规则,编成一串字母、数字、符号的组合,输入电脑中。
  2. 输入法会串字符,根据一定的规则,转化为对应的汉字,显示到屏幕上。

当我们用「输入法」指代第二个阶段时,一般我们指的是软件。徐码可依托 Rime(小狼毫、鼠须管等)、小小输入法、大大输入法等平台实现输入。

点击此处,了解如何在各平台(Windows, Macos, 安卓,iOS)上安装并使用 RIME·徐码。

本教程中的「输入法」,特别指代上文中提到的第一阶段,亦即:用户将汉字,用一定规则,编成一串字母、数字、符号的组合,输入电脑中。

1.2. 输入法种类

输入法,根据其特点,一般分为三类

音码输入法,最常见的例子就是拼音了。我们将汉字对应的拼音,直接输入到软件中,软件会显示对应的汉字供你选择。

形码输入法,最常见的例子是五笔字型。我们将汉字拆成若干部件,输入每一个部件对应的代码,软件会显示出汉字。常见的形码,还包括五笔字型,郑码,仓颉等等。

徐国银老师发明的徐码繁简通打输入法(尔雅输入法),便是一种形码输入法。

1.3. 形码和音码的对比

形码输入法和拼音最大的区别,在于拼音输入法,知道读音,便能输入汉字。而形码输入法,知道写法,便能输入汉字。

音码的优点,不言而喻,只要知道标准的发音,便可以打出字来。同时,汉语拼音也是当代人的必修课,不需要特别地学习,因此,它的学习成本近乎为零。

音码缺点,那便是同音字很多,经常需要选字。虽然当代的不少输入软片在「智能化」上下足了工夫,但在输入一些书面语、古文、或者生僻字词时,还是需要选字。大量翻页会打输入的节奏。

形码的优点,便是像写字一样去打字。你不需要知道每个字的具体读音。同时,因为编码比较离散,你甚至不怎么需要去选字。这在写作时,保证你的思路不被打断。在看打、或者打古文的时候,形码的速度很快。

音码缺点是,如果你一下字忘了这个字的写法,那就会卡住,必须临时改用拼音输入法(反查)。

至于音码和形码哪个更好?这就是仁者见仁、智者见智的问题了。当然,也依赖于你的需求和使用场合。笔者在日常对话时使用拼音,在写作时使用徐码,做到扬长避短。

1.4. 徐码的特点

徐码作为一种形码输入法,除了继承了刚刚所说的形码的全部重点外,还有一些自身的特点,让它在众多输入法中脱颖而出。这里仅举例一二:

这个对比一下五笔、郑码、徐码、仓颉在不同汉字字符集下的单字全码的重码数量。更多比较见此页面 https://zhuyuhao.com/chinese-input-schemes-statistics/

其中:

形码方案 通规 国字 常用繁简 GB2312 BIG5 GBK 动态重码率 动态选重率 特点
五笔86 787 357 1938 537 2236 6582 7.77% 0.34% 四码定长 单编码 字根分区
五笔98 763 329 1867 515 2150 6368 8.56% 0.37% 四码定长 单编码 字根分区
五笔06·新世纪 831 387 1970 532 2373 6610 7.90% 0.31% 四码定长 单编码 字根分区
郑码 843 311 2063 563 2206 6590 7.50% 0.59% 四码定长 单编码 大码分区 小码形托
徐码22 495 131 678 320 1104 2899 3.49% 0.10% 四码定长 双编码 大码分区 小码音托
仓颉五代 498 164 714 422 978 2893 12.07% 0.89% 五码定长

可见,徐码在任何字集下都有着优异的表现。尤其在繁简通打模式下,它是绝对的王者。

1.5. 徐码的资源

徐码(2022版「新徐码」)的 QQ 群是: 761401688。

你可以在群里和大家讨论,同时获取学习资料、字根图、最新码表。

1.6. 学习步骤

学习徐码,一般从了解拆字和熟悉字根开始。

拆字,就是把汉字按照一定的规则,拆成唯一的部件组合。拆分出来的部件,便叫做「字根」。

这里所谓的「部件」,不仅包括你我熟知的「偏旁部首」,也包括了一些基本笔划,甚至是一些汉字。因此,笔画输入法(横竖撇捺折),也是一种特殊的形码。那么我们为什么要创造别的形码呢?因为一个字若用十几个、甚至几十个字母代替,太没有效率。故而,我们会截取一些比较大的部件作为字根。

对于汉语使用者,拆字并不是一件陌生的事情。我们自小就学会将一个字拆成分离的部首,进行检索。大多数时候,这是非常直观的。比如

对于徐码而言,大多数的字,也是这么拆分的。并且大多数的偏旁部首,也都是「字根」。

所以恭喜你,对于大多数的汉字,你已经可以凭借直觉进行拆分了。

接下来,我们所要学习的,就是:

  1. 了解并记下字根有哪些,以及它们对应的编码。
  2. 了解徐码拆字的规则,从而得到唯一的拆分方法。
  3. 学习编码规则,将拆好的字根转化成最终的徐码。

以上内容不论顺序,可以交叉或同步进行。

2. 字根编码

2.1. 大码和小码

在徐码中,每一个字根,都对应了两个字母。换句话说,徐码使用的是双编码字根。这一点和郑码相同,和五笔不同。特别的:

字根的大码和小码的分布,并不是随机的,而是有一定的规律。在接下来的教程中会进行介绍。

2.2. 字根图

我们将字根的分布画出来,这便是字根图。如下。

图中,每一个方框右上角的大写字母,就是大码,也就是一群字根的「户口」。而字根右下角的小写字母,则是小码,也就是单个字根的「姓名」。

将大码和小码组合起来,就是一个字根的编码了。比如:

字根图是查询字根的重要工具,初学者应当时常将它放在手边,以利用查询。

徐碼字根圖

2.3. 字根大码的规律

字根大码,是按照字根第一笔的笔画来制定的。

一般地,各字母上的字根呈现以下的规律:

其中,只有 A 和 C 键上的字根需要特别记忆。

2.4. 字根小码的规律

3.4.1. 主根

每个大码下,都有若干字根比较重要,使用频率高,叫做「主根」。

第一主根的小码是v,第二主根是u。例如:

注意:我在这里使用大写和小写的拉丁字母,是为了区分大码和小码的概念。在实际打字的过程中,不需要区分大小写。

3.4.2. 副根

另一部份字根,我们叫它「副根」。

副根的小码是除了uv的其他的字母。

一般情况下,副根的小码是它的汉语拼音的第一个字母(请注意,这只是一种记忆方式,并不是说明徐码是一种音形码)。例如:

3.4.3. 字根练习

通过查询字根图,写出以下字根的编码,分辨它是主根还是副根,并用输入法软件打出这个字:

阅读字根图上的字根,将它们逐一输入到电脑中,从而对字根编码以及它的性质有一个初步的印象。

3. 拆字规则

先前说过,拆字,就是把汉字按照一定的规则,拆成唯一的字根组合。

我刚刚用的「部」字为例,说明了拆字的一般形式。这种将字拆成直观的、分离的部件的方法,足以应付大部分汉字的拆分了。但在实际使用中,遇到这个问题:一个独体字,本身不是字根,怎么办?这时候,我们要把它继续拆成更小的字根甚至笔划。比如:

有时候,独体字的拆分不是很直观。比如「再」拆成「王冂」两个字根。遇到此类字时的拆分,往往需要一些经验和练习。所以当你遇到不会拆的字时,应该主动查询它的编码,及时学习。

更麻烦的情况是,一个字好像有几种拆分方法,比如:

这种一字多拆的情况,任何形码中,都是积极避免的。因为一字多拆,会造成极大的不确定性,并造成编码的混乱。

徐码,通过一套严密的规则,使每一个汉字,都只有唯一的拆分方案,完全消除了不确定性。

徐码拆字规则的按优先级排序如下:

  1. 字根最少
  2. 原形字根(新版徐码引进的新规则,老版徐码可省略这一条)
  3. 字根离散
  4. 字根相连
  5. 字根相交
  6. 笔划断开
  7. 符合笔顺
  8. 字根取大

可归纳为:少>原>散>连>交>断>顺>大

取根时,按优先级从高到低依次,最终得到唯一的拆分方案。

以下为规则详细介绍:

3.1. 字根最少

字根最少,意思是拆分一个字时,应该使得字根的数量最少。比如:

3.2. 原形字根(新版徐码引进的新规则,老版徐码可省略这一条)

在徐码的字根,分为两类,一部分称为原形字根。另有一部分字根,是根据原形字根变形而来的,在字根图中,这部分变形字根列在字根原型的右下方,以小字显示。比如:

注意,原形字根和变形字根都一定存在于字根图中。字根图没有的字根永远不能叫做变形字根。

在拆字时,不变形字根的优先级高于变形字根。比如:

3.3. 字根离散

字根离散,指的是两个字根互相分离。比如:

3.4. 字根相连

字根相连,指的是两个字根互相连接。比如:

3.5. 字根相交

字根相交,指的是两个字根互相交叉。比如:

3.6. 笔划断开

笔划断开,指的是将一个笔划断开。比如:

3.7. 符合笔顺

符合笔顺,指的是字根的每一笔,完全符合原汉字的笔顺。比如:

3.8. 字根取大

字根取大,指的是按照笔顺拆字时,让靠前的字根的笔划数尽量地多。比如:

3.9. 字根排序规则

将汉字拆分后,我们需要将它们进行排序。大多数时候,这是非常直观的。但有时并非如此,需要进行定义。

徐码字根排序规则,是字根首笔符合笔顺,意思是拆分一个汉字时,所有字根的首个笔划,符合这个汉字的笔顺。比如:

请注意,徐码只要求字根的首笔符合笔顺,而不是要求字根每一笔都符合笔顺,比如:

3.10. 拆字举例

以下通过部分例字来说明拆分规则:

「重」拆「丿車一」,不拆「千日二」。

4. 单字编码规则

学习了徐码的拆字规则后,我们可以将任何一个汉字拆成唯一的字根组合。最后一步,便是把字根转为徐码编码。

单字的编码一般是由4个字母构成,部分情况下是2个或3个字母。

在徐码中,无论一个字能拆成几个字根,我们只关心其中的四个根,分别是:

在编码时,我们首先判断一个字的首根是主根还是副根

4.1. 首根为主根

首根为主根时,有两条规则:

  1. 依次取首根、次根、次末根、最末根的大码
  2. 不足四码时,补上最末根的小码

举例说明:

再次强调,首根为主根时,需要取4个根

4.2. 首根为副根

首根为副根时,有三条规则:

  1. 依次取首根、次根、最末根的大码
  2. 不足三码时,补上最末根的小码
  3. 在末尾添加首根的小码作为识别。

举例说明:

再次强调,首根为副根时,只需要取3个根

末尾添加首根的小码,有时候新手会需要一段时间来适应。好在由于简码的存在,大多数的时候,我们都不需要输入最后的识别码就能出字。

4.3. 字根字

字根字,依次取其大小码即可出字。比如:

4.4. 空格键的使用

在很多输入法软件中,空格键(以下用_表示)用来上屏首选字。

根据以上的学习内容,我们发现:徐码的编码最长不超过4个字母。由于这个特性,我们在输入完编码后,不一定需要按空格键将字打上屏幕。

空格键只在以下情况需要使用:

以下情况,不需要使用空格键:

5. 简码设置

学完了徐码的单字编码,我们发现,徐码的单字码长一般是2到4位之间。不少常用的字,码长是4位,比如字频第一的「的」字,编码为USUb

一种科学的输入策略,应该使得常用字的码长更低,从而加快输入的速度。试想,如果输入「的」字,每次都要按USUb四下按键,真是太浪费时间了。

形码对此的优化方式,就是设置简码,也就是给部分汉字设置更短的编码:比如,我们在输入「的」时,只要按上一个字母和空格键,就能实现输入。

在徐码中,简码的设置十分科学,使得每一个字简码和全码的编码规则保持一致。以下进行介绍。

5.1. 一级简码字

一级简码字,又称一简字,指的是用一个字母为编码实现输入的汉字。徐码中,有26个高频汉字设置为一简字,只要按下一个字母,加上空格,即可上屏。

一简字的编码,就是该字全码的第一个字母。比如:

从A到Z排列,一级简码字分别是以了发那要大一在事地是上同国中我多和得他的儿家道这为

在字根图中,一简字就是每个字母方框的左上角的汉字。

在我们的日常交流中,一简字大约占据了25%的使用频率。在徐码中,只需要按两个按键,这有效提升了输入的速度。

5.2. 二级简码字

二级简码字,又称二简字,指的是用两个字母为编码实现输入的汉字。徐码中,有676个高频汉字设置为二简字,只要按下两个字母,加上空格,即可上屏。

一简字的编码,就是该字全码的前两个字母。比如:

点击此处,查看二级简码矩阵。

5.3. 三级简码字

三级简码字,又称三简字,指的是用三个字母为编码实现输入的汉字,只要按下三个字母,加上空格,即可上屏。

三简字的编码,就是该字全码的前三个字母。这里不再举例。

注意到,三简字需要按四个按键才能上屏,同输入单字全码按键数一样,因此,三简字的设置主要为了以下目的:

三级简码字,可在打字时进行熟悉,不需要特别去记忆。

6. 词语编码规则

除了设置简码,徐码还将常用的词语,也编成4个字母的编码。这样可以降低每一个字的平均码长,提高打字速度。

徐码的词语编码规则,分为三种情况。

6.1. 两字词

两字词,取每个字全码的前两码即可。比如:

6.2. 三字词

三字词,取前两字的第一码,和第三个字的前两码即可。比如:

6.3. 四字词及以上

四字词及以上,取前三字的第一码,和最后一个字的第一码即可。比如:

6.4. 词语输入的优缺点

用词语的方式进行输入,优点在于降低了每个字的平均码长。试想「我们今天一起吃饭」这个句子。

可以看到,词语全码有效降低了按键的次数。

但是,词语输入也有其缺点,最主要的缺点包括:

因此,精简词库,熟悉词库,打单字和打词语相结合,是形码高手们的修炼之路。