帮你挑选适合自己的输入方案
这里简单聊一下几个特点鲜明、字根分布有规律的四码定长纯形方案的优缺点,希望能帮助你进行选择。优点和缺点都按重要性降序排列。一般而言,排名的一的优点,往往是以排名第一的缺点为代价形成的。
五笔字型
五笔字型,25键方案,四码定长。适合公务人员、经常跨平台输入的用户、以及只有简体需求的用户。
优点:
- 采用小字根。字根数量较少,约120个左右,在键盘上分大区分布,非常容易上手,学习曲线较为平缓。
- 平台通用性极高,尤其是86版。
- 不使用 Z 键,便于各输入法平台挂载。
- 字根取一二三末。
缺点:
- 编码上有结构码,输入全码时容易造成思维卡顿。输入词语时没有此问题。
- 由于字根较小,复杂汉字容易拆得太散,造成繁体输入体验不佳。
- 繁简字根同编码,繁简混输情况下需要选重。
郑码
郑码,26键方案,四码定长。适合完全不会拼音,或者喜爱全码单字输出的人。
优点:
- 字根按字典分区排列,大小码全部按照字形设计,极为规范,容易记忆。
- 采用大字根,约200个左右。拆字直观、科学,注重字理,适合检字。
缺点:
- 全码单字和简码、词语编码不一致,进阶较难。
- 繁简字根同编码,繁简混输情况下需要选重。
- A 键频率太高,左手小拇指压力大。
- 有时需要取倒数第二根。
- 上手打字时,有一个字典排序到键盘排序的映射过程,故而字根分布在键盘上较为随机。
尔雅徐码
徐码,26键方案,四码定长。适合经常繁简混输大字集的文字工作者使用。
优点:
- 常用繁体、简体、繁简混合文本、GBK 大字集下,单字全码重码都非常低,它是可以进行繁简通打的两个方案之一。
- 拆字规范,优先级规则明确。
- 采用大字根,约200个左右。字根按字典分区排列,大码有一定规律,小码用拼音中的字母。
缺点:
- 首根如果是副根,则其小码会占用第四码位,导致第三码位需要判断取次末根还是最末根。造成不同部首的相似汉字第三码不同,增加输入时的思维负担。输入词语时没有此问题。
- Z 键频率太高,左手小拇指压力大。
- 有时需要取倒数第二根。
- 上手打字,有一个字典排序到键盘排序的映射过程,故而字根分布在键盘上较为随机。
宇浩
宇浩,25键方案,四码定长。适合无缝使用简体和繁体进行输入的用户,或有意使用繁体字的用户。
优点:
- 简体、繁体、繁简混输,三种文本空间下,动态重码率都极低。适合繁简通打。它同时兼容台湾正体和大陆繁体字形,故而是四码定长诸方案中,最适合繁体输入的。
- 拆字极为规范,优先级规则明确。
- 采用大字根,约200个左右。字根按键盘分区排布,同五笔字型;小码用拼音中的字母。
- 不使用 Z 键,便于各输入法平台挂载。
- 字根取一二三末。
缺点:
- 两根字不足四码时需要补首根小码。
- 大字集下,静态重码的优势不如徐码(一般输入法约为6500个重码单字,徐码约为2900个,宇浩约为5000个)。
- 部分小码不是拼音中的字母,需要特别记忆。
重码数据对比
很多输入法可能在简体文本下能达到宇浩输入法相似的水平,但是在繁体和繁简混合文本下的重码率会明显上升。这里对比一下五笔、郑码、徐码在不同汉字字符集下的单字全码的重码数量,以供参考(选重率指的是平均输入多少个汉字需要选一次重码字)。仓颉虽然是五码定长,但它在繁体输入上地位很高,所以也将它纳入比较。加粗的数字代表本行最优值(点击此处查看更多输入法的重码数据):
形码方案 | GB2312 | 国字常用 | 常用繁简 | GBK | 简体选重率 | 繁体选重率 | 繁简混合文本选重率 |
---|---|---|---|---|---|---|---|
字根单码 | 繁简同根 | ||||||
五笔86 | 537 | 357 | 1685 | 6582 | 34.2‱ | 79.0‱ | 226.4‱ |
五笔98 | 515 | 329 | 1623 | 6368 | 38.1‱ | 78.0‱ | 230.1‱ |
五笔06·新世纪 | 532 | 387 | 1690 | 6610 | 31.8‱ | 81.8‱ | 223.6‱ |
字根双码 | 繁简同根 | ||||||
郑码 | 563 | 311 | 1779 | 6590 | 59.9‱ | 63.3‱ | 267.1‱ |
字根双码 | 繁简通打 | ||||||
徐码 | 318 | 127 | 453 | 2902 | 10.7‱ | 21.8‱ | 25.1‱ |
宇浩 | 313 | 214 | 583 | 5015 | 5.5‱ | 15.6‱ | 17.7‱ |
五码定长 | 繁简通打 | ||||||
仓颉五代 | 422 | 164 | 585 | 2893 | 88.8‱ | 48.9‱ | 104.7‱ |
其他方面对比
如果哪个输入法只谈自己的优点,不谈其他输入法的优点,或者说自己各方面完全胜过另一个输入法,那么一定是虚假宣传,值得警惕。这是因为,「低重码」、「规则简易」、「字根分布有规律」,是个不可能三角。一个输入法只能在一者做到突出,或者两项都不错,或者三项均衡,但不可能三者都做到很好。在宇浩输入法的开发中,我努力做到扬长避短,希望它的各项指标达到一种平衡,不要出现极端的弊病。
这里列出各维度上同其它四码定长输入法之间比较,排名越靠前越好。请注意,以下五个输入法中,没有任何一个输入法能在所有维度上都能超越另一个输入法。有任何一个维度排在第一,就有值得学习借鉴的地方。
维度 | 第一 | 第二 | 第三 | 第四 | 第五 |
---|---|---|---|---|---|
简体静态重码数 | 宇浩 | 徐码 | 五笔98 | 五笔86 | 郑码 |
简体动态重码率 | 宇浩 | 徐码 | 五笔86 | 五笔98 | 郑码 |
繁体静态重码数 | 徐码 | 宇浩 | 郑码 | 五笔98 | 五笔86 |
繁体动态重码率 | 宇浩 | 徐码 | 郑码 | 五笔98 | 五笔86 |
简繁通打静态重码数 | 徐码 | 宇浩 | 五笔98 | 五笔86 | 郑码 |
简繁通打动态重码率 | 宇浩 | 徐码 | 五笔86 | 五笔98 | 郑码 |
大字集重码数量 | 徐码 | 宇浩 | 五笔98 | 五笔86 | 郑码 |
简体词库动态重码率 | 宇浩 | 徐码 | 五笔86 | 五笔98 | 郑码 |
字根形态完整性1 | 郑码~徐码宇浩 | 五笔98 | 五笔86 | ||
字根在键盘上的聚合度 | 五笔~宇浩 | 郑码 | 徐码 | ||
字根对不会拼音者友善 | 五笔~郑码 | 徐码~宇浩 | |||
拆字规则优先级确定性 | 宇浩 | 徐码 | 郑码 | 五笔98 | 五笔86 |
编码规则简易度 | 宇浩 | 五笔 ~ 郑码 | 徐码 | ||
全简一致(简码、词语编码) | 五笔=徐码=宇浩 | 郑码 | |||
Z 键使用较少2 | 五笔~宇浩 | 郑码 | 徐码 | ||
全码编码空间2 | 郑码=徐码(456976) | 五笔=宇浩(390625) |
-
例如在五笔中,「革」「鱼」,甚至「衤」「犭」等字根都被拆成了两个字根。但在其他输入法中,字根被完整保留。还宇浩中,还有不少完整的康熙部首,如「風」「僉」等。有优点也有缺点,字根完整性越高,字根数量就越多,学习时间就越长。 ↩
-
两版五笔都不使用 Z 键,因为它比较难按。Z 键空出后,还能作为反查引导、通配符使用。宇浩继承了这个特点,不使用 Z 键,因此所有五笔输入法都可以直接挂载宇浩输入法的码表,并实现 Z 键的完整功能。有优点就有缺点。不使用 Z 键,也会造成编码空间的下降。在全码4码的情况下,宇浩的编码空间只有其他26键输入法的85.5%。这意味着对宇浩输入法的字根离散要求更苛刻,使之不适合超大词库(大于十万词)。对简体词频加权后,宇浩输入法的词语动态选重率高于蓝宝石,低于徐码和五笔。 ↩ ↩2