那么继续来说形码
>>形码
说起形码,可能很多人第一想起的就是传说中的五笔。此码虽然不是什么开山鼻祖(第一款计算机上的汉字输入法是朱邦复先生发明的仓颉输入法),但也称得上是一个划时代的发明。王永民教授所发明的五笔产生的影响在历史上非常深远。在早期全拼输入法还没有智能联想等手段提高准确度的时代,五笔作为形码方案,输入汉字无论是准确度还是速度都完爆拼音,而全国大多数电脑都装有五笔输入法,甚至还有些学习电脑专门搭载五笔练习软件。那么,五笔究竟是怎么做到的呢?
在网上搜索一张五笔键位图,可以看到所有按键都被分配上了密密麻麻的“字根”。这些字根有的是偏旁部首,有的比偏旁部首还要更细更小,用来进一步确定某字的拆分。这些字根有自己的排列顺序,那就是把25个键分成了“横竖撇捺折”五个大区,每一区里面的字根都以该区所代表的笔画起始,如“人”字根,起笔是撇,所以便在t-q这一个“撇区”内。从第一行的t,y、第二行的g、h分别向左右两边数五个键(h这一块还包含了下一行的m),形成了前四个区,分别是撇、捺、横、竖,最后一个区便是折区,由剩下的n b v c x五个键组成。我们还剩下一个键z,这个键也就成为了学习键。当我们想不起某字的末尾是什么编码时,便可以按z作为通配键,模糊查找。
说完了键盘构成,自然就要问,五笔是按什么规则,组合键盘上这些字根,来给汉字进行编码的呢?
:首先,五笔的每个汉字的编码长度,最大为4码。也就是说,可以用4个字母确定一个汉字。比如“华”字的编码是rafj,输入这个编码,华字便出现在首选。
五笔的强大之处还不在这,真正强的是,五笔有打词的规则。而词的编码最大长度,也是4。不管是二字词(你好=wqvb),三字词(冰淇淋=uiis),四字词(德高望重=tyyt),四字以上的词(中华人民共和国=kwwl),所有词的码长都是4
(´゚Д゚`)
如果一个字的编码是1234(数字n代表第几个编码)二字词取1212,三字词取1112,四字词取1111,四字以上的词就是111,再补上那个词最后一个字的第1码。
而更好的是(尤其是比仓颉高明的一点)有些高频字可被放在“一级简码”的位置上,如此就可以用一次按键就打出来,如“我”只需按q,“人”只需按w。与之对应的还有二级,三级简码,这些都是使我们不用每个字都打“全码”(4个完整的编码)的小捷径。
有了这些特性,五笔就非常能打了,有很多熟练的五笔高手能打出200字每分钟的恐怖速度。
作为一个学了五笔,使用一年后却又弃用了它的人,本肥也来谈谈使用它的感想。
先说优点:五笔虽然早已不是流行的输入法,但它的通用性仍然极强。如果你有涉密工作,特殊考试(如法考等的机考),那么练习五笔会是一个非常明智的选择。如果你使用的是其他的小众输入方案,你在这些场景下有可能是无法使用自己心意的方案的。
五笔是一个善于打词的方案,很多五笔词库都收录了很多词(比如微软),你可以充分发挥它的优势,敲几个键就出来一大堆东西的感受也很不错——前提是你没有敲错。
缺点:由于五笔是有序地把字根排列在键盘上,并没有考虑到各字根的常用性,于是很多比较常用的字,五笔的体验都非常别扭。比如一个“被”字需要puhc四个键才能打出来,“都”字也需要ftjb四个键。除此之外,它安排的键位也会让手指活动幅度太大,导致疲惫不不便。第二,五笔的重码问题仍然凸显。例如最经典的云去支三字,就算把全码都打出来,也都是fcu,需要用123键来选择你到底要哪一个。虽然比起拼音来说已经算很好,但长期用起来仍然让人感到恼火。另外,五笔的词语重码也有不少,这个和拼音正相反。拼音是词库越大越好,能联想到的词越多;而五笔的词库,超过一定的大小,越大反而越坏,因为这样同样4个键,对应的重码也就越多。(如果你用五笔,你应该能感受到微软五笔的这一特点,莫名其妙的词巨tm多)
五笔的官方和使用者们并非没想过解决方法。最早广泛使用的版本是86版五笔(1986年发行),后面相继出了98版,新世纪版,和粉丝自制的09系列。这一系列有091,092两个版本,092更是把五笔的一大部分字根用算法重新排布,使其手感更加优秀,以至于被冠名为“09速记”。当然,用这个的高手也有好几位,确实证明了五笔的潜力仍然可以发挥得更多。但是86以外,就都属于小众方案了,09系列更是不可能在机考的电脑上找到。
我短暂练习过091,但因为它的三重候选(每个键都放三个固定顺序的候选,而这些候选还很多没有更长的码),我实在不想虐待我的小拇指(按分号和引号键选2选、3选),于是我毅然决然地决定学一个新的形码:
虎码。