回应模式 - No.67795025


No.67795025 - 科学


兴趣使然的输入法及其方案串打字更快和打字更爽的艺术No.67795025 只看PO

2026-01-04(日)20:06:22 ID:h2Qm9o1 回应

咳咳,那么如朱军所见本肥是个输入法迷。
不对,输入法有啥好迷的,不是每个人都会吗?不是就那几个百度、搜狗、讯飞之类的输入法吗?……
实际上,除了上面这些叫“输入法平台”的东西,如“双拼”“五笔”等五花八门的“输入法方案”也有着很多人、耗费很多血研究的成果。即使现在拼音(全拼)输入法已经依靠着义务教育的优势,几乎一统山河,但总有一些人,他们想要比拼音更好的输入体验……
今天要分享的,是本肥两年来在输入法上的一点小小见解,若您感兴趣,不妨进来坐坐……

Tips无名氏No.9999999

2099-01-01 00:00:01 ID: Tips

(=゚ω゚)=是不是冷场了,埋一下

无标题无名氏No.67795096

2026-01-04(日)20:18:31 ID: h2Qm9o1 (PO主)

说到输入法,很多人第一想到的可能是“拼音”,还有哪家的输入法好用……
不过在讲这些之前,我们先介绍几个概念,帮助我们更好地理解“输入法前辈们都在干什么”。

1.输入法平台和输入方案
用一个浅显的比喻来说,输入法平台如同一个花盆,而输入方案如果花盆里的植物。没有花盆,植物就无处生长;没有植物,花盆也无用武之地。输入法方案主要是由“方案定义”和“码表”等元素组成,而输入法平台却可以将这些元素串起来,并且提供能直接由用户接触到的许多按键和ui,而且附加许多功能。

那么除了最常见的“全拼方案”,还有哪些其他方案呢?
我们把方案分为三大类:音码,形码,音形码(`・ω・)

无标题无名氏No.67795098

2026-01-04(日)20:19:01 ID: gx4fIyF

>>No.67795096
有不用码的吗?|∀゚

无标题无名氏No.67795236

2026-01-04(日)20:43:04 ID: I9RoZX3

语音?( ゚∀。)

无标题无名氏No.67795278

2026-01-04(日)20:48:16 ID: U0Nhhz4

jmjp| ω・´)

无标题无名氏No.67795357

2026-01-04(日)21:02:32 ID: h2Qm9o1 (PO主)

2.音码、形码、音形码
众所周知,输入法主要是用来输入汉字的。那么“设计输入法”本质上就是寻找方法描述一个汉字,并且凭此给这个汉字定一个编码。如何能做到?就是以上三种方法:“怎么读”“怎么写”,和一个“这样读,而且这样写”——这便是音码、形码和音形码。
举例环节到了(=゚ω゚)=
>>音码(1)
全拼(确实只描述怎么读对吧,源自1955-1957年制定的《汉语拼音方案》)
几乎人人都会用的方案,首先我就来说说对它的体验和评价
好,就是好,全拼的优点非常多:简单易学(对已经学会的人而言),有众多输入法平台支持,现在已经和AI技术结合(太强了),可以通过简拼来打高频词(wsm→为什么,sm→什么)但是,还是有些缺点。而这些缺点,也多半是目前的各路大佬选择其他输入方案的原因:
1.重码太多!(重chóng码,意思是同一个编码会对应多少个汉字)比如,打出chi,输入框里一般都会出现一大堆诸如吃齿赤叱喫耻……之类的一大堆汉字。那举个极端点的例子,我要是想打“施氏食十狮”这篇文章,我将因为翻候选框找到想要的那个shi而力竭。
全拼本身有一些方法来避免这个问题,比如“打出狮子再删去子”这种方式——打词再删。在更早的时代(还由智能abc这个古神输入平台统治全国各个xp系统的年代),还有记忆哪个字在第x页第x个的神人钢琴师。事实证明,在没有条件的时候,永远不要小看用户的自适应能力……

2.码长,太长了!
码长顾名思义,是编码的长度。拼音的码长很长,那要看它和什么比(然而大多数人没见过其他输入方案的码长是怎么样的,这点可以先看看之后要讲的五笔)。如果我们要打全拼,我们可能遇到的最糟糕的情况就有这种:kuang_chuang_→矿床
(嗯,按了13下键——包括空格——才打出来两个字,效率真是太高辣(`ヮ´ ))
而五笔:dyys→矿床(`ヮ´ )
所以为了避免这种情况,全拼有的时候可以使用简拼来走捷径。只不过,走捷径是需要付出代价的。如果打“kc”这两个字母,理论上也能出来“矿床”这两个字。但是以kc开头的词可也有不少。(虽然你打的次数多了,你使用的输入法平台大概率会“记住”这个词,这也算科技带来的一点补救)。而科技为码长带来的另一个红利则是:方便的自动纠错功能。简而言之,拼音的构成非常规则,混乱度低,比如总是由[声母][韵母(韵头)(韵腹)(韵尾)]这些部分组成,如果不小心打错一个字母,比如chuang打成了cjuang,那算法仍然可以认为“你本来想打h的对吧”,因为那里几乎不可能会有别的字母出现了。但对于码长短的输入方案,可能就相对来说更麻烦些。

3.确定性太低了……
这其实也算重码打包带来的一个副作用了。重码多,现在的输入法平台就觉得,就需要根据你使用这些字词的频率,把用得多的字调到前面来。但是,这样的方法归根到底还是要机器来完成。所以就出现这种情况:
我要打“就是”,好输入jius,按空格,诶打成“就算”了,删掉再来,再输入jius,按第二候选,诶我去怎么又是“就算”……
多弄几次会把人心态搞崩。

之所以花这么大篇幅讲全拼,是因为这几乎是所有其他输入方案“梦开始的地方”。(远古级别的那些不算,那些我感觉可以放后面讲)QAQ
几乎所有的输入法,都在努力克服全拼方案的这三个缺点,而如今,确实涌现出了不少非常优秀的方案。而我们接下来要介绍的仍然是音码,但它处理的是“码长”的缺点,它叫做——“双拼”。

无标题无名氏No.67795639

2026-01-04(日)21:40:16 ID: h2Qm9o1 (PO主)

>>音码(2)双拼、注音和方言音韵
1.双拼
一刻也没对全拼感到恐惧,立刻来解决码长问题的是:双拼

双拼的思路很好:既然所有汉字的读音都能分成声母(bpmf……)和韵母(aoeiuü……),那为什么不这么搞:我每个字只打两个字母,第一下打声母,第二下打韵母,第三下选字上屏(意思是打上去了,候选框回到了没打的状态)。比如我选择d在第二位的时候代表uang,选择i在第一位的时候代表声母ch,那么我打“矿床”就只需要:
kdid_
五笔:我超(´゚Д゚`)
而这就是双拼的原理。现在双拼的用户依然不少,我就是其中之一。我选择了自然码双拼(没有为什么,当时看它名字好听就选了嘿嘿)

2.注音
很多人有疑问,“那1958年汉语拼音还没发布的时候,中国人是怎么认字的”
诶,那就不得不提我们的老伙伴 注音符号了。以章太炎的记音字母作蓝本,1913年由中国读音统一会制定,1918年北洋政府教育部正式颁行。注音符号取代了中国一千多年来用的“反切”的注音方法。后来,注音符号于1958年在中国大陆地区被汉语拼音所代替。(度娘百科)
现在在我国台湾省,人们仍然使用注音符号,注音输入法也自然是他们用得最多。
注音方案对音节的切分方法是声母—介母—韵母,在键盘上也一般从左到右排布(也有其他顺序)。这款输入法也非常好学,肥也是花了几天时间认识了(只要知道这些符号的来历或者稍加联想就好)
对比大陆的拼音方案,他们的注音方案加入了对声调的支持,这使得它的输入进一步贴近口语,重码率也降低不少(虽然还不能完全消除)。此外,注音方案的码长最大值是4,也好过拼音。但是它也有许多不足。39个符号在手机上会让本来就小的按键挤得更小,在电脑上,也会因为排布与26键的国际通用键盘“打架”,原本给数字的数字行也被放上了符号。这样一来,也让使用起来更不便了些。

能体验到这两种方案的输入平台:gboard(注音推荐,双拼不推荐),搜狗,百度,手心输入法(无注音,双拼有某奇妙功能)
我们待会介绍音形码的时候会说到这个神奇妙妙工具

无标题无名氏No.67795646

2026-01-04(日)21:41:39 ID: nmBJmsa

|∀゚

无标题无名氏No.67795650

2026-01-04(日)21:42:23 ID: h2Qm9o1 (PO主)

现在怎么又发不了图了(´゚Д゚`)我记得图床不是前几天才修好吗

无标题无名氏No.67795858

2026-01-04(日)22:10:57 ID: h2Qm9o1 (PO主)

3.方言音韵
很多人的母语是自己的家乡话(而非普通话),所以也有很多人开发了针对自己家乡话的输入法。现在用得最多也支持最多的,其实是粤拼输入方案。
本肥并非广♂door♂人(所以我们可能不是老乡),但也是因为兴趣学过广东话,现在也能用粤拼打字。但是粤拼其实在粤语区没有我想象中的流行,其中一个原因是粤拼其实并没有统一的标准,很多粤语人士也并不需要粤拼来学粤语——毕竟本来就会在生活中用到。(目前本肥遇到的粤语人士基本没有会粤拼的)。
粤语的声调系统比普通话复杂,有“九声六调”之说。因为不仅平声分阴阳,上声和去声也分阴阳,(也有说平上去三声各分清浊产生六调)而且还保留下-p -t -k结尾的入声。另外,尖团未合流。在这些方面,粤语能比普通话多区分一些字,重码率更低一些。但是粤语的介音丢失了很大一部分,声母的数量也更少,又让它在优势上没有那么明显。其他方言,也多多少少有类似的情况。并且,各方言都有自己的独特用词乃至文法,如果要用这些方言输入文字来记录普通话,恐怕不是最好的选择。但现今时代,方言输入方案对保存方言文化来说是非常重要的,也是希望能有更多人来参与到维护中来吧。
(叠甲:所有的方言都继承自古汉语,并且现今没有任何方言是原原本本的中古汉语。本肥尊重粤语也尊重其他所有方言,也尊重普通话推广工作,本串的讨论重点是汉字输入法而不是汉语方言,有专业性知识错误欢迎指出,但希望不要在本串拉踩其他方言以及方言区的人,恳请朱军和平讨论,万分感谢)
使用该方案的输入平台:Rime中州韵,Gboard(粤语和闽南语的多种方案),其他创作者制作的粤拼输入法平台