两分输入法码表抽样分析报告

位置: 首页 > 杂记
[发布: 2026.1.22  作者: Admin  阅读: 18]

在长期使用两分输入法的过程中,笔者时常遇到编码存疑或难以理解的现象。由于输入过程不宜中断,往往无法在第一时间记录问题。然而,随着此类情况的积累,其对输入效率的影响日益凸显。为此,笔者决定腾出时间对码表进行一次抽样分析。

本次分析的码表来源为 字海网 下载页面提供的“两分输入法5.0 Rime版”。该码表收录单字98,793个,涵盖CJK统一表意文字,绝大部分单字无需专业字库支持便可在Windows 11环境下正常显示。抽样依据为国家语言文字工作委员会、国家教育委员会于1988年1月26日联合发布的《现代汉语常用字表》,从Rime码表字典中抽取了全部现代汉语常用字,包括一级常用汉字2,500个和二级常用汉字1,000个,共计3,500个。分析方法为逐一校对,旨在找出其中的错漏与不合理编码。

以下是具体的分析结果:

一、明显的编码错误(2处)

原始编码 :shuitu
正确编码 :shuzhi
两分字元 :氵止
原始编码 :weiyue
正确编码 :tianyue
两分字元 :田月

【涩】字的两分字元官方拆分方法为:第一字元取左边的部首三点水【氵】,读音为“水”(shui);第二字元取右部的【止】偏旁,读音为(zhi);剩余部分【刃】忽略。此拆分符合两分手册中“将一个汉字拆成两个部件,叫做两分字元。两分字元规定只可在常用字(简、繁均含)中选取。若该字仅一个笔画,则第二个两分字元为空。若拆完字后有剩余笔画,请忽略”的规定。基于此,第二字元的编码不可能是tu,而应为zhi

至于【胃】字的编码错误,应是受到了“胃”字自身的读音先行误导所致,更正即可。

二、编码疑似错误(1处)与编码缺漏(2处)

原始编码 :shouhuo
建议编码 :shoujian
两分字元 :扌𫠣
原始编码 :si
补全编码 :sijian
两分字元 :纟𫠣
原始编码 :huo
补全编码 :huojian
两分字元 :火𫠣

上述三个字的问题均集中于右偏旁【𫠣】字元的编码上。首先,【拣】字定义编码为shouhuo,这显然缺乏合理性,指向【火】字难以解释,或许原作者对此字元的编码感到困惑,但这并非严谨的编码逻辑。实际上,【𫠣】即为【柬】字,读音为jian,将其视为偏旁的简化而非已经作废的二简字即可,完全可依此定码。

此外,【练】和【炼】两字仅给出单字元编码(sihuo),属于明显的编码缺漏。推测原因可能是编码者因对【𫠣】的编码存疑而暂未补全,随后遗忘。建议统一将【𫠣】部件编码定位jian

三、疑似笔顺问题(4处)


yipie

shuyi

kuangshu

renba

根据原始编码分析,【九】字以折笔起头,所有折笔画在两分输入法中均视为【乙】(yi),这一点本身没有问题。但问题在于,【九】字的标准首笔应为【丿】(pie),当前的编码属于倒装,既不符合标准笔顺规则,也不符合使用者拆分字元的常规心理预期。

同理,【门】字的标准起笔为【丶】,首字元理应取它,而原始编码却使用了第二个笔画【丨】,显然不合理。【山】、【火】二字的编码同样存在颠倒笔顺的情况。当起笔为单一笔画时,绝对应取第一笔画作为第一个字元,这既符合笔顺规范,也顺应拆字逻辑;若字元均为完整部件,道理亦同。

四、框和口前后编码不一致

在两分输入法中,【框】与【口】的区别主要在于字元是否闭合:闭合的视为【口】,而“网开一面”的视为【框】。例如,「国、回、团」等字的外围字元编码均为kou,而「同、凶、皿」等字的第一字元编码均为kuang。这一约定非常合理,但比较以下几组字的编码时,却显得前后矛盾:


kuangyi

kuangyi

kuangyi

kuangkunag

kouyi

koupie

前四个字的编码无可厚非。问题在于后两字,即【弓】和【尸】的首字元编码。原始编码将朝左开口的【框】误视为【口】,令人费解。【弓】字的第一字元显然是一个向左开口的框,应与前四字保持一致,定为【框】而非【口】;【尸】字的两字元交而不连,其首字元也是典型的朝左开口的框,同样不应视为【口】。此类前后混淆的编码规则极易造成记忆混乱,建议统一同类部件的编码规范。

类似的框口编码问题还体现在对捺笔的处理上。部分字的捺笔被视作【水】,而另一部分则被看作【丶】,试比较:


piedian

piedian

piedian

pieshui

pieshui

piedian

上述字例中,每个字的捺笔形态或许存在细微差异,但纵观两分输入法的全码表,其具备相当的灵活性(例如【然】字的首字元为【月】,而非更细节的拆分)。因此,对于形态相近的捺笔,建议统一归为【丶】类,无需另立形似流水状的【shui】编码。此举旨在实现编码规则的前后统一,提升用户拆字的精准度与一致性。

结语

以上是针对两分输入法码表的抽样分析报告。尽管样本量仅占全码表的3.5%,但发现的几类问题具有一定的代表性。修正这些编码瑕疵,不仅有助于提升码表的严谨性,也能优化用户的输入体验。希望这份分析能为两分输入法的维护与完善提供有益参考。

前一篇: 没有了
下一篇: 没有了

发表评论:

  
 

评论列表 [1条]

#1 | 小希 于 2026-1-22 17:10 发布: 这个好细致呀。。

Copyright © 2023 All Right Reserved 马黑PHP文章管理整站系统v1.8
联系我们: gxblk@163.com