请马上登录,朋友们都在花潮里等着你哦:)
您需要 登录 才可以下载或查看,没有账号?立即注册
x
汉字输入法世界里有一个笔画输入法,因为速度问题没有流行开来,但它将汉字近40个笔画简化为“横竖折撇点”的方案被主流输入法广泛接受,形码、音码、形音码、音形码编码或辅助编码依据大多离不开此方案或深受其启发。字海两分输入法可以列入形音编码:“形”为视每一个汉字由两个字元组成,“音”乃编码取拆分出来的两个字元的拼音。两分输入法对“形”的处理自然绕不开笔画作为字元的情形,由此,也得面对点和捺这两个笔画以形成编码机制。
前面提到的笔画输入法,将点和捺归类为点,即丶=㇏,无疑极大降低了编码难度。两分输入法对捺笔画的处理则颇有讲究:
📒字海两分输入法对捺笔画的三种处理方式:
⚀ 视为点 (丶)【例】八 字元『丿丶』,编码『piedian』
⚁ 视为水 (水)【例】人 字元『丿水』,编码『pieshui』
⚂ 视为捺 (㇏)【例】𤓰 字元『厂㇏』,编码『changna』
捺视为点是遵循了笔画输入法的编码规范,视为“水”则应该是“看形”而取捺笔的流水貌,视为捺则是归于捺的原本。或许字海两分输入法制定捺笔画视作点、水、捺存在内部的优化诉求,但其文档并没有此类描述,使用者只能全凭猜测去理解捺笔何时为点、为水、为捺,输入过程中碰上捺笔时经常需要回退重来。
个人认为两分输入法复杂化处理捺笔画的机制并不合理。
首先,这容易造成输入混乱、增加使用者拆字负担。以上面三种处理捺笔画机制的字例为例,即 “八”、“人”、“𤓰” 这三个字,它们的第二个字元都是捺,形似程度极高,但以现有处理捺笔的机制会令使用者无从精准判断字的第二个字元到底是什么,给输入带来极大的困惑。以捺笔画作为第二字元的字不论多寡都不必细分为点水捺,统一编码为点(dian)即可——两分输入法开发定位当是冲着无字不能输入的问题,重码不是重点考虑的编码逻辑。
输入法是输入工具,应在处理相同、相似字元方面尽可能遵循归一化规则,简化编码制定依据,没有必要纠结字源上这个字元当时是怎么书写的——毕竟现在上屏的字已经定型、输入法使用者也没必要去追溯这一捺的历史写法、更没必要掌握字元的具体变迁。尊重当下字的统一形态进而依此统一编码更符合输入法的使用需求,字源探究和输入法编码规则不应存在过于紧密的联系。当然,字海两分输入法受众预期定位也许都是对字源有深厚功底的专家学者,即便如此,我个人仍然坚信,输入是针对当下的字而非字的书写渊源,输入时直观判断字的样貌先于对字源知识体系的认知驱动,所以考究编码的依据仍然还是以现时的字样为主而非其过去的历史概貌。
其次,细分捺笔为点水捺也给编码增加麻烦。编码者当然是对字源研究深透的专家学者,对字源了如指掌,可是试想一下:归一化现时形态相同或极度相似的字元为统一的编码是不是比细分为三种类型的编码更省事?输入法使用者也从中受益,皆大欢喜。
或许,编码者出于内部优化做出了很多考量才如此决定细分捺笔画字元(以及其他存在类似情形的字元编码处理),例如避免过多的重码存在于某些特定编码中。若是如此,也属顾此失彼的做法。以增加输入难度换取某个层面的优化总体来说并不划算——公开的输入法是让人用的,编码规则得考虑编使用者的学习成本,否则输入法的最终受众群体几近无人,输入法的公开意义就会大打折扣。
第三,捺笔画已在输入法业内统一视为点笔画,还保留单独的捺笔画编码或许显得专业但也很另类。流行的未必专业,但流行是因为得到受众认可,受众认可了才有流行的资本。专业输入法即使不需要流行,但它的存在价值总是在使用中才能得以体现。
其实,捺笔画的保留,在业已发布的两字元编码中其实并不多,不到四十个,其主要以生僻字和繁体字的构字部件出现,完全可以视作点笔画消化在已有编码中,并不会构成太多的重码。以下是检索到的第二字元以捺笔画编码的字的汇总,应该没有什么遗漏:
| 序号 | 字 | 编码 |
| 1 | 𠔇 | bana |
| 2 | 𦍖 | bana |
| 3 | 𤵑 | bingna |
| 4 | 𦬤 | caona |
| 5 | 𡘎 | dana |
| 6 | 㸦 | dingna |
| 7 | 𢎡 | gongna |
| 8 | 𩨶 | guna |
| 9 | 𧰧 | hengna |
| 10 | 𠂢 | changna |
| 11 | 𤓰 | changna |
| 12 | 𨑃 | changna |
| 13 | 𢁤 | jinna |
| 14 | 𠅕 | jiaona |
| 15 | 𠹩 | junna |
| 16 | 𠮺 | kouna |
| 17 | 𠮼 | kouna |
| 18 | 𠯁 | kouna |
| 19 | 𩡬 | mana |
| 20 | 𣏛 | muna |
| 21 | 𣕹 | muna |
| 22 | 𧘇 | piena |
| 23 | 㐅 | piena |
| 24 | 𠇊 | renna |
| 25 | 𨱗 | renna |
| 26 | 𥾙 | sina |
| 27 | 𥾙 | sina |
| 28 | 𦂵 | sina |
| 29 | 𤲄 | tianna |
| 30 | 𡺒 | shanna |
| 31 | 𧰨 | shanna |
| 32 | 𣲓 | shuina |
| 33 | 𣽍 | shuina |
| 34 | 𠧹 | zhanna |
| 35 | 𥫪 | zhuna |
| 36 | 𩂢 | yuna |
| 37 | 𧿓 | zuna |
若考虑到后续给新增字编码,捺笔画的编码存在也没有多少意义——对10多万汉字编码,重码率实在无法绕开。
给汉字编码是一件繁重的工作,感谢字海网的老师们,他们为两分输入法付出了艰辛的劳动,获得了巨大的成功。本文纯属基于外行基础的探讨,不当之处还请理解。
|