汉字的字型类别与末笔识别码_补码规则第2节
三、汉字的字型类别与末笔识别码
1.汉字的末笔画
汉字的末笔画也是笔画,只有“横(一)、竖(丨)、撇(丿)、点(丶)、折(乙)”这五种,与之对应的是G、H、T、Y、N这五个码键。很容易知道:它们与字根的五种首笔画(起笔)是相同的。
若纯粹以这五种末笔画来作,充其量才有五种识别码,是不能使重码率较大幅度下降的。那么,另有什么办法来增加末笔识别码的种类呢?
这就是:把汉字的三类字型(汉字结构类型)拉过来也用上去。每一类字型都有五种末笔识别码,三类不同的字型就有,用来解决编码的重码率问题应该说是比较理想了。
2.汉字的结构类型又可称作“汉字字型”。汉字的笔画结构虽千变万化,但其结构仅有三个类型而已。
(1)把汉字笔画组合呈左右结构的汉字定为“甲类”字型,称作“左右型结构汉字”。
例如:“识、别、码、较、难、辨、认”这些“左右结构的汉字”,就是“甲类”字型。
(2)把汉字笔画组合呈上下结构的汉字定为“乙类”字型,称作“上下型结构汉字”。
例如:“要、学、会、字、型、分、类”这些“上下结构的汉字”,就是“乙类”字型。
(3)最后,把剩下的既不是“甲类”又不是“乙类”的汉字统统划归于“丙类”字型,结合这类汉字的特征称之为“杂合型结构汉字”。
例如:“国、庆、这、天、万、民、同、乐”这些非“甲类”、非“乙类”字型的字。
3.汉字的15种末笔识别码
(1)汉字末笔画的种类
上面已述,汉字可分甲、乙、丙三类字型,每类字型都有五种(横、竖、撇、点、折)末笔画。也可说,汉字可分横、竖、撇、点、折五类末笔画,每类末笔画都有三种(甲、乙、丙)字型。 故把字型考虑进去后,汉字可以有15种末笔识别码,如下表所示。
末笔字型识别码 | 左右型(1) | 上下型(2) | 杂合型(3) |
横(一) | G(一横) | F(两横) | D(三横) |
竖(丨) | H(一竖) | J(两竖) | K(三竖) |
撇(丿) | T(一撇) | R(两撇) | E(三撇) |
捺(丶) | Y(一捺) | U(两捺) | I(三捺) |
折(乙) | N(一折) | B(两折) | V(三折) |
如:“示”和“未”的字根均为“二”和“小”,因此末笔划均为“捺(丶)”
“示”为上下型,对照表格识别码为“U”,编码为FIU
“未”为杂合型,对照表格识别码为“I”,编码为FII。
上面这张表格如果用键盘上的键位来表示会更加容易记忆,学习起来就不会让人再对识别码望而生畏了。