求辽三"茗刃丶堂"chn丶mvp战队宣传片的YY

:汉字输入系统——三位码的制作方法

“三位码”汉字输入系统是利用键盘将汉字输入进计算机的输入码编码技术。目的是为计算机用户提供更易于掌握和使用,输入速度更加快捷的汉字输入方法。

一、汉字的基本笔画一个汉字,无论其结构多么复杂,都是由一个一个笔画组成的。正确认识汉字的笔画,对于掌握字根的键位组合分布规律,准确运用字根给汉字拆分编码,都有着重要意义。

汉字的基本笔画共有五种(一)横 包括“一”及其变形 (提或挑)。如“孑、 ?、刁”中的 但不包括同“点”组合在一起的“提点”。如“冫、氵”中的 (二)坚 包括“丨”及其变形“亅”。如“刂、扌、了”中的“亅”。

(三)撇 包括“丿”、 (平撇)、“丿”(竖撇)。如“质、重、月”中的“丿”。

(四)捺 包括“?”。 (平捺)和捺的变形——点。“点”又有“左点”、“长点”等。如“办、只”中的点。

(五)折 包括凡笔画线条连续且有明显转折的各种笔画(“亅”例外)。具体形态较多。

应该提示的是,这五种基本笔画在罗列顺序上是有规定的,即“一横、二竖、三撇、四捺、五折”。

二、字根字根是汉字字形***中的一级构字单位、是具有相对独立性的笔画组合体。简单地说,汉字是由字根组合而成的,因此可以把一个汉字拆分成一个或几个字根。这是给汉字编码的基本前提。

字根类似于“偏旁部首”,但又不同于“偏旁部首”。采用字根概念,避免了“偏旁”、“部首”在应用上的局限性。因为用字根来拆分汉字,不须考虑其在构字中是表音、表形或表义,也不须考虑其在构字中的主次作用和空间位置,而只考虑其书写顺序和组合关系。

但是,字根不是随意可以确定的。确定字根应具有必要的科学性,并能为大众所接受。本系统所选用的166个字根,绝大多数是国家规范的偏旁部首和汉字,已为大众所熟悉。

三、字根的键位组合分布规律(一)把计算机键盘“英文字母输入键区”的二十六个字母键分成五个区,每个区的每个键又分别定位,并使键盘的区位划分符合键盘指法规范。唯一例外的是第一区的第五位“B”键是由左手食指操作的。(见“字根键位总图”)“区位”是字根键位分布规律的依据。

(二)所有字根按起笔笔画分成五类,按“一横、二竖、三撇、四捺、五折”的顺序分别安排在一至五区。并使各区字根起笔笔画走向同各区“位”的排列走向一致。其例外情况有“壬、 手、匕、忄、川、豕、廴”九个字根。它们被安排在现在的区位上,是因为它们在形体上同所在键的其他字根更接近,因而更容易联想记忆。

(三)由基本笔画简单组合的字根和大部分非单字做根按笔画数或结构的复杂情况分别安排在各区的第一至五位。如“丶、冫、氵、宀、辶”分别被安排在第四区的一到五位。

(四)每键有三个主字根(即每键中每行字根最左边的字根),它们都是在形体结构上具有很强的代表性,且使用频度较高的字根。每区主字根的键位分布组合也都具有一定的规律性。同主字根结构特征相似的其他字根排在主字根之后,很容易产生联想记忆。可以说在记忆“字根键盘”时,只要记住主字根的键位分布,就算大功告成了。所有字根的具体组合分布情况见“说明书附图

”——“字根键位总图”。图中每个键面左下方的数字表示每键的“区位”其中“十位”上的数字表示该键所在的“区”,“个位”上的数字表示该键的“位”;每个键上三排字根中,每排左边开头的字根为主字根;每键右下方的字为该键上的一级简码字。

(五)采用字根归并的办法,对人们所熟知的汉字和偏旁部首的形体演变关系作了明确的说明;同时,把少量形体结构同某些基本字根非常接近,使用频度又低的字根,也用字根归并的办法,归如到相应的基本字根中。以便于记忆和准确运用字根。(见“字根归并表”)最后,要特别说明的是,所谓“主字根”、“基本字根”、“并入字根”,只是为了帮助记忆而作的分级处理,它们作为字根的实际作用和地位是一样的。

四、单字的拆分原则(一)笔顺规范 就是按照汉字书写的规范顺序对汉字进行拆分,编码。如夫——二人 夜——亠亻夂丶义——丶乂 办——力 有几种包围结构的汉字,“包围字根”和“被包围字根”的书写笔画是交叉进行的。为了照顾字根的完整性,只有牺牲笔顺规范,而作适当的变通,规定哪个字根先起笔就先拆分哪个字根。如可——丁口 固——囗十口臣——匚丨 丨囚——囗人(二)取大优先 就是在拆分汉字时,每次都选择笔画最多的字根来对它进行拆分,以保证拆分出来的字根数量最少。如世——廿 衰——一 万——丆 柬——一四小来——一米 豆——一口?首——?丿目 派——氵 丿 (三)先取优先 就是当汉字中的某些笔画既能同前面的笔画构成一个字根,又能同后面的笔画构成一个字根时,应选择同前面的笔画构成字根的拆分方法。如百——丆日严——一业丿丈——ナ?久——ク? 用——冂二丨 缶——?十凵(四)兼顾直观 就是在拆分汉字时,为照顾字根的完整性和拆分时的直观感觉,而对前面三个原则作适当的变通。

1、对“笔顺规范”的变通。如团——囗十丿必——心丿巫——工人人爽——大 曹——艹曰日乘——禾丬匕讯——讠乙十丑—— 土△关于“戈”、“弋”的适用说明为了保证字根在使用时的一致性和兼顾直观性,规定汉字右边出现“戈”或“弋”时,不论书写笔顺如何,都视其为一个独立的字根,并且后拆分。如成——丿 戈武——一止弋或——口一戈 盛——丿 戈皿2、对“先取优先”的变通。如求——一水丶无——一尢 行——彳一丁减——冫丿一口戈△当一个字既可拆分成“相连”的几个部分,又可拆分成“相交”的几个部分,应该感到“相连”比“相交”要直观,因此规定按“相连”的拆分方法对其拆出,这叫“能连不交”。如干——一十开——一廾△关于“?”的适用说明当“?”(横人)中的“一”同其他笔画相交时,从直观上看,它已不再是“?”,其中的“一”应同它后边的笔画组合成字根。如制——丿二冂丨刂朱——丿二小生—一丿? 失——丿二人△关于“?”的适用说明,当“?”中的“一”能同后边的笔画构成一个字根时,应保证后边字根的完整性,而不往前凑。如兰——丷三尊——丷酉寸平——一丷十 半——丷二丨△关于“未”、“末”的拆分说明为了避免“未”和“末”的拆分相同,同时也符合、“末”的造字本意,这两字的拆分结果为未——二小末——一木五、单字的编码规则(一)所有单字的全码串长均为“三位”。也就是说,只要击三次键,就可输入一个汉字。

(二)字根的编码 取该字根所在键为其编码的第一位;然后按上节所述拆分原则,用仅比该字根小的其他字根进行拆分,取其首尾两个字根为其编码的第二、三位。不足三码的,加“识别码”。如石——石丆口——HJD气——气?乙—WWV甫——甫 丶—LLY入——入丿?——WTY(三)非字根汉字的编码 按上节所述拆分原则拆分后,取其第一、第二和末尾字根为该字的编码。不足三码的,加“识别码”。如编——纟户艹——XYN硕——石丆贝——HJA肃——彐丨八——CGQ卸——?十卩——WLZ五——丨——HGH象—— 口 ——QDW△关于“辩、辫、辨、瓣”和“器、嚣”的编码说明 这两组字如按统一规则编码,则编码相同。为避免重码,特规定这几个字的第二码取能将其区分的第三个字根编码。如瓣——立 十——PRL器—口犬口——DMD

识别码是由“末笔”信息和“字型”信息复合而成的。就是由该字的末笔画确定识别码的“区”。再由该字的字型确定识别码的“位”。

本系统将汉字结构划分为三种类型。

第一型左右结构 字根码打完后,只加打该字的末笔画字根键就可以了。如旧——丨日——GFH亿——亻乙——RVV第二型上下结构 字根码打完后,加打该字的末笔画所在区的第二位键就可以了。如艺——艹乙——NVC旦——日一——FHJ多——夕夕——WWU有—— 月——JEJ仑——人匕——WBC空——穴工——OMJ第三型各种包围结构和独体结构 字根码打完后,加打该字的末笔画所在区的第三位键就可以了。如包——ㄅ巳——EXX过——寸辶——BPI可——丁口——JDK困——囗木——DLI这里要说明的是,所谓“末笔”,是指第二个字根的末笔。有少数字,在拆分时,对“笔顺规范”作了变通,第二个字根的末笔不是整字的正确书写顺序的末笔。为了保证拆分编码的连续性。特作此规定。

独体结构(独体字)包括以下几种情况1.单笔画字和字根,如“一”等。

2.两个字根笔画相交的字,如果——日木 击——二山 夫——二人3.大部分由一个单笔画字根同一个多笔画字根构成的字,如两个字根没有明显分开呈左右结构和上下结构。都视为独体结构。如于——一十 下——一卜 个——人丨由“丿、?、丶”三个单笔画字根同另一个字根构成的字,无论两个字根呈什么结构关系,均视为独体结构。如主——丶王 术——木丶 产——立丿升——丿廾 么——丿厶 尺——尸?太——大丶 乏——丿之 乡—— 丿对于少量由两个多笔画字根构成的字,两个字根笔画相连而没有相交,不视为三型字,而归入二型字。如“贞,并、卞”等。

七,单字的重码两个或两个以上的字编码相同,叫重码。当输入一个重码字的外码时。同该字编码相同的字,会按使用频率顺序全部显示在“提示行”中。如所需的字在第一个位置上,按“空格键”后,该字就会显示到光标位置上;如所需的字在第一个以后的位置上,可通过键盘上的数字键相应挑选。

八、简码字为了提高输入速度和减少重码,对一些常用字除编有全码外,还编有简码。简码输入方法如下(一)一级简码 使用频率很高的26个汉字,根据其字形特征,相应地安排在26个键位上,(见“字根键位总图”)。输入这些汉字,只须将该键打一下,再加打空格键就可完成输入过程。

(二)二级简码 其编码由该字的全码中的前两码组成。输入这些字时,输完前两码后加打空格键就完成了输入过程。

为了提高输入速度,应尽力记住并使用简码。

△在字词混合输入时,全码字在输完三码后仍要加打空格键。

九、词语编码规则(一)所有词语的码串长均为“四位”。也就是说,只须击四次键就可完成一个词语的输入。

(二)二字词的编码 取每个字的前两码组合成该词的词语编码。

(三)三字词的编码 取第一个字的前两码和第二、三两个字的第一码组合成该词的编码。

(四)四个及以上字数的词语编码 取第一、二、三及末尾字的第一码组合成该词的编码。

(五)一级简码字在词语中的编码规定。一级简码字同其他字构成词,在进行编码时,仍不须拆分而用简码。如果按规定要从该字中取两码,则第二码用“L”键后的“;”键代替。如学习---O;CV成长---TVT;(六)重码词 在输入时如遇重码词,其情况和处理方法和重码字一样。重码词的选择键按频率顺序依次为“空格键”和第一区的一至四位键即“H、J、K、L”。

十、关于词库本系统的优点之一就是以词语输入为主。为了实现这一目标,建立了一个有八万条左右词语的词库,且重码率很低。其词库内容包括1.《现代汉语词典》中收入的几乎全部词语。

2.《汉语成语小词典》(商务印书馆出版)中收入的几乎全部成语。

3.“初中地理地图册”中所涉及的全部中外地名。

4.我国县级及以上的行政区名。

5.未收入词典中的常语词语。

本词库收入的词语以二字词、三字词为主。为了减少重码,那些能用二字词、三字词***的词组、短语甚至专用名词,一般不收入。输入时应以“短词优先”为原则,除非你已确认有此“长词语”的编码。

十一、词库的开放性功能汉语词汇极其丰富,由于编码空间的限制和我们的疏忽,不可能全部收入进我们的词库。那些专业性、地方性较强的词语和新出现的词语,在部分用户中使用频率较大。为了全方位满足用户的需要,本系统特设置了开放性功能。用户可根据自己的需要,修改原有字词编码,向词库增加新词及编码,调整重码词的频率顺序和删除重码词。

同现在比较常用的几种输入法相比,本汉字输入方法具有以下优点(一)同音码相比,形码的优点是汉字字形全国统一,见字拆分编码,易于操作;而音码方案会给没有很好掌握汉语拼音和普通话的用户造成极大障碍。且比音码重码率低。

(二)同其他几种比较常用的形码相比,本方案的优点有1、选用字根严格规范,易于为用户认同和接受。

2、尽量采用规范的较大的字根,加上每个单字编码只取三个字根,因此拆分编码更加简明快捷。

3、选用字根较少而规范,加上字根的键位分布组合科学合理,更易于记忆。

4、以单字拆分编码为基础,以词语编码输入为主体,输入速度更加快捷。

二级简码字表H J K L B N M G F D S A T R E W Q Y U I O P V C X ZH 雨需砸于无形天 五烈事两求 碑礁殉零确 矿夹霪来磅 与顿磴码J 西票厍厢酯醋压 歪百右而页 原远酌酷酗 灰厥 粟醅 万运友历K 三转匡辅珑弄辕 臣理辑珊现 珠匹青春软 较珧斑表连 毛巨轻玛L 十杯耗林村棋椅 想棵古南档 棉机棚***松 杭丧敷楼榜 卖梭支根B 七龙手寸批撕挎 看提操捉挡 搬抓抱抢挣 搞抖挤按过 握抬把报N 蔫若莲苦 其鞋 耻蓝勤苗 聊花散苍共 荒蔽落营薪 世菇取节M 赶项套土夺式堵 赴堤喜奋贡 考堆均攻趋 太增志牵培 场却起功G 恒怀非慎此懂怯 步桌占且叔 性瞧肯龄睁 惊悦忐瞎瞳 快县怪眼F 量晒旺果时最里 甲昌日遇晃 星暖监昨晚 景蜕蚊晕暗 电归紧照D 号味呈困啦哎因 遗业骂喂员 喊嚼鸣吃只 嚎凿嗨喀啼 叫唉叹啊S 同用距置毗曲默 罪踢田册踏 帐踩跑路刚 蹁跳思踪罚 骨踺累男A 光岸崭财嶷贱尖 水则崮敞婴 贬贩购岁峪 赃赚 赏赔 崛当岂T 重制生迁我升丢 牌香种向秒 白鬼的移稳 秋科邀番迫 及私系迎R 使传债杂优代侍 修但保佣觅 几仇鸠偷您 伪伴仿爱信 他假反佛E 竿须笔德彻笺等 算篮够月微 胜股朋脸衔 岛简簿管膀 乌勾包第W 合会猜缺犹猎特 处介各备狈 入先物从夕 领氧 氨狱 每氯氢创Q 钙危链杀鱿钱铐 钻蚀象解负 八饭饱金爹 久鲜鲂馆近 锯键色贫Y 衰灯主床拳度庆 店爆烟市就 底夜肩烽效 廊火应亮誉 废育率为U 病半兰斗北并头 着间曾兽冰 首准前冷盗 凉善闷羹瘴 决兼疤弟I 汗酒渐湖浙泄江 涉齐泅洞测 泛没沟施浴 淡漾游演这 泼治涌涨O 写宗害宋守宽类 粗神祸帘视 窗究察客容 衣米密农迷 被裙粑初P 语订请新讨谋试 让课部调端 产设询认讼 之说访旁立 词竣译诏V 屋那尾居屁敢丑 也 避届孙 属孤履孜 以飞 屡辽 子尸 屙C 嫩妹姬姑寻媒参 姐娼怒珊妙 婚允能牟娩 娘嫌妨嫁嫡 好戳怒妈X 纯绒练续导线红 组缆缉细观 乡难约给绝 统绊忌继巡 幻己叠劝Z 卫际阵 陇骤陡 引阳贺骡隙 张附阴验隐 忍办防驼边 力弓骚即三位码汉字编码表啊DZD 懊GTM 板LEX 暴FNA 彼EVX 表KOU 脖ELV 灿YAG 蝉FUL 彻EBZ阿ZJD 澳ITM 版TGX 豹WEY

权利要求 1.“三位码”汉字输入系统的特征在于采用纯形码方案;字根的键位分布组合科学合理;每个单字的全码码串只有三位;以单字拆分编码为基础,以词语编码输入为主体;每个词语的全码码串只有四位。

2.根据权利要求1所述,其特征在于设置了系统开放功能。使用户可根据自己的需要,更改原有字词编码;调整重码字、词的频率顺序,删除重码词;向词库中增加新字词及其编码。

“汉字输入系统——三位码”是一种利用键盘向计算机输入汉字时对汉字进行编码输入的技术。本发明主要解决现有汉字输入法中“形码”的字根记忆量大,拆分复杂,不易掌握等问题。为了实现上述目标,本发明所采用的主要技术有:1、采用纯形码方案。2、选用字根严格规范,且数量少。3、所有字根科学合理的组合安排在26个字母输入键上。4、单字全码码串只有三位,词语码串只有四位。5、以单字编码为基础,以词语输入为主体。6、设置了系统开放功能。

王以成 申请人:王以成


参考资料