首页> 中国专利> 一种见字即识形码也可使用音码的汉字键盘输入方法

一种见字即识形码也可使用音码的汉字键盘输入方法

摘要

一种见字即识形码也可使用音码的汉字编码方法及其输入键盘,目的是提出一种适合于大字符集或超大字符集汉字输入,能见字识码即从字根本身看出其键位,还能用音码输入汉字和输入非汉字符号以及提供扩充功能的汉字形码输入法及其键盘技术方案。本发明以字根和字型为编码码元,字根码6类20个,字型码3个,可排布于计算机通用键盘或数字键盘上。本发明将汉字笔画分为1类和2类,横(提)、撇、点(捺)为1类笔画,竖、折为2类笔画,在此基础上依据字根的笔画类型和笔画数得到20个字根码,因此完全不必强记字根的代码。声母和韵母也可排布于这23个代码上。本发明达到了易学易记易用的统一,适合从小到超大各字符集汉字和符号的输入。

著录项

  • 公开/公告号CN1588284A

    专利类型发明专利

  • 公开/公告日2005-03-02

    原文格式PDF

  • 申请/专利权人 旷天水;

    申请/专利号CN200410056157.2

  • 发明设计人 旷天水;

    申请日2004-08-17

  • 分类号G06F3/023;

  • 代理机构

  • 代理人

  • 地址 343700 江西省泰和县县城澄江大道林业局院内

  • 入库时间 2023-12-17 15:55:48

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2010-11-03

    未缴年费专利权终止 IPC(主分类):G06F3/023 授权公告日:20070103 申请日:20040817

    专利权的终止

  • 2007-01-03

    授权

    授权

  • 2005-05-04

    实质审查的生效

    实质审查的生效

  • 2005-03-02

    公开

    公开

说明书

技术领域

本发明涉及一种形码电脑汉字输入法及其键盘,特别是涉及一种还能在统一的编码空间中提供附属功能如汉字音码输入和非汉字符号输入等的形码电脑汉字输入法及其键盘。

背景技术

汉字形码输入法,是从组成汉字的所有字根中选择确定数量的特定字根作为编码码元、然后将这些编码码元指定到键盘相应键位上、再利用键盘上的特定键位根据汉字编码输入规则输入汉字。它不仅要求重码少、输入效率高,而且输入法本身设计要科学合理、简单规范、易学易记。在目前现有的各种形码输入法中,有些输入法虽然可以实现快速高效的输入,但或由于键盘相应键位上的码元有很大一部分与键位代码没有直接的对应关系或对应关系与对应规则不相符,记忆量过大,或由于不能同时适用于计算机通用键盘(指目前在计算机系统中采用的标准键盘)和数字键盘,很难通用于各种场合,仅能适用于一些专门的汉字录入场合,或某些特定用户。

在以形码输入汉字时,有时会出现不记得其字形而只记得其读音的情况,此时通常的做法是切换为一种音码输入法进行输入,这不仅增加了软件成本,也降低了输入效率。

现有的汉字输入法在输入非汉字符号时非常不便,当需要输入某个非汉字符号时,或无法输入,或使用编辑软件的有关功能,或使用区位码等,这大大增加了输入的复杂性。

发明内容

本发明的目的是提出一种适合于大字符集或超大字符集汉字输入、既简单规范高效又易学易记、还有专门编码空间用于汉字音码输入和非汉字符号输入以及提供扩充功能的汉字形码输入法及其键盘技术方案。本发明以汉字基本部件(字根)和三种字型为编码码元,依据笔画特征将字根划分为6大类20小类与3种字型一起排布于通用键盘或数字键盘上,形成非常直观科学的键位代码,码元选择合理,键位排布直观,用这套直接反映码元特征的键位代码可将大字符集汉字有效地编码输入计算机系统,使汉字输入更易学习、掌握和使用。

本发明一种见字即识形码也可使用音码的汉字键盘输入方法,采用根据汉字构造规律优选的字根和计算机通用键盘或数字键盘,将汉字笔画分为1类和2类,再根据字根的首笔画和次笔画(第二笔画)及笔画数的不同有规律地将这些字根按手指在键盘上的指法排布到相应键位上。现在一般将汉字笔画分为横(提)、竖、撇、点(捺)、折5种。本发明1类笔画包括横(提)、撇、点(捺)3种,2类笔画包括竖、折两种,将绝大部分字根依其首笔画和次笔画分为11、12、21、22四大类;对因容易引起较多重码而剩余的其它字根作为特殊字根,依其首笔画分为10和20两大类(相应地称前述四大类字根为普通字根)。上述六大类字根每一大类对应通用键盘上按指法划分的一个区或对应数字键盘上的一个键位,各区根据字根的笔画数不同分别含4个或3个键位,共有112~115、122~125、212~214、222~224、101~103、201~203计20个键位,并以这20个键位作为键位代码(字根码);每个键位代码的第三个数位即笔画数对应双手手指在通用键盘上的指法,1和2对应食指、3对应中指、4对应无名指、5对应小指。在目前的通用键盘和数字键盘上,对应关系可以是:在数字键盘上以数字键4、在通用键盘上以字符键J、K、L、;(分号)对应区位112、113、114、115作为字根首笔画次笔画均为1类的普一区,分别对应笔画数为2、3、4、5和5以上的字根;在数字键盘上以数字键5、在通用键盘上以字符键F、D、S、A对应区位122、123、124、125作为字根首笔画为1类次笔画为2类的普二区,分别对应笔画数为2、3、4、5和5以上的字根;在数字键盘上以数字键1、在通用键盘上以字符键U、I、O对应区位212、213、214作为字根首笔画为2类次笔画为1类的普三区,分别对应笔画数为2、3、4和4以上的字根;在数字键盘上以数字键2、在通用键盘上以字符键R、E、W对应区位222、223、224作为字根首笔画和次笔画均2类的普四区,分别对应笔画数为2、3、4和4以上的字根;在数字键盘上以数字键6、在通用键盘上以字符键B、V、C对应区位101、102、103作为首笔画为1类的特殊字根的特一区,分别对应1类单笔画字根和金钅、月酉、木本等;在数字键盘上以数字键3、在通用键盘上以字符键N、M、,(逗号)对应区位201、202、203作为特殊字根的特二区,分别对应2类单笔画字根和口、日曰冃(冒的上部)、土士等。

由两个或两个以上字根组成的汉字的三种字型,即左右并列、上下层叠、前后重合(包括相交、包围和附点),分别用“厶、丁、刀”代表。单字元汉字以首笔画为区分字型的依据,“厶”代表竖起折和点,“丁”代表横和竖,“刀”代表撇和横起折。字型对应通用键盘上的一个区或数字键盘上的一个键位,该区有“厶、丁、刀”三个键位,并以此为键位代码(字型码),即在数字键盘上以数字键7、在通用键盘上以字符键G、H、Y对应字型“厶、丁、刀”。

对于数字键盘,由于一个数字键包括多个键位代码,因此用数字键8作为“轮码”键,进行汉字输入时用“轮码”键在一个键位上顺序选择各键位代码。

作为编码码元的字根的选取可以根据汉字构造规律、依照容易拆分汉字的原则确定。同一字根往往有多个不同的变体,此时需确定其中一个为主字根,以主字根为依据确定其键位代码(字根码),变体的字根码依主字根(实际上只有少量变体的笔画特征与主字根不同)。本发明选用的字根归入各区位为(“土”首笔画、“王”的次笔画按规范应为“横”即1类笔画,这里以“竖”即2类笔画为依据归类):

区位112:二厂丆ナ人(亻)入乂八亠冫;区位113:广丈三彳大`于亍亏丌兀尢扌)干千乇亡宀``彡亼亽`亐;区位114:气攵文六火仌犬仒)`天夫丰夭牛牜午`毛长手斤爪爫`井方友歹`不云戶`灬专`韦`壬;区位115:疒乍`立羊尨`生矢`辛来耒采`龙兆竹()``戋辰鬥豸舟`頁`州瓜戊丣()`示```缶``酋`米未末禾`吂石;

区位122:讠(言)冖丂七十丁丅匚ㄈ九儿几勹匕;区位123:万及下夊艹(廾)川`工才之辶与()寸弋夨久丸犭夕()`)门;区位124:丹耂`冘比车旡兂氏艹`戈为礻卝勿巨`心户`屯廿(卅)`五巿`瓦丏片`王;区位125:甘匃)`革镸芈`其耳堇車隹``臣西(覀`丘囱`長`戉`东臼`永正求用乑`世丗卌襾`雨()兩両`两自囟`必衤`甫身`古`白卑鬼`至;

区位212:卜乃力刀又マ廴厶リ(丷);区位213:上丬习彐小忄``女飞尸`巳己已弓:区位214:爿`非夬尹肀`聿`艮弗丱虍`发歺```皮癶戼`氺(水氵)`齿齒`門`止凸矛`予弔

区位222:了冂()巜阝卩)丩(刂 凵;区位223:口彑幺`山巛`纟(糹糸)乡子孑`屮巾也;区位224:内贝母毋`目且甲早`里黑囬`果`四中见`冊(册)丳`曲`串`禸囙`业电黽`申央疋氶`冎円皿罒`禺```巴`田由冉虫丑;

区位101:一丿丶ㄟ金钅釒;区位102:月酉;区位103:木朩本

区位201:乙乛乚丨亅口;区位202:日曰冃;区位203:土士。

对汉字取码最大码长为4码,依字根的首笔画顺序取第一、二、三个字根码和最后一个字根码;当不足4码时加上该字字型码;加上字型码后仍不足4码时再加上末字根的余码以补足4码。余码的含义及取码方法为:一个字根中除首笔画外,取其它连续笔画中能组成字根且笔画最多者(笔画相同取最后)为该字根的余码。单笔画字根的余码为其本身。

对于由三个字根组成的汉字,其最大码长也可为5码,取码方法是:取这三个字根码和该字字型码后,再加上末字根的余码。

为了充分利用编码空间以提高效率和消除重码,本发明对汉字以形码取码时可取一级、二级、三级简码,分别由汉字编码的第一码、前两码、前三码组成。每个简码对应两个使用频率较高的汉字。击空格键或数字0输入首字,击其它未使用的字符键位或数字键位输入次字。对于取了二级或三级简码的汉字可不再保留其全码。

最大码长为5码的汉字还可取四级简码,每个四级简码对应1个汉字。为了简短以方便书写和显示,区号11、12、21、22、10、20可分别用代表,应地,区位112~115可以写成,122~125可以写成,212~214可以写成,222~224可以写成,101~103可以写成123,201~203可以写成。字型“厶、丁、刀”可分别写成K、T、P。

数字键盘上各码元对应的键位也可以为:普一区区号11对应键位4,普二区区号12对应键位5,普三区区号21对应键位1,普四区区号22对应键位2,特一区区号10对应键位6,特二区区号20对应键位3;位号1~5则直接对应键位1~5;连续按键位6和4则输入字型K,连续按键位6和5则输入字型T,连续按键位6和6则输入字型P。此时一个码元需两键。

在键盘上各类码元对应的键位也可根据指法习惯灵活设定。

用上述23个代码也能以拼音方式输入汉字。声母和组合后的韵母可排布在这23个代码上,其排布如下:声母b、韵母ang对应区位112;声母f、韵母an对应区位113;声母m、韵母ai对应区位114;声母p、韵母ao对应区位115;声母d、韵母eng、er和ü对应区位122;声母t、韵母en、ia和üe对应区位123;声母n、韵母ei和ue对应区位124;声母l、韵母ie对应区位125;声母g、韵母uang和iang对应区位212;声母h、韵母uai和ian对应区位213;声母k、韵母iao对应区位214;声母j、韵母ing对应区位222;声母x、韵母in和ui对应区位223;声母q、韵母iu和ua对应区位224;声母c、韵母ou对应区位101;声母s、韵母ong和iong对应区位102;声母z、韵母un对应区位103;声母ch、韵母e对应区位201;声母sh、韵母o和uo对应区位202;声母zh、韵母a对应区位203;声母w、韵母u对应区位“厶”;声母y、韵母i对应区位“丁”;声母r、韵母uan和üan对应区位“刀”。汉语拼音方案规定ü上两点省略的,输入时必须用u。按上述排布,仅下列只含几个字的拼音dia,lia.lo,nen,neng,leng等会与同键位的其它拼音混淆,这对拼音输入影响可以忽略。

本发明所述码元在通用键盘和数字键盘上的设置以表格形式可表示如下:

以拼音方式输入汉字时,先选定一个字型码如“刀(P)”作为拼音前缀(此时不代表字型),取码方法可以是:先在键盘上按这个字型码对应的键位,然后依次按声母、韵母对应的键位,再从显示屏上显示的一组汉字中选择所需汉字。也可如下取码:先按作为前缀的字型码对应的键位和声母键位,然后按韵母中各元音和辅音字母对应键位而由系统转换成韵母键位。元音字母a、e、o、i、u以及字母ü在数字键盘上分别对应4、5、6、1、2、3。

当拼音无声母时,若韵母为en或er则其声母以y代替,否则以jxq三者之一代替。

以拼音方式输入汉字时还可如下取码:先按作为前缀的字型码对应的键位,然后依次按声母、韵母和声调对应的键位,再选择所需汉字。声调的排布为:阴平、阳平、上声、去声、轻声分别用区号11()、12()、21()、22()、10(-)代表。

本发明对词语进行取码输入可采用如下方法:

二字词:依次取各字形码编码的前两码;三字词:依次取首字形码编码的前两码和后两字形码编码的首码;四字及四字以上词:依次取前3字和末字形码编码的首码。

输入非汉字符号时,也要先选定一个字型码如“丁(T)”作为前缀,输入方法可以是:先按字型码对应的键位,然后按该非汉字符号所属组对应的键位,再从显示屏上显示的一组符号中选择所需符号。一种对标点符号和数字取码的方法可以是:对应单标点符号,对应成对及占两格的标点符号,两区对应各类数字。其它符号可根据使用频度灵活设定。

以剩余的一个字型码为前缀的编码可用于扩充其它功能。

本发明通过通用键盘或数字键盘,用一套直接反映码元特征的23个代码对大字符集汉字进行计算机编码输入,形成对大字符集汉字编码输入的新的完整的编码体系。按照本发明的码元体系及键盘排布,可以对简繁汉字及词语进行形码或音码取码输入,也可以对非汉字符号进行取码输入,而不限其字符集的大小,还可以扩充功能。

本发明突出的实质性特点在于作为编码码元的字根和字型设计和归类科学合理,各键位上的码元与其键位之间有确定、统一的对应关系,可以从码元、汉字的笔画和字型特征中直接而快速得到其键位代码。作为码元的字根是通过对5万4千多个汉字进行分析而选定的,数量达640个,与现有输入技术中使用非常广泛的标准五笔字型输入法相比,本发明的字根数量是其2.6倍。这使得汉字拆分更容易,编码输入更易学易记。

本发明突出的实质性特点还在于通过普通字根和特殊字根科学合理的键位分离,实现了在最大程度上离散重码,大大降低了重码率,特别是大字符集的重码率。

本发明突出的实质性特点还在于通过字型码元在一个完整的编码体系中可以对汉字同时进行形码和音码的键盘编码输入,还可编码输入非汉字符号,并另有专门编码空间用于扩充功能,避免了输入文字时在不同的输入法间频繁地切换状态而造成操作上的复杂性和不便。

本发明突出的实质性特点还在于适用于多种键盘,既可在通用键盘上用双手操作,也可在数字键盘上用单手操作,实现了不同键盘上输入方法的完全统一。

本发明可对GB18030-2000《信息技术信息交换用汉字编码字符集基本集的扩充》国家标准内的全部简繁汉字或更大字符集的汉字字词进行编码输入,形成大字符集汉字编码输入体系。采用最大码长为4码、逐层一分为二拆分汉字时其部分汉字的形码编码如下:

与以往技术相比,本发明显著的进步在于易学易记易用,键盘上的键位代码直接反映了码元的笔画特征,完全抛弃了与汉字部件毫无联系的英文字母,码元中除极个别字根和少量字根变体外其笔画特征与键位代码完全相符,汉字输入时只需知道一个汉字部件是不是字根就行,而不必强记其键位,若是字根,则其键位可从其笔画特征中看出,最大限度地减少了记忆因素。如“立”是字根,其首笔画和次笔画都为1类笔画、笔画数为5,因而其键位为115;“鬼”是字根,其首笔画为1类笔画、次笔画为2类笔画、笔画数为5以上,因而其键位为125。现有的技术如标准五笔字型输入法中字根的排布与其区位不相符者达30%以上,且同一个键位中有的字根与区位相符而有的不相符,记忆难度非常大。

本发明在输入常用汉字时基本无重码。GBK字符集重码字数占该字符集总字数的13%,重码编码中平均每个编码2.58个重码字,最大重码8字。GB18030-2000字符集重码字数占该字符集总字数的20%,重码编码中平均每个编码1.7个重码字,最大重码11字。由于绝大部分重码字属稀用字和罕用字,因而本发明在输入大字符集汉字时重码率很低,输入较小字符集汉字时重码率更低。上述数据是在最大码长为4码且部分汉字能取简码而未取时统计的。

本发明的字根有640个,在其它形码输入法如标准五笔字型输入法中很多要拆分的部件在本发明中作为字根都不要拆分,如丰夫午堇車隹韋丳曲串禸囙业电黽辰豸卑鬼等部件,这大大减少了对汉字进行拆分的难度,加上能见字识码,重码率很低,因而输入速度快。

本发明显著的进步还在于可用多种键盘在一个统一的编码空间中同时对汉字进行形码编码输入和音码编码输入及对非汉字符号编码输入,并还有专门编码空间用于扩充功能。进行汉字输入时只要知道汉字的字形和字音二者之一就能输入汉字,依字形输入时若不记得某字字形,立即就能根据字音将其输入,而不必象现有技术那样,在众多的输入法中另选一种拼音输入法或转换为拼音状态输入该字,输入完成后再返回原来的输入法状态。本发明不同于在一个汉字的编码中既有形的成分也有音的成分的音形混合编码输入,音形混合编码输入需要同时清楚汉字的字形和字音才能输入该字。现有的输入法软件中也有的可同时使用形码和音码,如智能陈桥汉字输入系统,但这是通过输入状态的转换实现的,实质上还是独立的两种输入法。

具体实施方式

本实施例采用最大码长为4码。使用本发明的技术方案将汉字输入计算机时,首先必须将汉字拆分成字根。本实施例中汉字拆分方法为:逐层将汉字一分为二直到字根,字根以成字为优先,有二义性时依次遵循不拆相交笔画、前一字根笔画数要多的原则,必要时截断横或竖。用一句话概括就是:成字对拆交前多。编码中字根的顺序以其首笔画顺序为准。按对拆原则要截断笔画时,若不截断不会增加字根数则不要截断笔画。

以形码方式输入汉字时,依字根的首笔画顺序取第一、二、三个字根码和最后一个字根码;当不足4码时加上该字字型码;加上字型码后仍不足4码时再加上末字根的余码以补足4码。在输入汉字过程中,输入码长小于最大码长时,每按一个键位,系统就显示两个字供选择输入,通用键盘上击空格键输入首字、击上排数字键输入次字,数字键盘上击数字0输入首字、击数字键9输入次字。

以音码方式输入汉字时,用字型码“刀(P)”为前缀,先在键盘上按作为拼音前缀的字型码P对应的键位,然后依次按声母和韵母对应键位,再从显示屏上显示的一组汉字中选择所需汉字。当拼音无声母时,若韵母为en或er则其声母以y代替,否则以x代替。

输入非汉字符号时,用字型码“丁(T)”为前缀。对应单标点符号,对应成对及占两格的标点符号,对应数学符号,对应各种单位符号,对应各种标记符号,对应希腊字母,对应汉语拼音字母和注音字母,对应其它符号,1对应制表符,2对应日文假名,3对应俄文字母,对应半角ASII符号,对应全角ASII符号,“”两区键位对应各种数字。如:要输入间隔号可以输入编码T,然后在显示屏上选择所需符号;编码T01~T20输入1~20的各种数字。

如:“博”,首先在外层即第一层将该字左右一分为二拆为“十”和“尃”,第二层左边“十”是字根不要拆,右边“尃”不是字根继续上下一分为二拆为“甫”和“寸”,至此全部拆分成字根。因此,“博”所取字根为“十甫寸”,字型为左右并列(K),“十”的前两笔画为1类和2类、笔画数为2、故其键位代码为122,“甫”的前两笔画为1类和2类、笔画数为5以上、故其键位代码为125,“寸”前两笔画为1类和2类、笔画数为3、故其键位代码为123,“博”的编码为K,在相应键位按键即可输入该字。以拼音输入时,其拼音为bo,声母和韵母分别对应键位代码112和202,固其编码为P,在相应键位按键即可输入该字。

“繁”,首先在外层即第一层将该字上下一分为二拆为“敏”和“糸”,第二层上边“敏”不是字根继续左右一分为二拆为“每”和“攵”,下边“糸”是字根不要拆,第三层只有“每”不是字根,将其上下一分为二拆为“”和“母”,至此全部拆分成字根。因此,“繁”所取字根为“母攵糸”,“”前两笔画均为1类、笔画数为2、故其键位代码为112,“母”前两笔画均为2类、笔画数为4以上、故其键位代码为224,“攵”前两笔画均为1类、笔画数为4、故其键位代码为114,“糸”是字根变体、依主字根“纟”前两笔画均为2类、笔画数为3、故其键位代码为223,“繁”的编码为,在相应键位按键即可输入该字。以拼音输入时,其拼音为fan,声母和韵母均对应键位代码113,固其编码为P

“熏”,按对拆原则截断笔画上下一分为二拆为“千”和“黑”,至此已拆分成字根。因此,“熏”所取字根为“千黑”,字型为上下层叠(T),末字根“黑”的余码取“灬”的键位代码114,“千”前两笔画均为1类、笔画数为3,固其键位代码为113,“黑”的前两笔画均为2类、笔画数为4以上、固其键位代码为224,“熏”的编码为T,在相应键位按键即可输入该字。以拼音输入时,因其拼音为xun ,声母和韵母分别对应键位代码223和103,固其编码为P3。

“缶”,该字是字根不要拆分,字型即首笔画为撇(P),余码取“山”的键位代码223,“缶”的前两笔画均为1类,笔画数为5以上,固其编码为P,在相应键位按键即可输入该字。以拼音输入时,因其拼音为fou,声母和韵母分别对应键位代码113和101,固其编码为P1。

本发明可应用于涉及汉字的电脑及终端设备、软件、网络、通信产品、手持便携设备等以及各类图书和印刷品中。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号