汉字情报输入技术

    汉字情报输入技术 : 在汉字信息处理和计算机检索中以计算机可读的方式输入汉字的有关方法和设备。在中国及一些使用汉字的国家和地区,汉字输入是计算机情报系统的重要组成部分。
  汉字输入特点  汉字是图形文字,数量庞大,字形复杂,同音字多。与拼音文字相比,汉字的计算机输入有许多特殊问题需要解决。通常在同一系统中,需要同时处理汉字和西文,因而还需要考虑两种字符的兼容和区分,这样给汉字编码和输入带来许多困难。
  汉字输入方式  70年代以来,人们广泛重视汉字输入技术的研究,已提出的汉字输入技术大致可分键盘输入、 汉字图形识别输入、 汉语语音识别输入几种类型。汉语语音识别技术目前尚处于实验性阶段,这是因为除去语音识别技术本身的困难之外,还由于汉语中同音字多的关系。汉字图形识别技术用于汉字输入的装置是光学字符识别装置 (OCR)。人们分别就印刷体、手写印刷体和手写体 3种类型的识别对象进行试验研究。从目前所得到的结果看,印刷体汉字识别无论在识别率及识别速度方面都取得了较好的结果,并已有产品推出,识别率达99%以上,速度是100字/秒左右,但识别字数目前在2000~3000字之内。手写汉字识别技术已用到一些文字处理设备上,但仅仅作为键盘输入的一种补充手段。迄今为止,键盘输入是计算机汉字输入的主要方法。
  汉字输入键盘  可分成3种类型:
  ①整字键盘,又称"大键盘"。同中文打字机一样,把汉字分布在键盘的各个键位上,由于汉字数量多,导致键盘面积大,后来多改用"笔触式"来缩小面积,原理仍是一样。其优点是直观,但不足是找字不便、键输入速度慢、价格高昂、不易维修等。
  ②字根键盘,又称"中键盘"。利用汉字在形状上由数百个"部首"、"偏旁"等部件所构成的原理,在键面上布置了这些部件,使用时按一定规则把它们加以组织以输入汉字。 由于具有与大键盘一样的缺点, 且规则不易掌握,所以中键盘输入汉字的方法已逐渐淘汰。
  ③标准键盘,又称"小键盘"。与西文输入键盘兼容,用英、数字的组合代表全部汉字字符集,已成为计算机汉字输入的主流。
  汉字输入编码  现已提出数百种不同的汉字输入编码方案,但本质上都是建立汉字字符集与一个小的符号集合之间的对应关系,而这一小的字符集应是标准键盘所能容纳得下的。按照建立对应关系所持依据的不同,主要的编码方法一般可划分成3种类型:
  ① 按形分解。笔形码(八笔字型、五笔字型等)、三角码、仓颉码及宏观码等,均属此类。
  ② 按音分解。汉语拼音,紧缩汉语拼音及双拼等即是。
  ③ 音形结合。"见字识码"为其代表。
  实际上,使用者一般不拘于一种方法,所以大多数计算机汉字输入系统均配有多种输入方法,以供使用者自由选择和切换。以上各种计算机汉字输入技术,在情报工作中均可采用。除编码输入方法外,印刷体的识别技术是值得重视的,它尤其适用于印刷品情报资料向计算机转贮。

为您推荐

哈玛舍尔德图书馆

哈玛舍尔德图书馆 : 联合国总部图书馆。成立于1946年。设在美国纽约市联合国大厦西侧,1961年11月新馆舍落成后,以联合国第二任秘书长哈玛舍尔德(1953~1961年在任)的姓氏命名。主要为联合国各国代表团、联合国..

国家情报中心

国家情报中心 : 在国家情报机构体系中,面向全国情报用户服务的具有中心功能的情报机构。通常是由政府组建或支持的综合情报机构。它制订和贯彻国家情报政策,在建设国家情报系统的基础结构和开展情报服务活动..

汉字情报检索

汉字情报检索 : 指以汉字表明的信息作为存取对象的情报检索,与中文情报检索含义相同,同时泛指含有汉字(如日语等)文字的情报检索。在计算机内部,无论中文或西文都以代码形式表现,汉字检索和西文检索,检索原理..

洪有丰 (1892~1963)

《汉语主题词表》

《汉语主题词表》 : 一部大型的综合性中文叙词表,它包括了人类知识的所有门类,分 3卷 10个分册出版,共收叙词 11万条。该词表主要供电子计算机系统存储和检索文献用,亦可用来组织卡片式主题目录和书本式主题索..

哈佛-燕京学社引得编纂处

哈佛-燕京学社引得编纂处 : 中国编印古籍索引的机构,1930年 9月成立于北京,1941年12月~1945年秋曾一度中断工作,1950年停办。   1928年秋,在美国哈佛大学讲学的洪业(煨莲)深感查检中国古籍十分困难,萌发编纂古..

国际农业科学技术情报系统

国际农业科学技术情报系统 : 联合国粮农组织领导下的国际农业科技情报交流和合作组织。1969年英国农业局和美国国立农业图书馆建议联合国粮农组织成立国际农业情报系统,1972年联合国粮农组织成立农业情报系..