计算机情报检索

    计算机情报检索 : 利用计算机从众多的文献资料中找出符合特定需要的文献或情报的过程,目前已成为科技情报现代化的核心内容。
  计算机情报检索可以从不同的角度来分类。
  按存贮情报内容的表现形式,可以分为:
  ①数据检索:存贮的信息是数据,检索时要搜索数据资料档,并针对提问输出答案。
  ②事实检索:存贮的信息是各种事实,检索时可以对被检索的事实作某种逻辑推理,进行比较和分析,然后再输出答案。
  ③文献检索:存贮的信息是文章标题、著录项目和关键词组成的文献单元,检索时,按提问检索词查找文献资料档,输出文献题录和文摘。
  按存贮情报内容的时间,可以分为:
  ①现刊检索:检索时可提供当前现刊上的情报。
  ②追溯检索:检索时可追溯若干年前的情报。
  按计算机检索的方式,可以分为:
  ①脱机检索:检索时利用计算机作批处理。
  ②联机检索:检索时利用计算机的近程或远程终端进行人机联作。
  计算机情报检索工作开始于20世纪50年代初期。1954年,美国海军军械试验站图书馆利用IBM-701电子计算机建立了世界上第一个计算机情报检索系统。1959年,美国H.P.卢恩利用IBM-650 电子计算机进行计算机定题情报检索服务。60年代,在图书情报工作中广泛利用计算机脱机批处理系统进行情报检索。1962年,美国M.M.凯塞尔利用IBM-7094电子计算机及其多道控制台进行了世界上最早的联机情报检索试验。1964年,美国系统发展公司(SDC)研制成功 ORBIT(On-Line Retrieval ofBibliographic Information-Time shared)联机情报检索软件。70 年代以来 ,联机情报检索有了进一步的发展,并向计算机网络过渡。联机情报检索系统除了上述的ORBIT之外,还有美国国家医学图书馆的MEDLINE系统、美国洛克希德公司的DIALOG系统。与此同时,法国、英国、日本、加拿大也先后建立了联机情报检索系统,如欧洲空间组织情报检索中心的ESA-IRS系统。
  中国从 1963 年开始进行机械情报检索的研究工作。1965年进行了机械情报检索试验。70年代以来开始研究计算机情报检索。1975年进行了首次计算机情报检索试验。1977年进行了计算机联机检索试验。1983年在中国科学技术情报研究所建立了连接美国、欧洲主要国家的数据库联机检索系统,这个系统通过意大利的ITALCABLE分组交换中心连接到欧洲空间组织的ESA-IRS系统,并由数据交换网转接到美国的DIALOG、 ORBIT系统,这样,中国就可以在北京利用通信卫星检索到欧美 200多个数据库的几千万篇文献。目前,不少单位在建立各种汉字文献库,有的单位在研究自动标引和自动作文摘的问题。
  语言是信息最重要的载体,是科学技术情报的主要负荷者,文献语言研究的深度对于情报检索的效率有很大的影响。在词汇方面,如果深入地分析文献的主题内容,从文献中抽取出足够的检索词,文献标引的范围就比较大,检索时就能把相关主题的文献查出来,从而提高情报检索的查全率。如果突出检索词的专指性,使其能准确地揭示文献的主题内容,检索时就不必再到其上位词或其他专指性较低的词中去查找,从而提高情报检索的查准率。在句法语义方面,如果从语言学的角度揭示了检索文章的主题中各个检索词的句法语义关系,就不易造成误检。
  目前,计算机情报检索一般采用逻辑式提问,这给用户带来许多不便,因为用户不熟悉逻辑式这样的不自然的提问方法。如果计算机能理解自然语言的含义,让用户直接采用自然语言提问,就可以大大地方便用户,有利于计算机情报检索的推广和应用。而要用自然语言直接提问,就必须把自然语言的句法和语义加以形式化,使计算机能予以分析和理解。语言研究是情报检索系统中一个不可缺少的方面。

为您推荐

《甲骨文字释林》

《甲骨文字释林》 : 甲骨文研究著作。于省吾著。是于氏考释殷墟甲骨文字成果的汇集,1979年中华书局出版。书分3卷。上卷收文53篇,是删订40年代出版的旧作《双剑殷契骈枝》及其续编、三编而成的。中、下两卷..

话语语言学

话语语言学 : 新开拓的语言学科。它探索言语内部构成的规律,包括3个部分:话语理论、话语语法和话语修辞。   话语语言学的研究对象是连贯性话语。所谓连贯性话语是指任何在内容和结构上构成一个整体的言谈或..

机器翻译

机器翻译 : 又称自动化翻译。应用语言学中的一门新兴的实验性学科,研究如何利用电子计算机按一定程序自动进行自然语言之间的翻译问题。   20世纪30年代初,法国科学家G.B.阿尔楚尼提出了用机器来进行翻译的想..

计算机辅助语言教学

华夷译语

华夷译语 : 中国明清两代会同馆和四夷馆( 清初改为四译馆)编纂的多种语言与汉语对译的辞书的总称。语种主要有蒙古、女直(女真)、高昌(畏兀儿)、达达(鞑靼)、西番(藏)、河西(唐古特)、倮(彝)、僮(壮)、八百、百夷(傣)、南掌(老..

浑言

浑言 : 指对同类事物的统称。如果对同类事物细加分别,辨析异同, 另加别名,那就是"析言"。例如《说文解字》走部:"走,趋也。"段玉裁注:"《释名》:`徐行曰步,疾行曰趋,疾趋曰走。`此析言之。许浑言不别也。"又..

计算风格学

计算风格学 : 数理语言学的一个分支。采用计算机技术和统计方法,编制特定的数学程序和数量模型来研究文章风格的学科。主要研究内容有:①根据语言单位之间的数量关系,对不同的比率进行比较,归入不同的类型,确定文..