辅助查准措施 : 在叙词型情报检索语言中,为提高查准率所采取的一些辅助措施。这些措施是在检索词后附加一些符号,用于进一步区别词义,也就是使通用词变为专指检索词,以提高输出文献的准确性。
辅助查准措施主要包括职号、连号和加权系数。
职号 也称职能符号,是叙词型情报检索语言中表示语法关系的一种手段,附在标引词后面,是限定该词逻辑职能的一种符号,用pj(x)式表示。式中,x为表示某一文献(或提问式)主题的标引词,而pj表示该主题中标引词的逻辑职能, 这些逻辑职能包括原材料、 产品、原因、结果、环境、工具等。例如,某一篇文献的中心主题为"以铂作催化剂用氨制造硝酸"。我们用"硝酸"、"制造"、"氨"和"铂"四个标引词表示该文献主题。为避免用"铂的制造"、"氨的制造"和"用硝酸制造"3个提问式检索时,输出此文献,我们规定A表示原材料,B表示产品,C表示催化剂,分别将这些职号附在有关词后面,即,氨-A,硝酸-B,铂-C,这样,用上述3个提问式检索,都不会输出此篇文献。
连号 也称关联符号,是叙词型情报检索语言中表示语法关系的一种手段,附在标引词后面,用于将一组词归并到一类或另一类的一种符号,用pi(x)式表示,式中x表示某一文献(或提问式)的主题变量(关键词),而pi表示一组关键词中第i个分主题的元素属性。 例如,某一文献的中心主题为"摩洛哥橙的收获和柠檬的存储和运输",为避免用"摩洛哥柠檬的收获"和"橙的存储和运输"2个提问检索时输出这篇文献,我们用"橙-1、摩洛哥-1、收获-1;柠檬-2、运输-2、存储-2、运输-2"6个标引词及其连号"1"和"2"标引,检索时就可避免上述误检。
加权系数 指在文献标引中给每个关键词以一定的数值,借以表示该词在表示该主题中的相对重要性。权值可以用正负数值,分若干等级。例如,假定某一情报检索系统中采用18个加权系数等级,9个等级为正值,9个等级为负值。标引时,分别给关键词A、B、 C、D、E和F不同权值:A6,B1,D3,E9和F6。检索时,可能规定每篇文献的输出阈值R,或按RC的大小顺序输出,供用户选择。例如,某一提问式的R>15,则用B、E、F3个标引词标引的某一篇文献(R=24)输出,而用A、B、D3个关键词标引的某一文献(R=12)则不输出。
职号和连号可以提高情报检索的查准率,同时,也会降低查全率,据试验,职号约能提高查准率10%,同时降低查全率10%,连号约能提高查准率10%,同时降低查全率10%以下。此外,采用辅助查准措施会增加一定费用和检索时间。因此,职号除在化学化工专业文献检索系统中采用外, 一般不采用。 连号和加权系数所增费用不多,采用的比职号多。
- 欢迎来到文学网!