当前位置 HR学堂 档案管理 正文 下一篇:

关键词检索语言的优点缺点

关键词是指从文献的篇名、文摘和正文中抽取的能揭示和描述文献主题内容的起关键作用的词和词组。除了禁用词(Stop—Term),如一些冠词、介词、副词或连词外,凡在概念上有实质意义的词都可用作关键词,通常一篇文献信息可以选取3~5 个关键词。关键词法主要用于计算机信息加工抽词编制索引,国内中文数据库多采用关键词索引。

(1)关键词索引的优点是:

① 标引时无需查看词表,直接根据题名、文摘中的语词进行标引,简便易行,可以降低对标引人员的要求,节省标引时间;

② 易于使用计算机编制,实现检索工具编制过程的计算机化,保证通报文献的及时性及生产过程的高效率和低成本;

③ 能够及时更新词汇,出现在题名、文摘中具有检索意义的词汇均可立即用于标引和检索。

(2)关键词语言的不足是:

① 关键词检索工具的质量往往直接受文献题名质量的影响。由于不同学科领域题名在反映文献主题内容的程度上存在很大的差异,用关键词语言建立的检索工具,质量往往不稳定,会导致漏检、误检;

② 作为一种自然语言形式,关键词语言未进行同义词、相关词的处理,用户检索时很难依靠自己的了解查全同一概念的不同词形及进行相关词的检索,这会增加用户负担,影响查全率;

③ 题名中的不少语词为通用概念,以它们为检索入口建立的检索款目没有实际检索意义;

④ 汉语由于存在分词难题,应用计算机进行汉语关键词抽词标引仍需要解决词汇切分问题。

版权声明:本篇文章(包括图片)来自网络,由程序自动采集,著作权(版权)归原作者所有,如有侵权联系我们删除,联系方式(QQ:452038415)。http://www.djsbq.com/2484.html
返回顶部