关键词是指从文献的篇名、文摘和正文中抽取的能揭示和描述文献主题内容的起关键作用的词和词组。除了禁用词(Stop—Term),如一些冠词、介词、副词或连词外,凡在概念上有实质意义的词都可用作关键词,通常一篇文献信息可以选取3~5 个关键词。关键词法主要用于计算机信息加工抽词编制索引,国内中文数据库多采用关键词索引。
对关键词语言改进的一般方法包括:
① 调整禁用词表,根据学科领域的特点和检索的需要,在禁用词表中增加无实际标引和检索价值的一般性质词汇,如方法、利用、应用等,缩小索引篇幅,改进检索效果;
② 进行人工干预,如通过人工辅助标引增加题名外的关键词,对词对式索引中不符合加法关系的标题予以删除;
③ 改进关键词表,将标引用的关键词整理成表,作为抽词标引的依据,在汉语尚未解决词汇切分的情况下,这一方法特别适用;
④ 使用后控词表,利用对同义词、相关词的处理改进检索等。