在存储信息时,信息著录和标引人员首先要对各种原始信息进行分析,把原始信息中包含的信息内容分析出来,形成若干能代表该原始信息主题的概念,并用检索语言(即标引标识)把这些概念标引出来,然后按一定规则存入检索工具或系统,形成信息集合。
信息检索的过程是信息存储的逆过程。
用户检索时,首先对自己的所需信息进行分析,形成若干主题概念,把这些概念转换成检索语言,用检索语言表达信息提问,然后从检索工具或系统中查找到相关信息(匹配过程)。
简而言之,信息检索原理就是将检索标识与存储在检索工具或系统中的标引标识(包括可检索的著录项)进行比较匹配,两者一致或信息标引的标识包含着检索标识,则为命中记录。
计算机检索是利用电子计算机存储检索文献信息的过程。
存储时,文献信息工作者将大量的文献、数据、事实资料以一定的格式输入到计算机的软件系统中,通过系统的多种分类检索功能组成可供检索的数据库。
检索时,将检索提问词组成检索式输入计算机内,计算机将检索提问词与存储系统的数据进行匹配运算,输出符合需要的检索结果。
图1-1 信息检索的基本原理