信息存储与检索复习资料.docx
一'名词说明1 .主题标引:是在主题分析的基础上,依据肯定的主题词表或主题标引规则,赐予信息资源语词标识的过程。2 .INTERNET(因特网):泛指由多个计算机网络相互连接而成的一个网络,它是在功能和逻辑上组成的个大型网络。3 .顺杳法:就是以课题探讨的起始年限为动身点,利用选定的检索工具如书目、索引、文摘又远与近的逐年查找。4 .三次文献:是在一、二次文献的基础上,经过综合分析而编写出来的文献,人们常把这类文献称为“情报探讨”的成果5 .文献信息资源:文献是记录有学问的一切载体,文献信息资源是以文字、图形、符号、声频、视频等方式记求在各种载体上的学问和信息资源。6 .倒杳法:一种逆时间依次由近而远地杳找信息的方法.7 .次文献:即原始文献,它是作者以生产或科研为依据而创作的原始文献。如专著、期刊论文、学位论文等。8 .检索语言又称为情报语言、情报存储和检索语言、信息组织语言等。它是依据检索的须要而创作的人工语言,把信息的存储和检索联系起来,把标引人员与检索人员联系起来,以便取得共同理解、实现沟通的语言。9 .手工检索:是由检索者通过卡片式或书本式的书目、题录、文摘、索引等检索工具查找文献线索的过程。10 .信息检索语言:信息检索语言是用来描述信息的内容特征、外部特征和表达信息检索提问的种特地语言。11 .特种文献:特种文献是指出版发行和获得途径都比较特别的科技文献。特种文献一般包括会议文献、科技报告、专利文献、学位论文、标准文献等。12 .间接检索法:利用肯定检索工具进行文献检索13 .专利:有三层含义:一指受专利法爱护的独创,二是指专利权,三指专利说明书等专利文献、这三层含义的核心是受专利法爱护的独创,而专利权和专利文献是专利的详细体现。14 .搜寻引擎:是一种Web上应用的软件系统,它以肯定的策略在Web上搜集和发觉信息,在对信息进行处理和组织后,为用户供应Web信息杳询服务。用户可以通过主题阅读和关键词检索的方式搜寻所需信息。15 .技术档案:指生产、设计、建设、科研等专业部门,在科技活动中形成的文件、图书、照片、数据等原始记录文献,包括项目规划、设计、实施方案、任务说明书、协议书、技术指标、试验支配等,具有保密性和内部运用的特点。16 .索引:依据标题法的原理,将类目与其注释改成标题形式,按字顺排列,并注明相应的分类号。这样不仅可便利查表,而且还可将分类表中因为按学科分类而被分散的同一事物不同方面的类目集中,使分类法在某种程度上兼彳主题法的性能。17 .抽查法:针对探讨课题发展的特点,选择有关的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法。18 .回溯检索:乂叫追溯法,是以某一篇文献末尾所附的参考文献为依据,由近与远进行逐一追踪的杳找方法.19 .循环检索:先利用检索工具查出一批有用文献,然后再利用这些文献末尾所附参考文献的线索进行追溯查找.20 .追溯法:以已获文献后面所附参考文献为线索进行追溯查找,又称为参考文献法。21 .分类标引:对档案赐予分类号标识的过程。22 .书目:是图书、期刊或其他单位出版物外表特征的揭示与报道。它是以一本书、一种刊物为著录的基本单位,记录图书、期刊、资料等的名称、著者、出版项与馆藏项等内容,并依据肯定的编排体例进行编制,但不涉与书中的章节或期刊中详细的文章。1 .信息一是世界I:一切事物的状态和特征的反映,是用文字、数据或信号等形式,通过肯定的传递和处理,来表现各种相互联系客观事物在运动改变中所具有特征内容的总称。2 .信息资源是指经过人类的选取、组织、序化等整理与开发后的信息的集合。3 .白色文献是指公开出版发行的、通过正常渠道可以得到的常规文献。1 .数据挖掘就是从大成的、不完全的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在方用的信息和学问的过程。2 .检索策略一就是在分析课题内容实质的基础上,确定检索系统、检索途径和检索词,并科学支配各词之间的位置关系、逻辑联系和查找步骤等。3 .做词检索是指在检索式中用特地的符号(截词符号)表示检索词的某一部分允许有肯定的词形改变。1 .参考数据库一有时又称为书目数据库,是指包含各种数据、信息或学问的原始来源和属性的数据库。2 .特种文献是指出版发行和获得途径都比较特别的科技文献,一股包括专利文献、会议文献、科技报告、学位论文、标准文献、政府出版物等文献类型。3 .学位论文一是高等院校或探讨机构的学生为获得学位资格而提交并通过答辩委员会认可的学术性探讨论文,它是随着学位制度的实施而产生的。4 .科技报告是关于某科研项目或活动的正式报告或汜录,多是探讨、设计单位或个人以书面形式向供应经费和资助的部门或组织汇报其探讨设计和开发项目的成果进展状况的报告。1 .电子图书一是指以电f文件形式存储在各种磁性或电子介质中,以能盘、光盘、网络等电子媒体形式出版发行,通过计算机或便携式阅读终端进行阅读的一种新型数字化书籍,2 .电子报纸多媒体技术、网络技术和通信技术的产物,是指在排、印、投递等方面基本上实现了电子化的报纸.1 .参考工具书是指依据人们的须要,把某一范围的学问或资料加以分析、综合或浓缩,并按肯定的排检方法编排,以备杳阅、参考,用以解决有关事实和数据方面的疑难问题的图书。2 .年鉴是系统汇合一年内的主要时事文献、学科进展状况、探讨成果与有关统计资料,供应详尽的事实、数据和统计数字,反映近期政治、经济发展的动向与科学文化进步的年度出版物。3 .手册是汇合某方面常常须要查考的基本学问和数据资料,以供读者手头随时翻检的一种工具书。4 .名录是汇合机构名、人名、地名等专名基本状况和资料的一种工具书。1 .搜寻引擎就是通过运行一个不断在网络上通过域名扫描和各种链接的软件,自动获得大量站点页面的信息,并依据肯定规则归类整理,从而形成数据库,用以供应查沟的站点。二、填空题2 .信号只是信息的(载体),信息是信号所载荷的(内容)。3 .现实的信息资源依据传递信息的战体和表述方式的不同,可以划分为(口语信息资源),(体语信息资源),(文献信息资源),(实物信息资源),(网络信息资源)。4 .口语信息资源、体语信息资源和实物信息资源,通过计算机技术的转化,成为(网络信息资源),假如有长期开发的价值,往往会转化成(文献信息资源)。4(文献)是记录有信息和学问的一切方形找体,是将学问用文字、符号、图像、音频、视频等方式记录在肯定的固态物质载体的结合体。5 .期刊按内容和性质划分,可以分为(学术性期刊),(检爽性期刊),(其他类型期刊)。6 .(零次文献)是指未经出版发行的或未以公开形式进入社会沟通的最原始的文献。1 .信息检索依据检索的H的和对象的不同,可分为(数据检索)、(事实检索)、(文献检索)三种。2 .信息检索工具按存储内容划分书(书目型)、(题录型)、(文摘型)和(全文型)检索工具。3信息检索工具按我体划分有(印刷型)、(缩微型)和(电子型)检索工具。4 .主要的布尔逻辑关系符有三种:(逻辑与)、(逻辑或)、(逻辑非)。5 .截词检索的截词符一般用(?)或(*)表示。1. 参考数据库主要包括(书目数据库)、(文摘数据库)和(索引数据库)。2. SCI(科学引文索引)的缩写,文献主要来源于(期刊),还有少肽的专著、会议录、书评、科技报告和专利文献。3. E1.是(工程索引)的缩写,90%的文献语种是(英语)。4EI收录期刊的三个档次为(全选期刊)、(选收期刊)、(扩充期刊)。1.(专利文献)是专利制度的产物,反过来说乂是专利制度的重要基础。2,中国专利说明书包括以下几种类型:(独创专利申请公开说明书),(独创专利说明书),(好用新型专利说明书),(外观设计专利说明书)。3.(国际专利分类法)(IPC)是目前惟一国际通用的专利文献分类和检索工具,为世界各国所必备。4会议文献是指通过召开学术会议而产生的文献,包括(会前文献)、(会中文献)和(会后文献)等三种。5 .会议文献的出版形式才很多,通常有以下几种:(图书)、(期刊)、(科技报告)、(在线会议)。6 .依据多数国家的学位制度,学位论文包括(学士学位论文)、(硕士学位论文)和(博士学位论文)三种类型。7 .(标准)是对工农业产品和工程建设的质量、规格、检验方法、包装方法与贮运方法等方面所制定的技术规格。1.电子图书是(多媒体技术)和(超文本技术)发展的产物。3.目前,我国多家特地从事制作电子图书的商业机构,如(超星图书公司)、(北大方正)、(书生之家)等以与一些特地出版网络电子图书的出版商如博库公司等都算得上是我国电子图书事业的先驱,4按制作与出版形式分类,电子图书可分(数据库式)电子图书和(原生)电子图书两类。5.目前,电子报纸主要彳(网络版电f报纸)、(光盘版电子报纸(数据库)、(手机版电子报纸)和(便携式电子报纸)等4种类型。1 .事实和数据的检索是一种能供应详细答案的(确定性检索)。2 .在数据库兴起之前,人们要解决事实与数据的查找问题主要是依微(参考工具书),而随着计管机技术以与互联网的蓬勃发展,(事实与数值型数据库)以与(网络资源)已经成为人们解决该类问题的首选途径。3 .(词典)是汇合语宫里的词语,主要说明词语的概念、意义与其用法,并依据肯定的方法编排,以便查阅的工具书C4英落人类一切学问门类或某一学科学问的完备的工具书称为(百科全书)。1 .(网络信息资源)是通过计算机网络可以利用的各种信息资源的总和。2 .依据信息来源的不同,人们将Internet信息资源分为(政府)、(公众)、(商用)三类信息资源。3 .依据信息资源利用的性质,人们将Internet信息资源分为(开放式信息)、(注册信息)、(沟通式信息)三类信息资源。4 .(数据库方式)与(超媒体方式)是网络环境卜文献资源组织方式的主流。5 .一般地,人们从(检索策略)和(检索工具)两个方面对Intemet信息检索方式进行分类。6 .从广义上讲,搜寻引擎应包括两部分:一是(对信息的采集、存储和组织),二是(信息检索)7 .搜寻引擎按其工作方式和原理的不同,主要可分为三种,分别是(全文搜寻引擎)、(书目索引类搜寻引擎)和(元搜寻引擎)。1.信息资源搜集的主要方法有(系统检索法)、(科学试验法)、(访问考察法)和(调研法)四种。8 .依据内容的不同,文摘可分为以F三大类:(报道性文摘)、(指示性文摘)和(报道指示性文摘)。9 .学位论文的开题一般包括(选题)、(资料搜集)、(撰写开题报告)和(文献综述)几部分内容。三、简答题1.光盘检索与手工检索相比寺.哪些优势?运用光盘检索系统,节约了电讯费和联机系统运用费,还可免除由通信线路传输过程中所造成的失误光盘系统向用户随盘供应相当于联机信息检索系统功能的软件,并供应菜单曲动与吩咐抠动两种方式光盘存贮容量大,耐用,复制费用低须要大量光盘数据库,受到经费限制在信息需求的适时性上,光盘检索不如联机检索系统,因为光欺只能定期供应数据库费用大手工检索的优势(1)便于检索者依据文献标引规则查阅相关文献。(2)手工检索能了解各类检索刊的收录范围、专业覆盖面、特点和编制要点,检索回溯期K,可以提高查全率和查准率。(3)手工检索敏捷性高、费用低。(4)手工检索也便于检索策略的制定和修改,所得到的文献信息一般能符合检索者的信息要求,并且手工检索过程中发觉问题,可以与时地修改和提出。(5)在载体内容的直观性方面,手工检索也优越于计算机检索。利用手工检索工具,人们无须借助任何转换设备便可一目了然地判读详细文献的描述内容,也能够比较精确地了解其全部。而计算机检索则不然,必需借助于相应的读取工具,如计算机、光盘阅读器等,才能得以判读。手工检索的缺憾:”)检索速度慢(2)检索受时空的限制(3)检索受馆藏资源的限制(4)更新周期长(5)检索途径少2信息的特征有哪些?答:普遍性、无限性、传递性、可知性与可贮性、动态性、共享性3.简述联机检索的基本原理C信息用户利用终端设备,通过通讯网络与世界各地的信息检索系统联机,进行人机对话,从检索系统的数据库中杳找出用户所需信息的全过程.一个典型的计算机信息系统,能完成数据收集,分析,加工处理,存储,传递通信和检索信息的全过程.4信息的概念是什么?信息有哪些特征?广义的信息概念:即信息是事物运动的状态和方式,也叫本体论信息狭义的信息概念:即信息是相识主体对事物运动状态和方式的反映,也叫相识论信息信息具有如卜几个特征:普遍性、无限性、传递性、可知性与可贮性、动态性、共享性5 .检索系统必备四大要素是什么?答:检索文档(数据库)、检索设备(检索硬件与通讯设施)、系统规则、相关人员、。6 .简述信息检索语言的功能C信息检索语言.是沟通信息存储和信息检索的桥梁;对信息组织人员来说,它是表达信息主题内容,形成标识并赖以蛆织信息的依据;对信息检索人员来说,它是表达检索需求的依据。7 .简述信息检索的作用。答:全面驾驭必要信息;提高信息利用效率;提高信息素养;具有肯定经济性。8 .简述信息检索原理(可以用图描述)。9 .简述网络信息资源的特点C信息最大,有污染。当我们在检索时,往往会出现很多无关的信息,而信息的真伪是须耍鉴别的(2)信息共享性好,更新快。Intemet上的信息共享性最好,只要在网上的任何一个主机上发表信息,在全世界范围内都能看到.(3)信息源分散无序Jnternet上的信息源是在每个独立的计算机服务器匕使网匕的信息源呈现出分散、无政府状态。用户无法推断网上有多少同H己需求有关的信息,给用户的信息检索带来肯定的困难。(4)信息商品化。网上的免费信息多数都是具有肯定宣扬作用的,真iE有用的信息多数是要付费的,可以说Internet上的网络信息具有肯定的商品化。10 .什么是检索策略?检索策略,就是在分析课题内容具有哪些概念单元的基础匕确定检索系统、检索文档、检索途径和检索词,并科学支配各检索词之间的位置关系和逻辑关系以与杳找步骤等。检索策略考虑得是否周全,干脆影响文献的查全率和查准率。优化方法略11 .简述信息检索的本质。答:本质就是提问标识语文献标识的对比和匹配。12 .举例说明什么是一次文献、二次文献、三次文献C一次文献指以作者本人的探讨成果为依据而创作的原始文献,如期刊论文、探讨报告、专利说明书、会争论文等。二次文献是对一次文献进行加工整理后产生的一类方面,如书目、题录、简介、文摘等检索工具。三次文献是在一、二次文献的基础匕经过综合分析而编写出来的文献,人们常把这类文献称为“情报探讨”的成果,如综述、专题述评、学科年度总结、进展报告、数据手册等。13 .假如要查找有关“转基因生物和细胞与其制备方法”方面的中外文文献,如何杳找?清写出详细的检索步臊。1、分析课题,明确检索要求;2、选择检索系统:要考虑文献类型3、选择检索途径4、选择检索方法5、查找文献线索6、获得原始文献14 .简述文献检索步骤答:明确信息检索需求、选择检索系统、确定检索词、构造检索表达式、实施检索策略并分析结果、检索策略的修改与完善15 .影响查全率和查准率的因索有哪些?杳全率:R=检出的相关信息妣/检索系统中相关信息总量运用泛指性较强的检索语言(如上位类、上位主题词)能提高查全率,但查准率下降。运用专指性较强的检索语言(如卜位类、卜.位主题词)能提高查准率,但查全率下降主要从以卜几个方面考虑:选词、选择数据库是否全面;时间,文献类型16 .信息检索系统都包含哪些子系统?答:文献信息选择子系统;检索语言和名称规范子系统;标引著录子系统;杳询干系统;交互子系统;匹配子系统。17 .简述信息检索的特征。答:相关性;不确定性;逻辑性。18 .信息检索智能化主要体现在哪些方面?答:检索技术智能化;检索结果处理智能化;检索服务智能化。19 .某同学在检索一个课题时,第一次检索的结果有200条文献,你建议一下她采纳何种方式来缩小检索范围?增加文献的检准率,削减文献的检全率第一,变逻辑或为逻辑非,增加“and”的检索词其次,限定文献的类别,(如该文献是医学方面的,就将其限定在医学这个大类Q第三,或变模糊检索为精确检索第四,增加其他的限度,这就要看你自己的,如有没有年限现在啊,作者之类20 .什么是检索策略?计算机检索策略的制定一般经过哪几个步骤?检索策略,就是在分析课题内容具有哪些概念单元的基础匕确定检索系统、检索文档、检索途径和检索词,并科学支配各检索词之间的位置关系和逻辑关系以与杳找步骤等。检索策略考虑得是否周全,干脆影响文献的查全率和查准率。检索步骤(1)弄清信息需求,明确检索目的(2)选择数据库,确定检索途径(3)确定课题的概念组面和检索标识21 .简述专利的新奇性、创建性与好用性的含义,并说明中国爱护的专利有哪儿种类型?专利的新奇性,是指申请日前没方同样的独创或者好用新型在国内外出版物上公开发表过、在国内公开运用过或者以其他方式为公众所知,也没有同样的独创或者好用新型由他人向国务院专利行政部门提出过申请并且记载在申请日以后公布的专利申请文件中。专利的创建性:是指在有新奇性的状况下,不同的技术之间事实上是没有产生意想不到的技术效果,简洁说,就是两者之间的差异不明显,而且效果无进步.专利的好用性:指该理论或者观点的提出对实践的知道程度。中国爱护的专利类型有3种类型,分别是:独创专利、好用新型专利和外观设计专利。22 .什么是信息检索查全率和杳准率?两者之间的关系如何?查全率(ReCaIIRatio)当用户要全面检索某一信息库时,检出的胜利度可用检出的全部相关信息在信息库全部相关信息中所占的比例来表示。这种对信息库检索全面性的测试指标即为查全率C查全率与系统能够检索出的相关文献实力有关。可定义为:查全率=(检出的相关信息数/信息库中相关信息总数)X100%查准率(PreCiSiOnRatio)当用户要对检索到的结果进行分析时,检出的相关信息数在全部检出信息中所占的比例往往成了较重要的评判指标。这种对检索结果中的相关信息的测量指标即为杳准率。也有称为信号噪声比(Signa1.-to-noiserati。)。查准率与检索出的相关信息数有关。可定义为:查准率=(检出的相关信息数/检出的信息总数)X10。%查全率和查准率必缶结合运用,单独运用两者中的任何一个都不能全面说明检索效果的好坏。若检出1篇相关信息,必能达到100%的杳准率,但查全率却会特别低;同样,若检出的信息数等于库中信息的总肽a+b+c+d,则必能获得100%的杳全率,但很明显杳准率必定也低得可怜。杳全率和杳准率是评价检索效果好坏的指标,而漏检率和误检率则是测盘检索误差的指标。23 .影响信息检索效果的因素有哪些?(1)影响查全率的因索从文献存储来看,主要有:文献库收录文献不全;索引词汇缺乏限制和专指性;词表结构不完整;词间关系模糊或不正确;标引不详;标引前后不一样;标引人员遗溯了原文的重要概念或用词不当等。此外,从情报检索来看,主要有:检索策略过于简洁;选词和进行逻辑蛆配不当;检索途径和方法太少;检索人员业务不娴熟和缺乏耐性;检索系统不具备截词功能和反馈功能,检索时不能全面地描述检索要求等。(2)影响查准率的因素主要有:索引词不能精确描述文献主题和检索要求;组配规则不严密;选词与词间关系不正确;标引过于详尽;组配错误;检索时所用检索词(或检索式)专指度不够,检索面宽于检索要求;检索系统不具备逻辑”非"功能和反馈功能;检索式中允许容纳的词数最有限;截词部位不当,检索式中运用逻辑"或"不当等等。事实上,影响检索效果的因素是特别困难的,依据国外有关专家所做的试验表明,查全率与查准率是呈互逆关系的。要想做到查全,势必会要对检索他围和限制逐步放宽,则结果是会把很多不相关的文献也带进来,影响了查准率。企图使查全率和查准率都同时提高,不是很简洁的。强调一方面,忽视另一方面,也是不妥当的zx。应当依据详细i果题的要求,合理调整查全率和查准率,保证检索效果。24 .信息检索的方法才哪几种?从检索手段看,信息检索分为:手工信息检索机械信息检索计算机信息检索25 .什么是信息检索漏检率和误检率,二者之间的关系如何?误检率为检出的结果中,不相关信息占检出信息的比例。这种对检索结果中不相关信息数的测定即为误检率“可定义为:误检率=(检出的非相关信息数/检出的信息总数)X100%漏检率为系统未检索出的相关信息占库中相关信息总数的比例。这种对检索结果中不包含系统中存在的相关信息数的测定即为漏检率.可定义为:漏检率=(未检出的相关信息数/信息库中相关信息总数)X100%其实,杳全率和漏检率是互补的;而杳准率和误检率也是互补关系,即:查全率+漏检率=1;查准率+误检率=1o漏检率和误检率则是测脚检索误差的指标。26 .试比较分类语言与主题词语言分类语言是运用概念划分的原理,以分类号为标识,将各种概念按学科性质加以划分和排列,用以分门别类地、系统地组织信息的一种检索语言,它又可以分为体系分类语言和组配分类语言以与混合分类语言。