科技>计算机>数据库
信息检索理论方法及问题分析

信息检索理论方法及问题分析"

作者:王彪,高光来
ISBN:9787121274374
定价:¥36.0
字数:113千字
页数:164
出版时间:2015-11
开本:16开
版次:01-01
装帧:
出版社:电子工业出版社
简介

本书围绕信息检索的基本内容,结合当前的研究进展和取得的成果,就信息检索领域的研究内容、理论方法及存在的问题进行阐述和分析,主要包括信息检索的基本内容、信息需求表达、检索模型、文档索引及检索性能评价等方面。

前言

前 言 随着信息时代的不断深入发展,人类对信息有了新的要求,不仅在信息种类和数量上要求越来越多,而且在信息质量上要求越来越高。人类在对衣食住行等基本需求的追求过程中常常伴随着相应的信息需求。在对物质需求逐步满足的基础上,人类对信息的需求往往超过了对其他物质的需求。同样,人类自身的发展越来越依赖于对信息的获取和掌握程度。 信息时代的特点是谁能以最短的时间获取最新的、最有价值的信息,谁就能在激烈的竞争中处于有利地位。而现实情况是,随着信息技术、大数据的不断发展,一方面是日积月累的海量信息,而另一方面是信息获取的困难。 在这种情况下,信息检索理论和技术变得越来越重要了。在大数据时代,信息检索理论与技术面临着新的机遇和挑战。 本书是作者在对信息检索相关理论和应用学习及研究分析的基础上,将一些结果和应用加以汇总、总结和整理而成的。 全书共7章,主要内容如下。 第1章,信息检索及其主要研究内容。该章主要介绍信息检索的基本概念、主要研究内容,并对信息检索的研究现状和发展趋势,以及大数据背景下的信息检索进行分析。 第2章,信息检索的需求表达。该章介绍需求表达的含义,分析需求表达的难点及建立信息需求域的方法。 第3章,信息检索的检索模型。该章主要介绍已有的检索模型、查询扩展及相关反馈的发展情况,讨论需求域基础上的信息检索。 第4章,文档索引的建立。该章介绍倒排索引的基本思路和方法。 第5章,信息检索系统的评价方法。该章介绍几种常用的评价模型,包括正确率、召回率、F值指标和平均正确率均值等。 第6章,伪相关文档反馈需求域模型信息检索。该章讨论并分析伪相关文档反馈机制下的需求域模型信息检索,分析伪相关文档反馈机制下需求域的特点,介绍相关模型,设计实验,对实验结果进行分析,并评价模型的性能。 第7章,用户相关文档反馈需求域模型信息检索。该章介绍并分析用户相关文档反馈机制下的需求域及其检索模型,设计实验,并进行模型训练和实验分析。 需要说明的是,信息检索理论方法极其博深,且在不断丰富发展,本书仅是一些初探。 鉴于作者对该领域的浅薄认识及自身知识的局限性,错误和不当之处在所难免,敬请广大同仁不吝批评、指正。 编著者 2015年10月

目录

目 录 第1章 信息检索及其主要研究内容 1 1.1 信息检索 3 1.1.1 信息检索的基本概念 3 1.1.2 信息检索的研究内容 3 1.1.3 研究现状和发展趋势 4 1.1.4 结构化、半结构化和非结构化信息 5 1.2 大数据背景下的信息检索 6 参考文献 7 第2章 信息检索的需求表达 11 2.1 需求表达 13 2.2 需求表达的主要理论方法 13 2.3 需求表达存在的主要问题分析 14 2.4 信息需求域 15 2.4.1 机器信息检索:用关键词匹配近似语义匹配 15 2.4.2 文档、句子及词语之间的语义关系 15 2.4.3 信息需求域 18 2.4.4 信息需求域的理论推导 22 2.4.5 信息需求域的子域、近似域 24 2.4.6 查询请求与信息需求的关系 26 2.4.7 信息需求域的理论意义 29 2.4.8 信息需求域的一种粗糙集解释 29 2.5 小结与讨论 33 参考文献 34 第3章 信息检索的检索模型 37 3.1 信息检索的主要检索模型 39 3.2 查询扩展、相关反馈研究现状 42 3.3 检索存在的主要问题分析 43 3.4 信息需求域基础上的信息检索 45 3.4.1 信息需求域的结构 45 3.4.2 文档相似度的定义 50 3.5 检索模型的发展方向分析 59 参考文献 60 第4章 文档索引的建立 67 4.1 附加统计信息的倒排索引 69 4.2 停用词 71 4.3 词干提取 71 4.4 词形归并 72 4.5 小结与讨论 73 参考文献 73 第5章 信息检索系统的评价方法 75 5.1 测试集 77 5.2 无序检索结果的评价 79 5.3 排序检索结果的评价 80 5.4 小结与讨论 82 参考文献 82 第6章 伪相关文档反馈需求域模型信息检索 85 6.1 伪相关文档反馈机制 87 6.2 需求域去噪 87 6.3 伪相关文档反馈机制的模型分析 89 6.3.1 去噪性能分析与实验 91 6.3.2 去噪参数β的取值分析与实验 95 6.3.3 参数α的取值分析与实验 99 6.3.4 伪相关反馈文档数目及稳定性分析与实验 101 6.4 伪相关文档反馈机制下的需求域模型结论 103 6.4.1 需求域模型结论 104 6.4.2 检索性能对比实验分析 106 6.5 小结与讨论 111 参考文献 112 本章附录 112 第7章 用户相关文档反馈需求域模型信息检索 117 7.1 用户相关文档反馈机制 119 7.2 用户相关文档反馈机制下的模型分析 120 7.2.1 用户相关文档反馈下的上界优化分析与实验 121 7.2.2 优化参数β的取值分析与实验 124 7.2.3 参数α的取值分析与实验 127 7.2.4 相关反馈文档数目及稳定性的分析与实验 130 7.3 用户相关文档反馈机制下的需求域模型结论 133 7.3.1 需求域模型结论 133 7.3.2 检索性能对比实验分析 135 7.4 需求域模型计算性能分析 139 7.5 小结与讨论 140 全书参考文献 143

作者简介

教授,博士,硕士研究生导师,内蒙古财经大学计算机信息管理学院副院长。内蒙古自治区新世纪“321人才工程”二层次人员,内蒙古自治区“511人才工程”人员,美国Illinois Institute of Technology大学访问学者,内蒙古财经大学优秀教师。__eol__主持、参加自治区等科研课题20多项,获内蒙古自治区科研奖项2项;发表论文20多篇__eol__主要科研领域:粗糙集与模糊集、数据挖掘、知识发现等。__eol__

编辑推荐

作者寄语

电子资料

www.luweidong.cn

下一个