科技>其他
网站信息组织优化——基于网络日志的用户行为分析

网站信息组织优化——基于网络日志的用户行为分析"

作者:李志义,沈之锐,义梅练
ISBN:9787121250781
定价:¥38.0
字数:193千字
页数:172
出版时间:2015-01
开本:16(170*240)
版次:01-01
装帧:
出版社:电子工业出版社
简介

本书采用了众多流行的数据挖掘算法,如利用K-means算法进行信息聚类和网页自动抽取,利用贝叶斯分类器实现信息过滤与分类,将知识组织与网站优化有机地结合起来,使得主题、目录组织的思想融合贯通在智能网站设计当中。全书共分6章,主要介绍了网络日志的数据来源、类型及其预处理技术;用户信息行为,包括网络用户行为的构成因素、分类,信息行为模型;用户行为数据的提取和分析,用户个性化知识服务需求的影响因素;网站优化算法的设计;智能技术在网站开发中的应用;机器学习的实现原理与训练模型,利用贝叶斯分类算法对垃圾信息进行自动过滤。最后,还对网站导航优化效果进行了调试与展示,并给出了实现的核心代码。 本书涉及数据挖掘、计算机编程、知识组织等多门学科的知识,理论性强。全书内容深入浅出,既有较深的理论分析,也有适当的设计案例,具有理论学习和实用开发双重意义。

前言

前 言 Web技术的发展与演绎,有力地证明了网站信息组织必须与智能技术相结合,并应建立在用户行为的数据挖掘之上,充分利用弥足珍贵的点击数据流,以优化导航,提供个性化服务。本书正是出于此种理念撰写的,在全面研究国内外关于用户信息行为与网站信息组织的基础上,提出了网站信息组织优化的思想;结合用户信息行为分析,探讨了经过网站智能优化之后的网站特点以及它与传统网站的不同。另一方面,对用户信息行为进行了梳理,包括信息寻求行为、需求行为、浏览行为、检索行为、选择和存储行为以及吸收和利用行为等,分析了影响用户信息行为的因素,并通过一个B2C网站用户信息行为示例来分析基于用户认知的信息检索行为模式。这实际上是对网站开发技术的极大改良,比如文中涉及的智能推荐引擎能够根据用户的使用情况向用户有的放矢地推送信息;网页信息自动抽取技术,能够根据用户来访情况,分析用户需求,进而丰富网站内容;智能预测技术,能够预测网站来客,分析出什么样的用户最可能成为网站的注册用户,从而对其进行重点关注。本书将这些较复杂的算法原理,用简单易懂的例子进行介绍,使智能算法的功能和使用可以被迅速地应用于Web实际开发中。 此外,本书还分析了如何对数据进行预处理,如何根据共同协作的方式来构建推荐引擎;介绍了编辑距离的计算,聚类技术在网页信息抽取中的应用,以及决策树算法在网站日志挖掘中的应用。通过各种算法的组合,网站设计者可以根据自身需求设计出属于自己的推荐系统、信息抽取系统、智能预测系统。另外,本书通过分析垃圾信息给交互性网站带来的巨大困扰,探讨了贝叶斯分类算法在社交网站信息过滤中的应用,并给出了具体实现的核心代码,这些代码可以很好地应用于针对中文的垃圾信息识别中。最后,介绍了一个智能网站的开发,展示了基于网络日志优化后的网站效果。实验表明这种智能网站能对用户的各种信息行为进行分析,并将最优的导航效果和最佳的用户体验带给网络访问者。 毋庸置疑,书中的研究成果将对有关学科的发展与推动产生积极的影响。首先,将网络日志与信息组织优化、数据挖掘结合在一起研究,在学术上是一种较新的尝试。其次,目前能指导网站信息组织优化、进行网站设计的理论成果并不多,少有突破性的文献从用户行为的角度来探讨网站信息组织优化。所以,本书的出版将丰富用户信息行为的应用研究,拓展图书馆学、情报学有关用户服务的理论体系;另一方面,在一定程度上也将完善网站设计的理论与方法,进一步深化电子商务的研究内容,推动其学科发展。 本书的研究成果还具有较好的实际价值,其突出表现为可推进人本计算、人本服务的理念,促进用户的网络体验并有效地利用网络数据和资源,解决网站导航可能出现的迷失问题。进而推动网站个性化推荐产品的研发,将传统互联网挖掘技术推广至移动互联网平台上。 全书共7章。第1章是绪论,主要介绍本书写作的背景,相关研究成果述评,研究的技术路径和方法,以及研究的主要内容。第2章对网站信息组织优化与网络日志挖掘进行概述,介绍了二者之间的关联,网络信息组织优化的基本内容,网络日志数据来源、类型及其预处理技术。第3章对信息用户行为进行了分析,包括网络用户行为的构成因素、分类,信息行为模型,用户个性化知识服务需求的影响因素,基于网络日志的用户行为数据的提取和分析。第4章探讨了网站信息组织优化算法的设计与实现。第5章对智能技术在网站开发中的应用进行了实例分析,介绍了机器学习的实现原理与训练模型,以及对垃圾信息进行自动过滤的贝叶斯分类算法。第6章给出了网站导航优化效果的展示,对导航优化前后的调试效果进行了比较,并给出实现的核心代码。第7章给出了本书的结论和不足,并对下一步研究进行了展望。 本书是集体创作的结果。首先感谢我的硕士研究生沈之锐、义梅练、杨雄威同学,他们在本书的资料收集、整理和章节的编写上付出了辛勤的劳动和汗水,本书正是与他们一起创作的结晶,在此谨致谢忱。 还要感谢对本书的编写给予支持与帮助的所有朋友、领导和同事:感谢华师大经管学院彭碧玉院长、王鸣老师给予本书出版的鼎力支持和极大鼓励;感谢电子工业出版社策划编辑薄宇为本书的编辑与出版所付出的努力、支持和帮助;感谢本书中所引用和参考的前沿性研究成果的所有作者,在此特致深深的敬意;还要感谢电子工业出版社编审的辛勤工作和给予本书出版的大力支持。最后,还要感谢我的爱人董志云,是她给予了我无限的动力,并不时督促我努力完成本书的撰写,深深感谢她在背后所付出的辛劳和莫大的支持,我将牢记在心;感谢我所有的家人,他们的支持令我力量倍增,在此我特向他们鞠躬并致谢意。 由于时间仓促,加之作者水平所限,书中难免存在错误和不当之处,恳请读者不吝赐教。作者的邮箱是:leeds@scnu.edu.cn,欢迎读者与我联系,以使本书更臻完善。 李志义 于华南师范大学 2014年7月3日

目录

第1章 绪论 1 1.1 背景介绍 1 1.1.1 目前网站建设存在的主要问题 1 1.1.2 基于网络日志的用户信息行为研究具有重要价值 2 1.1.3 网站设计与用户体验的最佳组合 4 1.2 国内外相关研究综述 5 1.2.1 基于网络日志的网站信息组织研究 5 1.2.2 基于网络日志的用户信息行为研究 7 1.3 本书内容的理论价值和现实意义 11 1.3.1 学术与理论价值 11 1.3.2 现实意义 12 1.4 本书采用的技术路线和方法 13 1.4.1 技术路线 13 1.4.2 主要方法 15 1.5 本书的主要内容 16 1.6 本书的创新点 17 第2章 网站信息组织优化与网络日志挖掘概述 18 2.1 WEB技术的发展与网络日志挖掘相互促进 18 2.2 网站信息组织优化的基本内容 19 2.2.1 网站信息组织优化使网站更加智能化 19 2.2.2 网站信息组织优化的特点 19 2.2.3 网站信息组织优化的原理与机制 22 2.2.4 网络环境下信息组织优化的效率评价 23 2.2.5 网站信息组织优化系统和原型研究 25 2.2.6 网站信息组织优化的发展趋势 25 2.3 网络日志挖掘简介 26 2.3.1 网络日志数据的来源与类型 26 2.3.2 网络用户行为数据的收集方法 29 2.3.3 日志挖掘的预处理技术 35 第3章 网络用户信息行为分析 38 3.1 用户信息行为的定义 38 3.2 网络用户行为 38 3.2.1 网络用户行为的概念 38 3.2.2 网络用户行为的特征 39 3.2.3 构成网络用户行为的主要因素 41 3.3 网络用户信息行为的类型 42 3.3.1 用户的信息寻求行为 43 3.3.2 用户的信息需求行为 44 3.3.3 用户信息浏览行为 45 3.3.4 用户信息检索行为 45 3.3.5 网络用户的选择和存储行为 47 3.3.6 网络用户的信息吸收和利用行为 48 3.4 关于信息行为模型的研究 49 3.5 用户个性化知识服务需求的影响因素 52 3.5.1 个人因素 52 3.5.2 环境因素 53 3.6 基于用户信息行为的B2C网站用户认知 检索模型 54 3.6.1 认知信息检索的发展及模型 55 3.6.2 用户认知信息检索的应用分析 56 3.6.3 B2C电子商务用户认知信息检索的模型 59 3.7 基于网络日志的用户行为数据的提取和 分析——以某学院 网站为例 61 3.7.1 网络日志的获取及其分析方法 61 3.7.2 数据分析 71 第4章 网站信息组织优化算法的设计与实现 87 4.1 智能推荐引擎的设计与实现 87 4.1.1 相似度计算 88 4.1.2 K均值算法在协作型推荐中的设计和应用 90 4.2 网站信息自动抽取技术的实现与应用 93 4.2.1 网页信息自动抽取的意义 93 4.2.2 基于重复模式识别的网页信息自动抽取 94 4.2.3 基于自然标注的网页信息抽取 101 4.3 智能预测技术的应用和实现 107 4.3.1 决策树算法模型设计 107 4.3.2 决策树算法应用于网站注册用户的预测 112 第5章 智能技术在社交网站信息过滤中的应用实例分析 115 5.1 交互性网站面临垃圾信息干扰的背景 115 5.2 贝叶斯分类器思想及其训练模型设计 116 5.2.1 贝叶斯公式 116 5.2.2 贝叶斯分类器的思想 117 5.2.3 相关研究述评 118 5.2.4 基于贝叶斯分类器的训练模型设计 119 5.3 社交网站中对垃圾信息的自动过滤 123 5.4 实验结果分析 131 5.5 结语 132 第6章 网站导航优化及其试运行效果展示 133 6.1 数据准备 135 6.2 网站组织优化试运行效果 136 6.3 结论 150 后记 152 参考文献 155

作者简介

编辑推荐

作者寄语

电子资料

www.luweidong.cn

下一个