
本书立足于网络信息资源的采集与应用,对网络信息资源概况、网络信息处理方式及关键
技术进行了系统阐述,对搜索引擎及其使用、网络信息检索工具的使用、联机检索技术及其
应用、网络学术数据库信息采集、非WWW网络信息的采集和网络竞争情报的采集与分析进行了详细
的讨论。本书对培养广大信息用户检索和利用网络信息的能力,提高他们在网络环境下的生存和
发展水平,都具有较高的实用价值。
序
由南京航空航天大学图书馆组编的《网络信息采集与应用》一书,为人们在网络
世界中获取信息,提供了很好的参考工具。
随着社会的进步、科学的发展,信息新技术迭出,新的知识内容、检索手段不断产生,传统
的媒体和检索工具、检索方式也在不断发生变化,人们的信息意识、信息观念在不断更新,
经济营造和科学技术的创新能力在不断增强。随着Internet和网络技术、多媒体技术的发展
,数字化信息资源的涌现,网络环境给我们展现了一个五彩缤纷的信息世界。更大数量级的
信息,更多信息类型和表现形式,以及更复杂的时空关联关系,海量的网上信息资源并发增
长,既为信息的开发与利用提供了便利条件,也为信息的发布与分享提供了外部环境。然而
,信息产生和流动的随机性、信息时空关系和系统状态的不确定性,导致查找和使用上的困
难;数字化、网络化信息的分散、无序和动态变化以及信息的庞杂同用户特定需求之间的
矛盾也给人们采集与利用信息增加了障碍和不便。本书正是针对这些问题,面对Inte
rnet网络、数字图书馆、电子出版及其发展,将网络信息的生成、传播、存储及检索的技术
方法作了较为系统的阐述。为便于在研究生课程教学中的实际操作应用,本书侧重于对网络
信息采集、检索的分析与数据库检索方法的介绍。
《网络信息采集与应用》的编写者们在自己的教学、研究和网络搜索实践中,学习借鉴前
人和同时代同行们的研究成果,对“网络信息检索与应用”这一专题内容进行了总结。本书涉及的主要内容包括:网络信息资源概论,网络信息处理方式及关键技术,搜
索引擎及其使用,网络信息检索工具的使用,联机检索技术及其应用,网络学术数据库信息
采集,非WWW网络信息的采集,网络竞争情报采集与分析等。全书结
构合理,深入浅出,简明清晰,便于在实际操作中参考使用。
参加编写本书的作者都是承担南京航空航天大学本科生课程“信息检索与利用”和研究生课
程“网络信息采集与应用”教学任务的老师。这些同志在从事教学的同时,长期从事信息检
索、科技查新、参考咨询等业务工作,而且都参加了国防系统多项课题的研究工作,并结
合信息管理工作分别发表过数篇具有一定价值的学术文章或著作。可以说,他们在教
学、科研及学术研究领域都是颇有建树的信息教育工作者。
南京航空航天大学于1985年开始相继为本科生和研究生开设了“文献检索与利用”、“
信息检索与利用”等课程。随着网络信息资源的应用需求增加,研究生检索课内容不断更
新和充实。自2001年起,研究生课程由“信息检索与利用”更名为“网络信息采集与应用
”,本书即为该课程教材,本书是一本建立于实践基础上的网络信息检索与应用方面的实用性教材。
建立在思考基础上的著作,产生视角,产生观点;建立在研究基础上的著作,产生知识,产
生理论;建立在操作实践基础上的著作,便于学习,便于推广和应用。本书不仅可用作研究
生的授课教材,也可为上网的众多网民提供必要的帮助和指导。当前,越来越多的人正在从
网上发现或挖掘自己想要找寻的知识和信息。正如美国学者Christine L.Borgman教授在
《从古腾堡到全球信息基础设施——网络世界中信息的获取》(From Gutenberg to the Glo
bal Information Infrastructure)一书中所说,“……网络群体将促进使所有人都受益的
信息社会的发展。通过人际信息交流的改善,人类会有更多的和平、友谊和合作;通过信息
的获取,人们可以获得更多的教育、商业和社会利益;通过技术日益先进的工作环境,人们
的劳动会有更高效率;通过在全球化市场的公平竞争,人们的经济会日益发展。”网络信息
的采集与应用,给人们带来的社会效益和经济效益是无限的。《网络信息采集与应用》一书
的出版是适时的,符合人们上网参考需要,当然是受欢迎的。
网络信息变化很快。要与时俱进,推陈出新,希望每过一定的时段之后,本书能够修订再版
,不断以新的内容奉献给莘莘学子,并让读者大众得以分享。
张厚生
2005年6月于东南大学
随着计算机技术、网络技术和信息存储技术的快速发展及网络信息资源的快速增加,现有的
文献检索教材已不能适应高等学校课堂教学的要求。目前,广大读者收集信息大部分通过网
络进行,怎样利用网络高效地获取有价值的信息是广大读者非常迫切想解决的问题。而我
校在2001年下半年正式决定将“网络信息采集与应用”作为研究生的必修课程,本书正是在
此背景下编写的教材。
本书共9章,主要内容包括网络信息资源概况、网络信息处理方式及关键技术、搜索引擎及
其使用、网络信息检索工具的使用、联机检索技术及其应用、网络学术数据库信息采集、非
WWW网络信息的采集和网络竞争情报的采集与分析。
全书编写分工如下:第1、2、5、6章由袁红卫编写;第7、8章由邹小筑编写;第3章由刘存杰编写;第4章由李曈、周泉编写;第9章由朱永武编写。全书由袁红卫负责统稿,东南大学张厚生教授负责审稿并作序。在编写过程中,自始至终得到了张教授的大力支持和帮助,在此表示衷心感谢。
本书的编写得到了南京航空航天大学图书馆领导的鼓励和大力支持,是他
们的悉心指导,加上同仁们的辛勤劳动,本书才得以完成。
在本书编写过程中,编者参阅了大量教材和文献,有些文献是在网上收集的,只有网址,没有作者的大名,借此机会向这些教材、文献的编者、著者或作者们表示衷心的谢意!
由于网络技术发展很快,网络信息处于爆炸式增长阶段,网络信息采集又是一个较新的研究
领域,许多理论和检索技术正在发展当中,我们在编写过程中尽量地注意内容新颖性,但由
于编者的水平、知识面有限,书中难免有偏颇、错误之处。不足之处,敬请读者在使用
过程中不吝赐教。
编者
2005年5月于南京
第1章 网络信息资源概论 (1)
1.1 因特网概况 (1)
1.1.1 因特网的起源和发展 (1)
1.1.2 因特网在我国的发展 (2)
1.1.3 因特网的基本概念 (5)
1.1.4 因特网提供的服务 (10)
1.2 网络信息资源的概念和特点 (12)
1.2.1 网络信息资源的概念 (12)
1.2.2 网络信息资源的特点 (12)
1.3 网络信息资源的类型 (13)
1.3.1 按信息的加工层次划分 (13)
1.3.2 按人类信息交流的方法划分 (15)
1.3.3 按信息发布机构划分 (15)
1.4 网络信息的常见文件格式 (16)
1.4.1 文本信息 (16)
1.4.2 图像信息 (17)
1.4.3 音频信息 (19)
1.4.4 视频信息 (20)
1.5 网络信息资源检索 (23)
1.5.1 网络信息检索方法 (23)
1.5.2 影响网络信息检索的因素 (25)
1.5.3 提高网络信息检索效果的方法 (26)
1.6 网络信息采集与应用的未来趋势 (27)
1.6.1 网络检索自动化技术的发展 (27)
1.6.2 多媒体技术的应用 (29)
1.6.3 多语种检索 (30)
1.6.4 检索工具的智能化 (31)
思考题 (32)
参考文献 (32)
第2章 网络信息处理方式及关键技术 (33)
2.1 文献标引理论 (33)
2.1.1 文献标引的数学意义 (33)
2.1.2 主题标引理论 (34)
2.2 检索语言 (36)
2.2.1 检索语言的类型 (36)
2.2.2 分类语言 (37)
2.2.3 主题语言 (38)
2.2.4 引文语言 (42)
2.3 检索数学模型 (42)
2.3.1 概述 (42)
2.3.2 布尔检索模型 (43)
2.3.3 向量空间模型 (45)
2.3.4 概率检索模型 (46)
2.4 元数据技术 (47)
2.4.1 元数据的概念 (47)
2.4.2 元数据的结构 (48)
2.4.3 元数据的应用 (48)
2.5 Z39.50协议 (50)
2.5.1 Z39.50协议简介 (50)
2.5.2 Z39.50协议可以实现的功能及工作方式 (50)
2.5.3 Z39.50协议的应用及效果 (51)
2.6 汉语自动分词处理技术 (53)
2.6.1 汉语自动分词概述 (53)
2.6.2 汉语自动分词算法的分类 (54)
2.6.3 典型自动分词系统介绍 (55)
2.7 文本自动处理技术 (57)
2.7.1 概述 (57)
2.7.2 文本自动分类 (58)
2.7.3 文本自动聚类 (59)
2.7.4 自动文摘 (59)
2.8 网络信息挖掘 (60)
2.8.1 网络信息挖掘简介 (60)
2.8.2 网络信息挖掘步骤 (61)
2.8.3 网络信息挖掘类型 (62)
2.8.4 网络信息挖掘的应用前景 (63)
思考题 (64)
参考文献 (64)
第3章 搜索引擎及其使用 (65)
3.1 搜索引擎概述 (65)
3.1.1 搜索引擎的发展历史 (65)
3.1.2 搜索引擎的类别 (66)
3.1.3 搜索引擎的工作原理 (69)
3.1.4 搜索引擎的组成 (71)
3.1.5 搜索引擎的性能指标 (73)
3.1.6 搜索引擎面临的挑战 (73)
3.1.7 搜索引擎的未来发展 (74)
3.1.8 常用搜索引擎简介 (75)
3.2 搜索技术基础 (78)
3.2.1 搜索策略 (78)
3.2.2 搜索技巧 (80)
3.3 搜索引擎Google的使用 (83)
3.3.1 Google简介 (83)
3.3.2 Google的使用方法 (84)
3.3.3 Google搜索结果页指南 (96)
3.4 百度搜索的使用 (97)
3.4.1 百度简介 (97)
3.4.2 百度搜索的使用方法 (98)
3.4.3 百度搜索结果页指南 (104)
3.5 特色搜索引擎 (106)
3.5.1 图像搜索 (106)
3.5.2 FTP搜索引擎 (109)
3.5.3 新闻组搜索 (110)
3.5.4 新闻搜索引擎 (111)
3.5.5 MP3搜索引擎 (112)
3.5.6 Flash搜索引擎 (113)
3.5.7 其他特色搜索引擎 (114)
3.6 专业搜索引擎 (116)
思考题 (122)
参考文献 (122)
第4章 其他网络信息资源及其使用 (123)
4.1 网页浏览工具Browser及使用技巧 (123)
4.1.1 InternetExplorer6.0浏览器 (123)
4.1.2 其他浏览器 (138)
4.1.3 离线浏览器 (145)
4.1.4 Bookmark (146)
4.2 网络资源的利用 (154)
4.2.1 经典网络资源Yahoo!web site Directory (158)
4.2.2 向Yahoo!挑战的Open Directory Project (163)
4.2.3 其他优秀网络简介 (165)
4.2.4 专业的使用 (172)
4.3 虚拟图书馆资源的挖掘 (174)
4.3.1 虚拟图书馆概述 (174)
4.3.2 虚拟图书馆资源及其利用 (178)
思考题 (181)
参考文献 (181)
第5章 联机检索技术及其应用 (183)
5.1 联机检索基本情况 (183)
5.1.1 联机检索概况 (183)
5.1.2 联机检索的特点 (183)
5.1.3 联机检索服务范围 (184)
5.1.4 联机检索系统构成 (185)
5.1.5 主要联机检索系统介绍 (186)
5.2 Dialog联机检索系统使用 (190)
5.2.1 Dialog联机检索系统概况 (190)
5.2.2 Dialog联机检索技术 (194)
5.2.3 DialogW eb检索 (202)
5.2.4 Dialog系统引文检索 (205)
5.2.5 Dialog系统免费账号和培训文档的获取 (207)
5.2.6 Dialog系统常用数据库 (209)
思考题 (214)
参考文献 (214)
第6章 网络学术数据库信息采集(一) (215)
6.1 中国高等教育文献保障系统 (215)
6.1.1 概况 (215)
6.1.2 CALIS的主要服务内容 (215)
6.1.3 CALIS数据库资源介绍 (217)
6.2 万方数据资源系统 (222)
6.2.1 万方数据资源系统概况 (222)
6.2.2 万方数据资源子系统 (223)
6.2.3 万方数据资源系统使用方法 (225)
6.2.4 万方数据资源系统常用数据库介绍 (228)
6.3 中文全文型期刊数据库 (231)
6.3.1 中国期刊网 (231)
6.3.2 中文科技期刊数据库 (236)
6.4 中文图书数据库 (241)
6.4.1 超星数字图书馆 (241)
6.4.2 书生之家---中华图书网 (245)
思考题 (250)
参考文献 (250)
第7章 网络学术数据库信息采集(二) (251)
7.1 综合性数据库 (251)
7.1.1 EIVillage2 (251)
7.1.2 ISI系列数据库 (258)
7.1.3 UMI系列数据库 (265)
7.1.4 CSA系列数据库 (269)
7.1.5 INSPEC (274)
7.2 全文电子期刊 (280)
7.2.1 ElsevierScience DirectOnsite (280)
7.2.2 IEEE/IEE Electronic Library (285)
7.2.3 SpringerLink (290)
7.2.4 KluwerOnline (294)
思考题 (298)
参考文献 (299)
第8章 非WWW网络信息的采集 (300)
8.1 FTP文件 (300)
8.1.1 FTP简介 (300)
8.1.2 FTP服务器中信息资源的组织 (300)
8.1.3 获取FTP信息资源的主要方法 (301)
8.1.4 FTP信息资源获取技巧 (303)
8.1.5 FTP资源推荐 (305)
8.2 Mailing list邮件列表 (306)
8.2.1 Mailing list简介 (306)
8.2.2 Mailing list搜索 (306)
8.2.3 Mailing list的使用 (308)
8.3 Usenet/Newsgroup信息 (309)
8.3.1 Usenet/Newsgroup简介 (309)
8.3.2 Usenet/Newsgroup搜索 (310)
8.3.3 Usenet/Newsgroup访问方法 (311)
8.3.4 Usenet/Newsgroup资源推荐 (313)
8.4 Telnet、BBS信息 (314)
8.4.1 Telnet简介 (314)
8.4.2 Telnet连接的信息源 (314)
8.4.3 Telnet使用 (315)
8.4.4 BBS简介 (316)
8.4.5 BBS的使用 (316)
思考题 (318)
参考文献 (318)
第9章 网络竞争情报采集与分析 (319)
9.1 网络竞争情报源 (319)
9.1.1 搜索引擎 (319)
9.1.2 网络学术数据库 (321)
9.1.3 网站中的资源 (326)
9.1.4 网络交互性资源 (336)
9.2 企业竞争情报系统 (343)
9.2.1 基于Intranet的竞争情报系统 (343)
9.2.2 竞争情报收集子系统 (345)
9.2.3 竞争情报分析子系统 (348)
9.2.4 竞争情报服务子系统 (352)
9.3 电子商务和竞争情报 (354)
9.3.1 电子商务环境中竞争情报活动的特点 (354)
9.3.2 基于电子商务的竞争情报系统 (356)
9.3.3 电子商务中的竞争情报战略 (357)
9.4 竞争情报系统未来的发展 (361)
9.4.1 国外发展趋势 (361)
9.4.2 国内推动因素(364)
思考题 (365)
参考文献 (365)