理工农医>统计学
数据科学概论(第2版)(普通高等学校应用型教材·数据科学)

数据科学概论(第2版)(普通高等学校应用型教材·数据科学)"

作者:覃雄派陈跃国杜小勇
ISBN:978-7-300-29908-2
定价:¥69
字数:669千字
页数:
出版时间:2021-10-29
开本:
版次:2-1
装帧:
出版社:中国人民大学出版社
简介

本书对数据科学的核心问题,即对数据进行分析、挖掘并提取其价值,获得对事物的深刻理解的各种技术手段,进行全面论述,把读者引进数据科学的大门,帮助读者建立数据科学的知识体系。书中使用大量通俗易懂的案例,配合技术原理的讲解,力图体现学科交叉的特点,让不同学科背景的读者,感受到数据科学的魅力,数据分析技术是如此有趣和有价值,能够解决各行各业的实际问题;使学习过程充满趣味,而不是枯燥无味。

前言

目录

                                                   第1章数据科学概述  
1.1数据科学的定义  
1.2数据科学的定位  
1.3数据科学家  
1.4表示模型:对自然和社会现象进行数字化  
1.5数据科学的基本原则  
1.6数据处理流程:时间维度的纵向视角  
1.7数据处理系统的架构:系统维度的计算视角  
1.8数据的多样性:数据类型维度的横向视角  
1.9数据价值的挖掘:价值维度的价值提升视角  

第2章OLTP与数据服务  
2.1面向OLTP应用的关系数据库技术  
2.2面向数据服务的NoSQL数据库技术  
2.3NewSQL数据库技术  

第3章OLAP与结构化数据分析  
3.1联机分析处理与结构化数据分析  
3.2高性能OLAP系统的关键技术  
3.3结构化数据分析工具介绍  

第4章数据清洗与数据集成  
4.1数据抽取、转换和装载  
4.2数据清洗  
4.3数据集成  

第5章数据的深度分析(上)  
5.1机器学习与数据挖掘简介  
5.2决策树  
5.3支持向量机  
5.4KNN算法(分类)  
5.5朴素贝叶斯算法(分类)  
5.6在二值分类器上构建多类别分类器  
5.7聚类算法  
5.8EM算法(软聚类)  
5.9线性回归、Logistic回归  
5.10AdaBoost算法与集成学习  
5.11关联规则分析  
5.12协同过滤推荐算法  
5.13隐马尔可夫模型  

第6章数据的深度分析(下)  
6.1神经网络与深度学习(分类/回归)  
6.2数据预处理  
6.3数据降维  
6.4特征选择  
6.5机器学习算法的评价指标、评价以及参数优化  
6.6方差与偏差  
6.7从复杂模型到简单模型以及正则化  
6.8主流数据深度分析工具  

第7章文本分析  
7.1文本分析的意义  
7.2文本分析的任务和方法  
7.3文本分析可视化  
7.4文本分析软件和工具  

第8章社交网络分析  
8.1简介  
8.2社交网络分析的应用  
8.3社交网络分析方法  
8.4软件  

第9章语义网与知识图谱  
9.1语义网的基本概念  
9.2语义网体系结构  
9.3语义网的关键技术  
9.4知识库与知识图谱  

第10章数据可视化、可视分析与探索式数据分析  
10.1什么是数据可视化  
10.2可视化的强大威力  
10.3可视化的一般过程  
10.4科学可视化与信息可视化  
10.5数据可视化的原则  
10.6可视化实例  
10.7可视化的挑战和趋势
10.8可视分析技术  
10.9探索式数据分析  
10.10探索式数据分析的作用  
10.11探索式数据分析的基本方法  
10.12可视化工具介绍

第11章数据科学案例  
11.1谷歌流感趋势预测  
11.2塔吉特的数据分析预测案例  
11.3互联网舆情监控与管理  
11.4投资与信用  
11.5IBM沃森计算机与医疗  
11.6大数据分析技术助力奥巴马的竞选团队取得成功  
11.7数据科学与科学研究  
11.8多领域预测  
11.9用户画像与精准广告
11.10自动短文评分  
11.11数据产品  
11.12其他数据科学案例                                                

作者简介

覃雄派,中国人民大学信息学院副教授,硕士研究生导师。主要研究方向为高性能数据库、大数据分析和信息检索。在国内外高水平期刊和会议上发表论文40余篇。

陈跃国,教授,博士生导师,数据工程与知识工程教育部重点实验室副主任,中国计算机学会数据库专业委员会秘书长。主要从事大数据交互式可视分析、大数据评测基准、语义搜索、知识图谱等方面的研究工作。在国内外高水平学术期刊和学术会议上发表论文60余篇。

杜小勇,教授,博士生导师,中国人民大学理工处处长,教育部数据工程与知识工程重点实验室主任。主要从事数据库、信息检索等方面的研究工作。在国内外高水平学术期刊和学术会议上发表论文200余篇。

编辑推荐

作者寄语

电子资料

www.luweidong.cn

下一个