
数据主导的学习方式有助于读者理解数据科学的本质,读者可以通过分析数据学会多种统计方法的应用。本书以数据形式为导向,对应不同的数据形式介绍可能使用的一些统计方法。这些统计方法可能属于不同的模型和统计方向,但只要适用于同一类数据,本书就尽量都予以介绍,以此启发读者探索及创新。
本书初版以来,在广大读者的支持和鼓励下,10年间不断更新。第4版在第3版的基础上做了增补及修正,并且重新安排了部分章节。本书始终坚持以下特色:
(1)用实际数据做案例,这些数据都是真实的,有理论及应用方面的背景,而且能从网上下载。
(2)书中所有结论都可以通过Python与R软件程序得出,并给出所有例子的代码。
(3)没有太多数学公式,但能让读者直观理解各种方法的含义。
(4)宗旨是训练处理不同数据的动手能力,而不是面面俱到地告知所有细节。
本书适合用作统计学、应用统计学、经济学、数学、应用数学、精算、环境、计量经济学、生物医学等专业本科生、硕士生及博士生的教材,也可作为各领域的实际工作者的参考用书。
第1章 引 言
第一部分 经典统计篇
第2章 经典线性模型
第3章 广义线性模型方法
第4章 纵向数据 (多水平模型、面板数据)
第5章 多元时间序列
第6章 路径建模/结构方程建模
第7章 无监督学习: 经典多元分析
第二部分 机器学习篇
第8章 决策树及组合算法
第9章 神经网络简介
第10章 支持向量机及最近邻方法
第11章 关联规则分析
第12章 贝叶斯网络
第三部分 软件基础篇
第13章 基本软件: R和Python
参考文献
吴喜之 北京大学数学力学系本科毕业,北卡罗来纳大学统计学博士。中国人民大学统计学院教授,博士生导师。曾在南开大学、北京大学、加利福尼亚大学、北卡罗来纳大学等多所著名学府执教。
张 敏 云南财经大学统计学博士,现就职于重庆工商大学。以第一作者公开发表了CSSCI/CSCD/SCI多篇文章,主持或参与国家及省部级课题多项,以第二作者出版关于数据科学的教材多部。