机器学习导论

机器学习导论"

作者:王东
ISBN:9787302546054
定价:¥128
字数:千字
页数:
出版时间:2021.02.01
开本:
版次:1-2
装帧:
出版社:清华大学出版社
简介

本书分类《机器学习导论》面向机器学习领域的主要模型和算法,重点阐述不同方法背后的基本假设以及它们之间的相关性,帮助读者建立机器学习的基础理论功底,为从事该领域的相关工作打下基础。具体内容包括机器学习研究的总体思路、发展历史与关键问题,线性模型,神经网络及深度学习,核方法,图模型,无监督学习,非参数模型,演化学习,强化学习,数值优化方法等。

本书可作为高等学校相关课程的教材,也可作为研究生及对机器学习感兴趣的科技、工程技术人员的参考用书。本书封面贴有清华大学出版社防伪标签,无标签者不得销售。

前言

2012年,我回到清华大学语音语言技术中心(CSLT)任教,继续关于语音和语言信息处理领域的研究。在这些研究中,机器学习是基础工具,掌握机器学习方法和学会敲代码一样,属于基本功。因此,不论是在授课还是在研究中,我们一向重视向学生传授机器学习的基础知识。

当前关于机器学习方面的资料非常丰富:Andrew Ng在 Coursera上的机器学习教程、ChristoperBishop的《模式识别与机器学习》和周志华的《机器学习》都是非常好的基础教材;Goodfelow等人编写的《深度学习》是学习深度学习技术的首选资料;麻省理工学院、斯坦福大学等名校的公开课也非常有价值;一些主要会议的 Tutorial、Keynote也都可以在网上搜索到。然而,在教学过程中,我深感这些资料的专业性很强,且入门不易。一方面可能是因为语言障碍,另一方面可能是因为机器学习覆盖面广,研究方向众多,各种新方法层出不穷,初学者往往在各种复杂的名词和算法面前产生了畏难情绪,导致半途而废。 

2016年7月到8月,我在 CSLT组织了一次关于机器学习的内部暑期研讨班,主要目的不是细致讨论各种具体算法,而是将各种看似高深的方法有机地组织起来,告诉学生每种方法的基本思路、基本用法及与其他技术的关联,帮助他们走入机器学习的宏伟殿堂。除了我讲以外,还有冯洋、王彩霞、王卯宁三位教师,分别讲述图模型、核方法和遗传算法。研讨班取得了意想不到的效果,很多学生不仅掌握了基础知识和基本方法,对这些方法与具体应用研究的结合也有了更深刻的理解,为在本领域的深入研究打下了基础。

本书的主体内容是基于该研讨班形成的总结性资料,从 2016年 8月开始整理,历经数次大规模修正,直到2019年1月定稿。全书共分11章,内容如下。

第1章:介绍机器学习研究的总体思路、发展历史与关键问题;

第2章:介绍线性模型,包括线性预测模型、线性分类模型和线性高斯概率模型;

第3章:介绍神经网络的基础知识、基础结构和训练方法;

第4章:介绍深度神经网络的基础方法和最新进展; 第5章:介绍核方法 ,特别是支持向量机模型 ;

第6章:介绍图模型的基本概念和基于图模型的学习与推理方法 ;

第7章:介绍非监督学习方法 ,特别是各种聚类方法和流形学习 ;

第8章:介绍非参数模型 ,重点关注高斯过程和狄利克雷过程 ;

第9章:介绍遗传算法、遗传编程、群体学习等演化学习方法 ;

第10章:介绍强化学习 ,包括基础算法及近年来兴起的深度强化学习方法 ;

第11章:介绍各种数值优化方法。

基于作者的研究背景 ,这本书很难说是机器学习领域的专业著作 ,而是一本学习笔记 ,是从一个机器学习技术使用者角度对机器学习知识的一次总结 ,并加入编著者在本领域研究中的一些经验和体会。与其说是一本专业著作 ,不如说是一本科普读物 ,用简洁的语言和深入浅出的描述为初学者打开机器学习这扇充满魔力的大门。打开大门以后 ,我们会发现这是一个多么让人激动人心的领域 ,每天都有新的知识、新的思路、新的方法产生 ,每天都有令人振奋的成果。我们希望这本书可以让更多学生、工程师和相关领域的研究者对机器学习产生兴趣 ,在这片异彩纷呈的海域上找到属于自己的那颗贝壳。

本书的出版凝聚了很多人的心血。冯洋、王卯宁、王彩霞、邢超、李蓝天、汤志远、张记袁、李傲冬、刘艾婷、白子薇、罗航、石颖、林婧伊、汪洋、张安迪、陈怿翔等老师和同学对本书资料进行了整理 ,并形成了初始版本。张淼同学对全书进行了校对。蔡云麒博士对全部引用和图片做了整理。张雪薇、林婧伊、蔡佳音、景鑫、傅豪、何丹、于嘉威、齐诏娣、吴嘉瑶、张阳、姜修齐、刘逸博、张镭锏等同学参与了文字整理工作。

感谢朱小燕老师为本书做序并提出了很多中肯建议。感谢苏红亮、戴海生、利节、黄伟明等老师对部分章节的审读和建设性意见。感谢语音语言中心的郑方、周强及其他老师 ,中心宽松的治学环境是本书得以完成的前提。

感谢我的家人 ,他们为我承担了学术以外的所有生活压力 ,没有他们的支持 ,就没有本书的出版。

由于编著者在知识和经验上的局限性 ,书中难免会出现各种错误和疏漏 ,敬请各位读者批评、指正。

著者 

2020年6月18日于清华大学

....

目录

第1章机器学习概述…………………………………………………………1

1.1什么是机器学习…………………………………………………………1

1.2机器学习的基本框架……………………………………………………2

1.3机器学习发展简史………………………………………………………5

1.4机器学习的流派…………………………………………………………7

1.4.1符号学派…………………………………………………………8

1.4.2贝叶斯学派………………………………………………………8

1.4.3连接学派………………………………………………………10

1.4.4进化仿生学派…………………………………………………11

1.4.5哪个学派更占主流……………………………………………12

1.5让人惊讶的学习…………………………………………………………13

1.5.1从猴子摘香蕉到星际大战……………………………………13

1.5.2集体学习的机器人……………………………………………14

1.5.3图片理解………………………………………………………16

1.5.4金融市场量化分析……………………………………………18

1.5.5AlphaGo………………………………………………………20

1.6机器学习技术的前沿……………………………………………………21

1.7机器智能会超过人类智能吗……………………………………………22

1.8机器学习基础……………………………………………………………23

1.81训练、验证与测试………………………………………………23

.

1.8.2参数过拟合、交叉验证与正则化………………………………24

1.8.3结构过拟合与模型选择………………………………………24 

@

1.8.4机器学习方法分类……………………………………………27

1.9开始你的机器学习之旅…………………………………………………29

1.9.1如何开始一个机器学习任务…………………………………29

1.9.2如何学习机器学习……………………………………………30

1.10相关资源………………………………………………………………30

第2章线性模型………………………………………………………………33

2.1线性预测模型……………………………………………………………33

2.1.1从多项式拟合说起……………………………………………34

2.1.2线性回归………………………………………………………36

2.1.3Fisher准则与线性分类………………………………………39

2.1.4Logistic回归…………………………………………………42

2.1.5小结……………………………………………………………44

2.2线性概率模型……………………………………………………………45

2.2.1主成分分析……………………………………………………46

2.2.2概率主成分分析………………………………………………47

2.2.3概率线性判别分析……………………………………………50

2.3贝叶斯方法………………………………………………………………52

2.4本章小结…………………………………………………………………54

2.5相关资源…………………………………………………………………55

第3章神经模型………………………………………………………………56

3.1神经网络概述……………………………………………………………57

3.1.1什么是人工神经网络…………………………………………58

3.1.2神经模型与其他方法…………………………………………58

3.2基于映射的神经模型……………………………………………………59

3.2.1从线性模型开始………………………………………………59

3.2.2多层感知器……………………………………………………62

3.2.3径向基函数网络………………………………………………67

3.2.4神经网络模型与先验知识……………………………………69

3.3基于记忆的神经模型……………………………………………………72

3.3.1Kohonen网络…………………………………………………73

3.3.2Hopfield网络…………………………………………………75

3.3.3玻尔兹曼机……………………………………………………78

3.3.4受限玻尔兹曼机………………………………………………81

?? 

3.3.5自编码器………………………………………………………84

3.4基于过程的模型…………………………………………………………87

3.4.1ElmanRNN……………………………………………………88

3.4.2门网络…………………………………………………………89

3.4.3序列对序列网络………………………………………………93

3.4.4基于Attention模型的诗词生成………………………………95

3.5神经图灵机………………………………………………………………97

3.6本章小结…………………………………………………………………99

3.7相关资源………………………………………………………………100

第4章深度学习……………………………………………………………101

4.1从浅层学习到深度学习………………………………………………101

4.1.1网络表达能力…………………………………………………102

4.1.2层次表示与特征学习…………………………………………103

4.1.3显著特征的非监督学习………………………………………104

4.1.4复杂结构与数据驱动…………………………………………109

4.2深度神经网络训练……………………………………………………110

4.2.1基础训练算法…………………………………………………110

4.2.2DNN训练的困难……………………………………………116

4.2.3DNN训练技巧………………………………………………125

4.3神经网络的正则化……………………………………………………134

4.3.1结构化网络与参数共享………………………………………135

4.3.2范式约束与稀疏网络…………………………………………137

4.3.3加噪训练与数据增强…………………………………………140

4.3.4联合训练………………………………………………………140

4.3.5知识迁移………………………………………………………143

4.4生成模型下的深度学习………………………………………………145

4.4.1神经网络的简单概率表达……………………………………145

4.4.2后验拟合与VariationalAE…………………………………147

4.4.3VariationalRNN……………………………………………151

4.5计算图与复杂神经网络………………………………………………153

4.5.1由ChainRule到计算图……………………………………154

4.5.2基于计算图的参数优化………………………………………156

4.5.3计算图的模块化………………………………………………157

4.5.4计算图与深度神经网络………………………………………157

?? 

@

4.6计算平台与方法………………………………………………………160

4.6.1GPU与TPU…………………………………………………160

4.6.2并行计算………………………………………………………161

4.6.3模型压缩………………………………………………………167

4.7深度学习的应用………………………………………………………169

4.7.1语音信号处理…………………………………………………169

4.7.2自然语言处理…………………………………………………173

4.7.3计算机视觉……………………………………………………176

4.8本章小结………………………………………………………………179

4.9相关资源………………………………………………………………180

第5章核方法…………………………………………………………………181

5.1从线性回归到核方法…………………………………………………183

5.2核函数的性质…………………………………………………………184

5.2.1再生核希尔伯特空间与Mercer定理………………………184

5.2.2核函数的基本性质……………………………………………186

5.3常用核函数……………………………………………………………186

5.3.1简单核函数……………………………………………………187

5.3.2概率核…………………………………………………………188

5.3.3复杂对象上的核函数…………………………………………189

5.4KernelPCA……………………………………………………………195

5.5高斯过程………………………………………………………………197

5.6支持向量机……………………………………………………………199

5.6.1线性可分的SVM……………………………………………200

5.6.2线性不可分的SVM…………………………………………202

5.6.3v-SVM………………………………………………………204

5.6.4SVM的若干讨论……………………………………………205

5.7相关向量机……………………………………………………………206

5.8本章小结………………………………………………………………208

5.9相关资源………………………………………………………………209

第6章图模型…………………………………………………………………210

6.1概率图模型简介………………………………………………………211

6.2有向图模型……………………………………………………………212

6.2.1典型模型………………………………………………………212

?? 

6.2.2有向图变量相关性判断………………………………………214

6.3无向图模型……………………………………………………………217

6.3.1无向图变量相关性判断………………………………………218

6.3.2有向图向无向图转化…………………………………………219

6.3.3有向图和无向图对比…………………………………………221

6.4常用概率图模型………………………………………………………221

6.4.1高斯混合模型…………………………………………………221

6.4.2隐马尔可夫模型………………………………………………225

6.4.3线性条件随机场………………………………………………229

6.5EM算法………………………………………………………………232

6.6精确推理算法…………………………………………………………235

6.6.1加和—乘积算法………………………………………………235

6.6.2树状图的加和—乘积算法……………………………………237

6.6.3联合树算法……………………………………………………238

6.7近似推理算法…………………………………………………………240

6.7.1采样法…………………………………………………………241

6.7.2变分法…………………………………………………………246

6.7.3采样法和变分法比较…………………………………………250

6.8本章小结………………………………………………………………250

6.9相关资源………………………………………………………………251

第7章无监督学习…………………………………………………………252

7.1无监督学习任务………………………………………………………253

7.1.1聚类概述………………………………………………………253

7.1.2流形学习概述…………………………………………………254

7.1.3因子学习………………………………………………………255

7.2聚类方法………………………………………………………………256

7.2.1基于划分的聚类方法…………………………………………256

7.2.2基于连接的聚类方法…………………………………………258

7.2.3基于密度的聚类方法…………………………………………262

7.2.4基于模型的聚类方法…………………………………………263

7.3流形学习………………………………………………………………264

7.3.1主成分分析……………………………………………………266

7.3.2多维标度………………………………………………………268

7.3.3ISOMAP……………………………………………………269

?? 

@

7.3.4自组织映射……………………………………………………271

7.3.5局部线性嵌入…………………………………………………273

7.3.6谱嵌入…………………………………………………………276

7.3.7t-SNE…………………………………………………………276

7.3.8流形学习方法比较……………………………………………279

7.4图模型与无监督学习…………………………………………………279

7.4.1图模型下的聚类任务…………………………………………279

7.4.2图模型下的流形学习…………………………………………280

7.4.3图模型下的因子学习…………………………………………281

7.5神经模型与无监督学习………………………………………………282

7.5.1特征学习任务中的因子学习…………………………………282

7.52生成任务中的因子学习………………………………………283

.

7.5.3分类/回归任务中的因子学习………………………………283

7.6本章小结………………………………………………………………285

7.7相关资源………………………………………………………………286

第8章非参数模型…………………………………………………………287

8.1简单非参数模型………………………………………………………288

8.2回顾高斯过程…………………………………………………………290

8.2.1高斯过程定义…………………………………………………290

8.2.2高斯过程回归…………………………………………………292

8.2.3高斯过程用于分类任务………………………………………296

8.3狄利克雷过程…………………………………………………………296

8.3.1回顾高斯混合模型……………………………………………297

8.3.2中国餐馆问题…………………………………………………298

8.3.3狄利克雷分布及性质…………………………………………300

8.3.4狄利克雷过程的定义…………………………………………302

8.3.5狄利克雷过程的表示…………………………………………303

8.3.6狄利克雷过程的构造…………………………………………307

8.3.7推理方法………………………………………………………309

8.3.8HierarchicalDP(HDP)………………………………………311

8.4本章小结………………………………………………………………312

8.5相关资源………………………………………………………………313

第9章演化学习……………………………………………………………315

9.1基于采样的优化方法…………………………………………………316

?? 

9.1.1演化学习………………………………………………………316

9.1.2群体学习与随机优化…………………………………………317

9.2遗传算法………………………………………………………………318

9.2.1算法框架………………………………………………………319

9.2.2算法细节………………………………………………………320

9.2.3进化理论………………………………………………………324

9.3遗传编程………………………………………………………………328

9.3.1算法基础………………………………………………………328

9.3.2GP高级话题…………………………………………………333

9.3.3其他演化学习方法……………………………………………335

9.4群体学习方法…………………………………………………………336

9.4.1蚁群优化算法…………………………………………………337

9.4.2人工蜂群算法…………………………………………………338

9.4.3粒子群算法……………………………………………………340

9.4.4捕猎者搜索……………………………………………………341

9.4.5萤火虫算法……………………………………………………342

9.5随机优化方法…………………………………………………………342

9.5.1模拟退火算法…………………………………………………342

9.5.2杜鹃搜索………………………………………………………343

9.5.3和声搜索………………………………………………………344

9.5.4禁忌搜索………………………………………………………344

9.6本章小节………………………………………………………………345

9.7相关资源………………………………………………………………347

第10章强化学习……………………………………………………………348

10.1强化学习概述…………………………………………………………349

10.1.1什么是强化学习……………………………………………349

10.1.2与其他学习方法的区别……………………………………350

10.1.3强化学习的应用……………………………………………352

10.2强化学习的基本要素…………………………………………………353

10.2.1强化学习三元素……………………………………………353

10.2.2长期收益……………………………………………………353

10.2.3值函数与策略优化…………………………………………354

10.2.4通用策略迭代………………………………………………355

10.2.5强化学习算法分类…………………………………………356

ü

?? 

@

10.3值函数学习:基于模型的规划算法…………………………………358

10.3.1马尔可夫决策过程…………………………………………358

10.3.2MDP中的值函数……………………………………………360

10.3.3策略估值:动态规划算法……………………………………361

10.3.4策略优化:策略迭代和值迭代………………………………362

10.4值函数学习:基于采样的蒙特卡罗方法……………………………365

10.4.1学习任务与采样方法………………………………………365

10.4.2蒙特卡罗策略估值…………………………………………365

10.4.3蒙特卡罗策略优化…………………………………………367

10.5值函数学习:基于采样的时序差分方法……………………………370

10.5.1基于TD的策略估值………………………………………370

10.5.2基于TD的策略优化………………………………………372

10.5.3N-stepTD与TD(λ)………………………………………374

10.5.4三种值函数学习方法总结…………………………………375

10.6模型学习………………………………………………………………377

10.6.1值函数学习与模型学习……………………………………377

10.6.2模型学习方法………………………………………………378

10.6.3Dyna:混合学习方法………………………………………379

10.7函数近似与策略学习…………………………………………………380

10.7.1值函数近似…………………………………………………381

10.7.2基于梯度的参数优化………………………………………383

10.7.3基于函数近似的策略学习…………………………………383

10.7.4Actor-Critic方法……………………………………………385

10.8深度强化学习方法……………………………………………………386

10.8.1Atari游戏……………………………………………………387

10.8.2AlphaGo……………………………………………………388

10.9本章小结………………………………………………………………391

10.10相关资源……………………………………………………………391

第11章优化方法……………………………………………………………393

11.1函数优化………………………………………………………………394

11.1.1优化问题定义………………………………………………394

11.1.2优化问题分类………………………………………………395

11.1.3基础定理……………………………………………………395

11.2无约束优化问题………………………………………………………396

y

?? 

11.2.1线性搜索……………………………………………………396

11.2.2置信域优化…………………………………………………401

11.3带约束优化问题………………………………………………………404

11.3.1拉格朗日乘子法……………………………………………405

11.3.2对偶问题……………………………………………………407

11.3.3线性规划……………………………………………………409

11.3.4二阶规划……………………………………………………415

11.3.5一般非线性优化……………………………………………420

11.4本章小结………………………………………………………………425

11.5相关资源………………………………………………………………426

参考文献…………………………………………………………………………427

t

??

作者简介

编辑推荐

《机器学习导论》从实战出发,内容全面,从基本概念入手,介绍了各种机器学习的基本类型。现代机器学习部分,不仅仅是最受关注的深度神经网络学习,同时还介绍了近十年取得令人关注进展的其他机器学习分支。着重于现代方法,但是也没有忘记详尽地介绍经典方法,刻画了机器学习学科发展历史上的各个里程碑式的重要成果,基本覆盖了机器学习技术各个时期的主要方向;第二,该书内容比较浅显,对大多数方法的介绍做到点到为止。有利于入门学生摆脱具体算法的纠缠,快速通读下去,避免信息破碎;第三,本书对各种方法的关联性做了重点阐述,有利于形成知识脉络。第四,作者对每种技术都给出了大量参考文献,便于读者根据个体需求深入学习。上述这些特点对从事应用研究的初学者非常重要,基于这些信息,便于形成对机器学习技术总体思路的把握,从而可以在需要的时候能理清头绪,从众多机器学习方法中找到合适的工具。

作者寄语

王东, 1995-2002年清华本科、硕士,2010年英国爱丁堡大学博士,历任Oracle 中国软件工程师,IBM中国高级软件工程师,英国爱丁堡大学Marie Curie 研究员,法国EURECOM博士后研究员,美国Nuance公司高级研究科学家。现任清华大学语音语言中心副研究员,中心常务副主任,FreeNeb公司首席科学家。王东博士是全国人机语音通讯会议常设机构秘书长,是亚太信号信息处理联盟(APASIPA)语音专委会副主席、杰出讲师,是国际标准与语音数据资源委员会(COCOSDA)大陆区代表。王东博士自1997年开始从事语音识别、自然语言处理方面的研究,在相关领域发表学术论文120余篇,公开专利20余项,其专利技术在日本软银、新松、智能管家等多家国内外著名公司应用,创造了良了的社会效益和经济效益。

电子资料

www.luweidong.cn

下一个