模式识别与计算机视觉手册(第6版)

模式识别与计算机视觉手册(第6版)"

作者:[美]陈季镐(ChiHauChen)著郭涛译
ISBN:9787302618171
定价:¥198
字数:千字
页数:
出版时间:2023.02.01
开本:
版次:1-1
装帧:
出版社:清华大学出版社
简介

本书篇幅有限,即便在现有篇幅的基础上扩充10倍,也很难涵盖模式识别与计算机视觉领域的全面发展情况,这一点毋庸置疑。不同于期刊、特刊,本书涵盖的内容为模式识别与计算机视觉在理论和应用方面的关键成果。本书共有6版,这6版书概括了该领域近三十年的发展,通过它们,读者可以更好地了解这个不断更迭的领域。在信息研究基金会的资助下,本书的第1~4版现已向大众免费开放,网址可扫封底二维码获取。

前言

 前    言 

过去六年,人工智能、大数据和机器学习算法崛起,影响了模式识别与计算机视觉等领域的发展。作为最新版本,本书旨在概述深度学习领域的最新成果及大量的传统方法。

统计模式识别是模式识别发展的重要基础。本书分为两部分,第Ⅰ部分为理论、技术和系统,第Ⅱ部分为应用。第1章“最佳统计分类”,作者是Dougherty教授和Dalton教授,在更广泛的背景下,他们审查了最优贝叶斯分类器,而不是根据样本数据设计的、具有未知特征标签分布的最优分类器,与此类分类器相比,最优贝叶斯分类器的预期误差最小。虽然“最优”一词带有一定程度的主观色彩,但它的确总是受到设计者本人目的及其知识储备的影响。该章还对最优贝叶斯迁移学习这一主题进行了讨论,使用不同来源的数据扩充了训练数据。回顾过去半个世纪的发展,贝叶斯推理理论经久不衰,这实在令人惊奇。第2章“目标识别的深度判别特征学习方法”的作者为Shi 博士和 Gong 博士。该章提出了熵正交损失和最小-最大损失的概念,目的是提高卷积神经网络分类器的类内紧凑性和类间可分离性,从而更好地识别对象。Bouwmans 教授等撰写的第3章为“基于深度学习的背景减法:系统综述”。深度神经网络已被应用于背景减法,从而检测静态摄像机拍摄的移动对象,该章对这项研究的最新进展进行了全面回顾。读者可能有兴趣阅读“前景检测的统计背景建模:综述”(Statistical Background Modeling for Foreground Detection:A Survey)的相关章节,该章同样由 Bouwmans 教授等撰写,可在本书的第4版中进行查阅。Ozer 教授所著的第4章“无需大型数据集即可进行形状建模和骨架提取的相似域网络”介绍了一种新颖的形状建模算法:相似域网络(SDN),其基础网络是径向基网络——一种特殊类型的神经网络,它将径向基函数作为隐藏层中的激活函数。该算法仅使用一个图像样本作为数据,可有效地计算形状建模和骨架提取的相似域。

李政中(C. C. Li)教授刚从匹兹堡大学退休,此前50多年间,他一直致力于模式识别和计算机视觉领域的研究和教学。为了向他致敬,本书将他和林文琪合著的第5版中的章节排版为第5章,题为“基于曲波的纹理特征用于模式分类研究”。该章简要介绍曲线波变换,这仍然是一种较新的稀疏表示方法,用来表示具有丰富边缘结构的图像。对于医学MRI器官组织图像的分析、前列腺癌组织图像的临界Gleason分级的分类,以及其他医学和非医学图像的研究来说,基于曲波的纹理特征大有用处。第6章是王贤居博士撰写的“嵌入式系统高效深度学习概述”。众所周知,深度学习神经网络的高度准确性是以高度的计算复杂性为代价的。在硬件资源有限的嵌入式系统上实施深度学习是一个至关重要的难题。该章回顾了一些能够在性价比较高的硬件中提高能源效率而不降低准确度的方法,还讨论了量化、剪枝和网络结构优化问题。由于模式识别需要处理复杂数据,比如不同来源(如自动驾驶汽车)的数据,或者来自不同特征提取器的数据,因此从这些类型的数据中学习的过程称为多视图学习,每个模态或每个特征集称为一个视图。第 7 章“用于基于差异的多视图学习的随机森林”的作者是Bernard博士等,该章使用随机森林(RF)分类器来测量差异。RF嵌入了一个(不)相似性度量,该度量将类的归属关系纳入考虑,这样同类实例之间具有相似性。该章还提出了一种动态视图选择方法,从而更好地组合特定于视图的不同表示。

第8章“图像着色综述”的作者为Rosin博士等,这一章提出了一个理论层面但又关乎实践的新问题:如何为给定的灰度图像添加颜色。该章回顾了三类着色,包括深度学习着色。第9章与语音识别相关,Li博士和Yu博士介绍了“语音识别深度学习的最新进展”。作者指出,自动语音识别(ASP)领域取得了最新进展,这主要得益于新方法的出现,即使用深度学习算法来构建具有深度声学模型(如前馈深度神经网络、卷积神经网络和循环神经网络)的混合ASR系统。该章还总结了E2E(端到端)建模和鲁棒建模两个领域的进展情况,两个领域的相关研究者都对ASR进行了大量研究。

第Ⅱ部分的开篇,即第10章,题为“遥感技术中的机器学习”,作者是Ronny H?nsch博士,该章对遥感问题和传感器进行了概述。之后重点介绍了两种机器学习方法,一种以随机森林理论为基础,另一种以卷积神经网络为基础,示例则是在合成孔径雷达图像数据的基础上展开讨论。虽然在遥感高光谱图像的信息处理方面,研究人员已经取得了很大进展,但光谱解混问题仍摆出了一道难题。第11章为Kizel 和Benediktsson 所著的“使用高光谱和空间自适应解混对具有损坏像素的数据分数表面的解析重建”。分析光谱混合有助于合理解释光谱图像数据。光谱图像可以为区分不同土地覆盖类型提供信息。然而,由于遥感数据典型的低空间分辨率,图像中的许多像素代表该区域内相互混淆的多个对象。因此,不同应用需要亚像素信息,该信息可由估计分数丰度提取得到,其中分数丰度对应纯签名,也称为端元。解决分解问题通常依靠的仅仅是光谱信息。该章对名为基于高斯的空间自适应解混(GBSAU)的频谱解混方法进行了改进,在此基础上提出了一种新方法。空间自适应解混的问题类似于使用网格数据拟合某个函数。GBSAU 框架的优势之一在于它提供了一种新颖的解决方案,可用于分离由于损坏像素而具有低 SNR 和非连续性的图像。关注遥感的读者也可能有兴趣阅读 Benediktsson 教授在本书第2版中的一个精彩章节——“遥感应用中的统计和神经网络模式识别方法”。Zhang博士所写的第12章“视觉图像中海冰参数识别的图像处理”介绍了新颖的海冰图像处理算法,可自动提取有关冰的有用信息,如冰浓度、冰类型和冰流大小分布,这些信息对于冰项目的各个领域都很重要。值得注意的是,梯度向量流snake算法在基于冰的边界分割中尤其重要。有关该章节的更多详细信息,请参见作者最近的作品Sea Ice Image Processing with Matlab(CRC Press 2018)。

第13章的作者为Evan Fletcher博士和Alexander Knaack博士,题为“深度学习在 MRI 大脑结构的大脑分割和大脑标记中的应用”。作者完美展示了深度学习卷积神经网络(CNN)在大脑结构图像处理的两个领域中的应用:一个应用专注于提高大脑分割的产量和鲁棒性;另一个则旨在改善边缘识别,从而提高计算纵向萎缩率的生物学准确性,增强其统计能力。使用深度学习和大量 MRI 进行训练与测试的过程中产生了复杂的大脑医学图像,在该章中,作者还详细介绍了处理这些图像的实验设置。虽然人们对大脑研究和大脑图像处理的兴趣大幅增加,但读者也可能对 Fletcher 博士最近公布的其他成果感兴趣,该成果在名为《在医学成像前沿,利用先验信息提高脑纵向变化计算的灵敏度》(Using Prior Information to Enhance Sensitivity of Longitudinal Brain Change Computation, in Frontiers of Medical Imaging,World Scientific Publishing,2015)一书的章节中进行介绍。Gangidi和Chen撰写的第14章“基于时间纹理分析的血管内超声图像自动分割”,致力于使用更传统的血管内超声图像分析方法,使用纹理和空间(或多图像)信息来分析与描绘管腔及外部弹性膜边界。在一个序列中使用多个图像,且通过离散波帧变换处理,其分割结果显然优于文献中公布的许多图像效果。因为该研究的可用数据集有限,所以我们采用了这种传统方法。

F. Liwicki 和 M. Liwicki 教授撰写的第15章“使用深度学习进行历史文献分析”概述了历史文献分析领域的现有技术和最新方法,特别是使用深度学习和长短期记忆网络(LSTM)的方法。由于存在不同的人为产物,历史文件并不同于普通文件。该章节还介绍了他们在历史文档中有关检测图元素的想法,以及他们为创建大型数据库所付出的持续努力。实际上,通过图,我们能够以自然且全面的方式对手写签名的局部特征和全局结构同时进行建模。第16章“通过基于图的方法进行签名验证”的作者Maergner博士、Riesen博士等全面概述了两种标准图匹配算法,这两种算法可以轻松集成到端到端签名框架中去。该章中介绍的系统能够结合结构方法和统计模型的互补优势,从而提高签名验证性能。读者可能还有兴趣阅读 Riesen 教授撰写的本书第5版中名为“图编辑距离新逼近算法”的章节。

Huang教授和Hsieh博士撰写的第17章是“用于地震模式识别的细胞神经网络”。离散时间细胞神经网络(DT-CNN)被用作关联存储器,之后将其用来识别地震模式。地震模式为亮点模式、左右尖灭模式,具有气、油砂带结构。与Hopefield关联存储器相比,DT-CNN 恢复能力更佳,对地震图像的解释结果也很好。在使用法医素描时,为了快速、准确地搜索执法人员面部数据库或监控摄像头,需要使用自动匹配算法。在 H. Kazemi 等所著的第18章“在跨模态人脸验证和合成中加入面部属性”中,介绍了两个深度学习框架,用来训练深度耦合卷积神经网络用于面部属性引导的草图-照片匹配与合成。实验结果表明,与最先进的现有技术相比,该章提出的属性引导框架更具优势。

最后,在第19章“深度学习时代的互联和自动驾驶汽车:计算机引导转向的案例研究”中,作者Valiente博士、Ozer博士等对自动驾驶汽车中的机器学习这一挑战性问题进行了总体研究,并提出了一个具体的案例研究。作者认为控制转向角是一个回归问题,其中输入是大量图像,输出是车辆的转向角。利用序列中的多个帧可以帮助我们处理噪声和个别受损图像,例如被阳光损坏的图像。用于自动预测转向角的新深度架构由卷积神经网络、长短期记忆网络和全连接层组成。它将当前和未来的图像(前方车辆通过车对车通信共享图像)处理为输入,之后可用其控制转向角。

本书篇幅有限,即便在现有篇幅的基础上扩充10倍,也很难涵盖模式识别与计算机视觉领域的全面发展情况,这一点毋庸置疑。不同于期刊、特刊,本书涵盖的内容为模式识别与计算机视觉在理论和应用方面的关键成果。本书共有6版,这6版书概括了该领域近三十年的发展,通过它们,读者可以更好地了解这个不断更迭的领域。在信息研究基金会的资助下,本书的第1~4版现已向大众免费开放,网址可扫封底二维码获取。

借此机会,我想感谢多年来为本书各版本的出版做出重要贡献的所有作者,并特别感谢该最新版本的所有章节的作者。

C. H. Chen

2020年2月3日

目录

第I部分  理论、技术和系统

简要介绍 2

参考文献 3

第1章  最佳统计分类 5

1  引言 5

2  最优贝叶斯分类器 6

3  离散模型OBC 9

4  高斯模型OBC 12

5  多类分类 15

6  先验构造 19

7  最优贝叶斯迁移学习 21

8  结论 25

参考文献 25

第2章  目标识别的深度判别

特征学习方法 29

1  引言 29

2  基于熵正交损失的深度判别

特征学习方法 31

3  基于最小-最大损失的深度

判别特征学习方法 36

4  图像分类任务实验 42

5  讨论 44

参考文献 45

第3章  基于深度学习的背景减法:

系统综述 49

1  引言 49

2  背景减法 50

3  实验结果 57

4  结论 59

参考文献 60

第4章  无需大型数据集即可进行

形状建模和骨架提取的相

似域网络 69

1  引言 69

2  相关研究 70

3  相似域 71

4  相似域网络 72

5  使用SDN进行参数化

形状建模 74

6  从SD中提取骨架 75

7  实验 76

8  结论 78

9  致谢 78

参考文献 79

第5章  基于曲波的纹理特征用于

模式分类研究 81

1  引言 81

2  曲波变换方法 82

3  基于曲波的纹理特征 90

4  应用问题的一个示例 90

5  总结与讨论 92

附录 92

参考文献 95

第6章  嵌入式系统高效深度

学习概述 99

1  引言 99

2  深度神经网络概述 100

3  用于DNN处理的硬件 101

4  DNN高效推理的方法 103

5  结论 106

参考文献 106

第7章  用于基于差异的多视图

学习的随机森林 108

1  引言 108

2  随机森林差异 110

3  多视图学习的差异表示 112

4  将视图与加权组合相结合 114

5  实验 121

6  结论 124

7  致谢 124

参考文献 124

第8章  图像着色综述 127

1  引言 127

2  参考图像着色 128

3  涂鸦着色 132

4  深度学习着色 134

5  其他相关研究 137

6  结论 139

参考文献 139

第9章  语音识别深度学习的

最新进展 144

1  引言 144

2  端到端模型 145

3  鲁棒性 151

4  总结及未来研究方向 155

5  致谢 157

参考文献 157

第II部分  应用

简要介绍 170

参考文献 171

第10章  遥感技术中的机器学习 173

1  引言 173

2  PolSAR图像分析的传统

处理链 175

3  整体特征提取和模型训练 175

4  结论 188

参考文献 189

第11章  基于高光谱和空间自适应

解混对具有损坏像素的数

据分数表面的解析重建 193

1  引言 193

2  基于解析2D表面的空间

自适应高光谱解混 196

3  评估和结果 199

4  结论 204

参考文献 205

第12章  视觉图像中海冰参数

识别的图像处理 211

1  引言 211

2  冰像素检测 212

3  浮冰识别 213

4  案例研究及其应用 218

5  讨论和未来研究 224

参考文献 225

第13章  深度学习在MRI大脑

结构的大脑分割和大脑

标记中的应用 228

1  引言 228

2  方法 229

3  结果 236

4  讨论 240

5  结论 242

参考文献 242

第14章  基于时间纹理分析的血管

内超声图像自动分割 246

1  引言 246

2  数据库 248

3  方法及步骤 248

4  实施和结果 254

5  结束语 256

参考文献 256

第15章  使用深度学习进行历史

文献分析 258

1  现有技术 258

2  交叉描绘的图形分类 261

3  使用历史图像合成处理

大型历史文档数据集 266

参考文献 269

第16章  通过基于图的方法进行

签名验证 275

1  引言 275

2  从签名图像到图再到验证 276

3  图编辑距离及其近似值 279

4  实验评估 284

5  结论和近期研究 286

参考文献 287

第17章  用于地震模式识别的细胞

神经网络 292

1  引言 292

2  细胞神经网络 293

3  使用DT-CNN关联记忆的

模式识别 301

4  实验 302

5  结论 307

参考文献 307

第18章  在跨模态人脸验证和

合成中加入面部属性 309

1  引言 309

2  属性引导的人脸验证 311

3  属性引导的草图-照片合成 319

4  讨论 325

参考文献 326

第19章  深度学习时代的互联和

自动驾驶汽车:计算机

引导转向的案例研究 330

1  引言 330

2  相关研究:人工智能在CAV

中的应用 332

3  相关问题 334

4  案例研究:我们提出的

方法 335

5  实验设置 337

6  分析和结果 340

7  结束语 343

8  致谢 344

参考文献 344

 

作者简介

编辑推荐

"本书第1版于1993年出版,受到许多研究者和从业者的欢迎。近三十年来,模式

识别与计算机视觉技术迅速发展。深度学习、元学习、知识图谱和概率图模型等机器

学习算法相继出现,模式识别与计算机视觉成为这些算法最成功的应用场景之一;模

式识别与计算机视觉在智能机器人、边缘计算、无人车导航和无人机控制等方面取得

了巨大的商业价值。译者也在这方面进行了初步探索和研究,主要将模式识别与计算

机视觉用于数字农业、智慧农业和地理人工智能(GeoAI)等行业,取得了初步成果。通

过将模式识别与计算机视觉技术用于果园“空-天-地”一 体化监测技术体系的构建,实

现果园地面环境和果树长势监测、果园病虫害诊断识别、土壤养分和水分监测,以及

果园知识图谱等构建;面向果园领域建立知识库,构建“知识建模-知识服务-知识

决策”的服务体系,实现果园生产管理领域的知识服务和管理决策。"

作者寄语

"陈季镐,1965年获得普渡大学电气博士

学位,1962年获得美国田纳西大学诺克斯维

尔分校电机工程硕士学位,1959年获得台湾

大学电子工程学士学位。目前,陈博士是马萨

诸塞大学达特茅斯分校电气和计算机工程名

誉教授,自1968年以来,他一直任教于该大

学。他的研究领域是统计模式识别和信号/图

像处理应用于遥感、医学成像、地球物理、

水下声学与无损检测问题,视频监控中的计

算机视觉,时间序列分析,以及机器学习。

在其研究领域,陈博士出版(编辑和撰写)了32

本书,其中部分书籍出版于世界科学出版社。

1986—2008年,他担任《国际模式识别和人

工智能杂志》的副主编。自2008年以来,他.

一直是《模式识别杂志》的编委。目前,他担

任世界科学出版社计算机视觉系列图书的编辑

-职。自1988年以来,陈博士一直是电气和

电子工程师协会(IEEE)的会员,2003年成为

该协会的终身会员。自1996年以来,陈博士

一直是国际模式识别协会(IAPR)的会员。."

电子资料

www.luweidong.cn

下一个