教育>高职高专>计算机类
机器学习案例驱动教程

机器学习案例驱动教程"

作者:张霞,赵磊
ISBN:9787121411038
定价:¥49.0
字数:416千字
页数:260
出版时间:2021-06
开本:16开
版次:01-01
装帧:
出版社:电子工业出版社
简介

本书在不涉及大量数学模型与复杂算法实现的前提下,从机器学习概述开始,由“泰坦尼克号数据分析与预处理”“良/恶性乳腺癌肿瘤预测”“波士顿房价预测”“手写体数字聚类”“人脸特征降维”“在线旅行社酒店价格异常检测”6个案例分别引入数据分析、分类、回归、聚类、特征降维和异常检测的应用开发实战技术及其少量理论,能够帮助读者以最快的速度掌握使用Scikit-learn库进行机器学习开发的实战技能。书末是学习机器学习时可能用到的附录。本书适合对机器学习感兴趣的初学者、需要快速入门机器学习的高职相关专业学生,以及期望快速进入机器学习任务的研发工程技术人员。

前言

机器学习是人工智能的一个重要分支与核心研究内容,是目前实现人工智能的一条重要途径。机器学习的研究工作发展很快,其应用已遍及人工智能的各个领域,如数据挖掘、计算机视觉、自然语言处理、智能机器人等,也涌现出了很多机器学习库,帮助开发者搭建一个机器学习模型。本书以Python语言中专门针对机器学习应用而发展起来的Scikit-learn(0.22.2)库为基础,结合机器学习前辈们的经验,用6个真实数据的案例引入数据分析、分类、回归、聚类、特征降维和异常检测6个任务,帮助读者以最快的速度掌握机器学习开发的实战技能。 本书由绪论、6个案例和附录构成。 绪论:机器学习综述。先通过对机器学习的含义、应用场景、类型、术语等内容的介绍,引导读者对机器学习有个总体认识;接着介绍开发环境的搭建,引导读者学习相关软件的下载、安装和配置方法;最后带领读者熟悉Python编程语言基础。 案例1:泰坦尼克号数据分析与预处理。通过对泰坦尼克号数据进行分析和绘图展示,引导读者学习数据预处理、数据分析和数据展示等任务,为后续机器学习任务做好准备,详细介绍案例实现、案例详解和Numpy/Matplotlib/Pandas等Python库的使用。 案例2:良/恶性乳腺癌肿瘤预测。通过以往的乳腺癌患者数据找到肿瘤预测模式,引导读者学习如何依据训练数据实现分类任务的方法,详细介绍案例实现、案例详解和支撑知识,涵盖线性、K近邻、支持向量机、朴素贝叶斯、决策树、集成方法等模型。 案例3:波士顿房价预测。通过波士顿房价数据找到房价预测模式,引导读者学习如何依据训练数据实现回归任务的方法,详细介绍案例实现、案例详解和支撑知识,涵盖线性、K近邻、支持向量机、回归树、集成方法等模型。 案例4:手写体数字聚类。通过手写体数字图像的聚类任务,引导读者学习如何依据数据本身实现聚类任务的方法,详细介绍案例实现、案例详解和支撑知识,涵盖KMeans聚类、均值漂移聚类、层次聚类、密度聚类等模型。 案例5:人脸特征降维。通过人脸图像的特征降维,引导读者学习在实际项目中解决维度灾难问题的方法,详细介绍案例实现、案例详解和支撑知识,涵盖主成分分析、非负矩阵分解等模型。 案例6:在线旅行社酒店价格异常检测。通过对Expedia在线旅行社数据的异常价格检测,引导读者学习在实际项目中解决异常检测任务的方法,详细介绍案例实现、案例详解和支撑知识,涵盖基于聚类、基于孤立森林、基于支持向量机、基于高斯分布的异常检测模型。 附录:内容包括VirtualBox虚拟机软件与Linux的安装和配置、Linux(Ubuntu 14.4)的基本命令与使用、GitHub代码托管平台、Docker技术与应用、人工智能的数学基础与工具、公开数据集介绍与下载、人工智能的网络学习资源、人工智能的技术图谱、人工智能技术应用就业岗位与技能需求、Sklearn常用模块和函数。 万事开头难,而机器学习又是个公认的“高门槛”课程。为紧扣国家经济社会发展需求,也为初学者打消顾虑,本书紧密结合初学者的学习习惯和认知规律,改进了传统的教学组织模式,在不涉及大量数学模型和复杂编程知识的前提下,引入了6个案例配对机器学习的6个任务,每个案例都遵循案例描述及实现→案例详解及示例→支撑技术/支撑知识的组织结构。案例实现给出了具体步骤和代码实现,让读者在学习相关理论之前就能够了解到机器学习的实战开发,调动读者学习的积极性;案例详解构建了开发和理论之间的桥梁,通过对一些开发示例的展示,引导读者进一步认识机器学习库的使用;支撑技术/支撑知识介绍了案例开发用到的基础原理和少量深层次知识点,引导读者后续系统地深入学习机器学习理论。 本书由张霞、赵磊担任主编,张玲担任副主编,南京信息职业技术学院人工智能学院院长聂明教授、董志勇高级工程师、倪靖副教授、杨和稳副教授、夏嵬博士共同参与了图书的校对和文稿的审核,学生邓慕隆和孙钰铭参与了图片整理和代码测试任务。编写过程中得到了教材编委会各位专家、学者的指导,在此表示衷心的感谢。同时,本书引用了一些专著、教材、论文、报告和网络上的成果、素材、结论及图文,吸取了许多机器学习前辈和同人的宝贵经验,在此一并向原创作者们表示衷心感谢! 由于编者水平所限,疏漏和不足之处在所难免,恳请广大读者和社会各界朋友批评指正! 编者联系邮箱:260908536@qq.com。 编 者

目录

绪论 1 0.1 机器学习综述 1 0.1.1 机器学习的含义 1 0.1.2 机器学习的应用场景 1 0.1.3 机器学习类型 3 0.1.4 相关术语 5 0.1.5 人工智能、机器学习与深度学习 6 0.2 开发环境搭建 8 0.2.1 Windows系统环境 8 0.2.2 Ubuntu系统环境 17 0.3 Python编程基础 17 0.3.1 Python简介 17 0.3.2 Python基本语法 18 0.3.3 Python数据类型 19 0.3.4 Python常用语句 28 0.3.5 Python函数(模块)设计 33 0.3.6 Python编程库(包)的导入 38 案例1 泰坦尼克号数据分析与预处理 39 1.1 案例描述及实现 39 1.2 案例详解及示例 43 1.3 支撑技术 45 1.3.1 Numpy 45 1.3.2 Matplotlib 52 1.3.3 Pandas 61 1.3.4 Scikit-learn 64 案例2 良/恶性乳腺癌肿瘤预测 66 2.1 案例描述及实现 66 2.2 案例详解及示例 69 2.2.1 数据预处理 69 2.2.2 linear_model 71 2.2.3 KNeighborsClassifier 74 2.2.4 SVM 76 2.2.5 naive_bayes 80 2.2.6 DecisionTreeClassifier 82 2.2.7 ensemble 85 2.2.8 classification_report 87 2.3 支撑知识 88 2.3.1 分类任务简介 88 2.3.2 线性模型 88 2.3.3 K近邻分类 90 2.3.4 支持向量机 91 2.3.5 朴素贝叶斯 93 2.3.6 决策树 95 2.3.7 集成模型 96 2.3.8 神经网络 97 案例3 波士顿房价预测 98 3.1 案例描述及实现 98 3.2 案例详解及示例 102 3.2.1 数据预处理 102 3.2.2 linear_model 104 3.2.3 KNeighborsRegressor 108 3.2.4 SVR 110 3.2.5 DecisionTreeRegressor 111 3.2.6 ensemble 113 3.3 支撑知识 119 3.3.1 回归任务简介 119 3.3.2 线性回归 120 3.3.3 K近邻回归 121 3.3.4 支持向量机回归 122 3.3.5 决策树回归 122 3.3.6 集成模型回归 124 案例4 手写体数字聚类 125 4.1 案例描述及实现 125 4.1.1 案例简介 125 4.1.2 数据介绍 125 4.1.3 案例实现 126 4.2 案例详解及示例 129 4.2.1 load_digits 129 4.2.2 AgglomerativeClustering 130 4.2.3 KMeans 131 4.2.4 MeanShift 133 4.2.5 DBSCAN 134 4.2.6 AffinityPropagation 136 4.2.7 v_measure_score 137 4.3 支撑知识 140 4.3.1 聚类任务简介 140 4.3.2 层次聚类 140 4.3.3 K均值聚类 141 4.3.4 均值漂移聚类 143 4.3.5 密度聚类 143 4.3.6 近邻传播聚类 144 案例5 人脸特征降维 145 5.1 案例描述 145 5.1.1 案例简介 145 5.1.2 数据介绍 145 5.1.3 案例实现 145 5.2 案例详解及示例 148 5.2.1 fetch_olivetti_faces 148 5.2.2 PCA 149 5.2.3 NMF 155 5.2.4 FastICA 156 5.2.5 FactorAnalysis 157 5.3 支撑知识及示例 158 5.3.1 特征降维简介 158 5.3.2 主成分分析 158 5.3.3 非负矩阵分解 159 5.3.4 独立成分分析 160 5.3.5 因子分析 161 案例6 在线旅行社酒店价格异常检测 162 6.1 案例描述 162 6.1.1 案例简介 162 6.1.2 数据介绍 162 6.1.3 案例实现 163 6.2 案例详解及示例 168 6.2.1 导入数据 168 6.2.2 基于聚类的异常检测 168 6.2.3 基于孤立森林的异常检测 169 6.2.4 基于支持向量机的异常检测 172 6.2.5 基于高斯分布的异常检测 173 6.3 支撑知识 177 6.3.1 异常检测简介 177 6.3.2 基于聚类的异常检测 177 6.3.3 基于孤立森林的异常检测 177 6.3.4 基于支持向量机的异常检测 179 6.3.5 基于高斯分布的异常检测 179 附录A VirtualBox虚拟机软件与Linux的安装和配置 180 附录B Linux(Ubuntu 14.4)的基本命令与使用 203 附录C GitHub代码托管平台 208 附录D Docker技术与应用 212 附录E 人工智能的数学基础与工具 214 附录F 公开数据集介绍与下载 225 附录G 人工智能的网络学习资源 230 附录H 人工智能的技术图谱 233 附录I 人工智能技术应用就业岗位与技能需求 237 附录J Sklearn常用模块和函数 242 参考文献 248

作者简介

编辑推荐

作者寄语

电子资料

http://www.hxedu.com.cn/hxedu/fg/book/bookinfo.html?code=G0411030

www.luweidong.cn

下一个