科技>计算机>编程语言
谁说菜鸟不会数据分析(R语言篇)

谁说菜鸟不会数据分析(R语言篇)"

作者:方小敏,齐德胜,张文霖
ISBN:9787121389689
定价:¥69.0
字数:293千字
页数:220
出版时间:2020-05
开本:16开
版次:01-01
装帧:
出版社:电子工业出版社
简介

本书从解决工作实际问题出发,提炼并总结工作中R 语言常用的数据处理、数据分析实战方法与技巧。本书力求通俗易懂地介绍相关知识,在不影响学习和理解的前提下,尽可能地避免使用晦涩难懂的R 语言编程、统计术语或模型公式。如果读者需要了解相关的知识,可查阅相关的图书或资料。本书的定位是带领R 语言数据分析初学者入门,并解决在学习、工作中使用R 语言进行数据分析的大部分问题或需求。如果读者在入门后还需要进一步学习,可自行扩展阅读相关图书或资料,因为学习是永无止境的,正所谓“师傅领进门,修行在个人”。

前言

《谁说菜鸟不会数据分析》系列图书自上市以来,已拥有数十万读者与粉丝,经过口口相传,已成为职场人士案头必备的参考用书。同时,该系列图书非常荣幸地获得了“全行业优秀畅销品种”称号,这离不开广大读者的厚爱与支持。有读者告诉我们,每次阅读都会有新的体会与收获,这让我们很开心。 随着云计算、互联网、电子商务和物联网的飞速发展,世界已经逐步迈入大数据时代。数据分析、机器学习等数据科学技术开始流行起来,R 语言也越来越被大家熟悉和认可,成为数据分析师的“新宠儿”,特别是在互联网行业。 目前,市面上关于R 语言数据分析的图书大多涉及很多晦涩难懂的R 语言编程、统计术语或模型公式。而实际上这些在大多数人的日常工作中基本不会被用到,却会增加阅读难度,大大提高学习门槛,让非专业的朋友学起来较为痛苦。 鉴于此,本书作者于2015 年开始提炼和总结工作中R 语言常用的数据处理、数据分析实战方法与技巧,并录制成视频课程“R 语言数据分析实战”,发布于网易云课堂。课程在上线后,受到了大量学员的支持与肯定。同时,作者还根据大量热心学员的宝贵反馈意见,对课程不断进行升级更新。 通过视频课程“R 语言数据分析实战”的录制、升级,作者沉淀了大量的R 语言数据分析实战教学经验。同时,大量的学员与读者不断来信咨询并希望早日出版《谁说菜鸟不会数据分析(R 语言篇)》。经过两年时间的打磨,这本书终于与读者见面了。整个写作过程是艰辛的,但是令人很有成就感。 本书从解决工作实际问题出发,与其他《谁说菜鸟不会数据分析》系列图书一样,力求通俗易懂地介绍相关知识,在不影响学习和理解的前提下,尽可能地避免使用晦涩难懂的R 语言编程、统计术语或模型公式。如果读者需要了解相关的知识,可查阅相关的图书或资料。 本书的定位是带领R 语言数据分析初学者入门,并解决在学习、工作中使用R 语言进行数据分析的大部分问题或需求。如果读者在入门后还需要进一步学习,可自行扩展阅读相关图书或资料,因为学习是永无止境的,正所谓“师傅领进门,修行在个人”。 本书结构 本书以数据分析的主要流程为主线,介绍如何用R 语言进行数据分析。 第1 章 数据分析概况:主要通过2W1H 模型介绍了数据分析的相关知识,让读者了解与认识数据分析。 第2 章 R 语言概况:主要介绍了什么是R 语言、R 语言的特点、R 语言包、R语言的使用场景、R 软件和RStudio 的下载与安装,以及RStudio 的使用,让读者了解与认识R 语言。 第3 章 编程基础:主要介绍了使用R 语言进行数据分析所需要的编程基础,包括数据类型、赋值和变量、数据结构、向量化运算、for 循环,以及R 语言编程注意事项,让读者对R 语言在数据分析方面的使用有一个基本的了解与认识。 第4 章 数据处理:主要介绍了如何使用R 语言进行常用的数据处理操作,包括数据导入与导出、数据清洗、数据转换、数据抽取、数据合并、数据计算,让读者能够使用R 语言进行常用的数据处理操作。 第5 章 数据分析:主要介绍了如何使用R 语言进行常用的数据分析操作,包括对比分析、基本统计分析、分组分析、结构分析、分布分析、交叉分析、RFM 分析、矩阵分析、相关分析、回归分析等常用分析方法,让读者能够使用R 语言进行常用的数据分析操作。 第6 章 数据可视化:主要介绍了如何使用R 语言进行常用的数据可视化图形绘制,包括散点图、矩阵图、折线图、饼图、柱形图、条形图,让读者能够使用R 语言进行常用的数据可视化图形绘制。 适合人群 ★ 需要提升自身竞争力的职场新人 ★ 从事咨询、研究、分析等工作的专业人士 ★ 在产品、市场、用户、渠道、品牌等工作中需要进行数据分析的人士

目录

目  录 第1 章 数据分析概况 / 1 1.1 数据分析的定义(What) / 2 1.2 数据分析的作用(Why) / 4 1.3 数据分析的步骤(How) / 5 1.3.1 明确分析目的和思路 / 6 1.3.2 数据收集 / 7 1.3.3 数据处理 / 9 1.3.4 数据分析 / 9 1.3.5 数据展现 / 10 1.3.6 报告撰写 / 11 1.4 数据分析的三大误区 / 12 1.5 常用的数据分析工具 / 13 1.5.1 Excel / 13 1.5.2 SPSS / 15 1.5.3 Python / 16 1.5.4 R 语言 / 17 第2 章 R 语言概况 / 18 2.1 R 语言简介 / 19 2.2 R 语言的特点 / 19 2.3 R 语言包 / 20 2.3.1 函数 / 20 2.3.2 包 / 24 2.4 R 语言的使用场景 / 26 2.5 RStudio 简介 / 27 2.6 R 软件和RStudio 的下载与安装 / 27 2.6.1 下载R 软件 / 27 2.6.2 安装R 软件 / 29 2.6.3 下载RStudio / 34 2.6.4 安装RStudio / 35 2.7 RStudio 的使用 / 38 2.7.1 RStudio 界面简介 / 38 2.7.2 项目管理 / 39 2.7.3 新建R 代码文件 / 41 2.7.4 代码提示 / 43 2.7.5 变量浏览 / 43 2.7.6 图形绘制 / 45 2.7.7 帮助文档 / 45 第3 章 编程基础 / 47 3.1 数据类型 / 48 3.1.1 数值型 / 49 3.1.2 字符型 / 50 3.1.3 逻辑型 / 53 3.2 赋值和变量 / 54 3.2.1 赋值和变量 / 54 3.2.2 变量命名规则 / 55 3.3 数据结构 / 56 3.3.1 向量 / 57 3.3.2 因子 / 59 3.3.3 数据框 / 60 3.3.4 列表 / 67 3.3.5 四种数据结构的区别 / 68 3.4 向量化运算 / 68 3.5 for 循环 / 70 3.6 R 语言编程注意事项 / 73 第4 章 数据处理 / 76 4.1 数据导入与导出 / 77 4.1.1 数据导入 / 77 4.1.2 数据导出 / 86 4.2 数据清洗 / 88 4.2.1 数据排序 / 88 4.2.2 重复数据处理 / 89 4.2.3 缺失数据处理 / 93 4.2.4 空格数据处理 / 96 4.3 数据转换 / 98 4.3.1 数值转字符 / 98 4.3.2 字符转数值 / 101 4.3.3 字符转时间 / 101 4.4 数据抽取 / 105 4.4.1 字段拆分 / 105 4.4.2 记录抽取 / 110 4.4.3 随机抽样 / 117 4.5 数据合并 / 120 4.5.1 记录合并 / 120 4.5.2 字段合并 / 123 4.5.3 字段匹配 / 125 4.6 数据计算 / 131 4.6.1 简单计算 / 131 4.6.2 时间计算 / 132 4.6.3 数据标准化 / 134 4.6.4 数据分组 / 138 第5 章 数据分析 / 142 5.1 对比分析 / 143 5.2 基本统计分析 / 147 5.3 分组分析 / 149 5.4 结构分析 / 151 5.5 分布分析 / 152 5.6 交叉分析 / 155 5.7 RFM 分析 / 157 5.8 矩阵分析 / 166 5.9 相关分析 / 169 5.10 回归分析 / 172 5.10.1 回归分析简介 / 172 5.10.2 简单线性回归分析 / 174 5.10.3 多重线性回归分析 / 178 第6 章 数据可视化 / 183 6.1 数据可视化简介 / 184 6.1.1 什么是数据可视化 / 184 6.1.2 数据可视化常用图表 / 184 6.1.3 通过关系选择图表 / 185 6.2 散点图 / 187 6.3 矩阵图 / 195 6.4 折线图 / 199 6.5 饼图 / 204 6.6 柱形图 / 205 6.7 条形图 / 209

作者简介

编辑推荐

作者寄语

电子资料

www.luweidong.cn

下一个