
本教材围绕大数据营销领域的主要应用场景,分别论述了大数据应用的原理、模型及其操作步骤。主要内容包括,大数据与市场营销、营销大数据分析基础、产品分析与推荐、客户行为分析、营销效果预测、客户生命周期价值预测、客户流失预测、客户细分、A/B测试。具体目录附后。在编排上首先展示学习目的,之后是本章的主要内容,详细讲述原理、模型和实践(含完整练习代码)。最后在实训指导部分讲述大数据分析平台的操作步骤,最后进行本章小结。
为什么要写这本书 大数据时代已然来临。科学技术的进步,特别是以大数据技术为先导的分析技术、云计算、移动互联网、社交网络、物联网和小型传感器等的出现给社会的各个领域带来了深刻的影响,有的甚至是颠覆性的。正如未来学家阿尔文·托夫勒所预言的那样,“以信息化为代表的第三次浪潮带来了两项改变:一是社会更趋多样化;二是社会变化的速度日益加快”。在很大程度上,大数据指的是当今数字生态系统中产生的在数量、种类、速度和复杂性方面不断增长的数据洪流。这股强劲的数据洪流带来了前所未有的挑战与机遇。 大数据的影响,正在迅速渗透到各个行业,颠覆着传统的商业领域。市场营销领域也不例外,大数据带来了一种全新的营销方式,并且发挥着越来越重要的作用。大数据在几乎所有的垂直领域都被普遍接受,尤其是在营销和销售领域。实际上,零售行业是最早开启大数据应用的行业之一。营销分析师基于客户的在线购买、网络点击、社交媒体活动、智能连接设备、地理位置等生成的大数据集,进行分析,在客户挖掘、客户关系维护、营销策划及其优化、产品设计与定价等诸多方面取得了显著的效果。 这股浪潮也正在推动高等教育的改革。在商科院校,特别是应用型大学,商业教育的目的是为学生的就业做准备。商业环境的变化也带来了就业领域的许多变化,这一现象给教育管理者、教师和学生带来了许多关于商科课程内容的思考。当商业环境的变化导致许多传统工作岗位消失同时又创造许多新的工作岗位时,商业教育无疑应该改革传统的课程体系,以适应新的商业环境。那么大数据作为当下新技术中的主旋律,当然要被学习和使用。以大数据等新技术为抓手的“新商科”教育理念已被普遍接受。鉴于此,作者会同广州城市理工学院校内研究团队于2019年编写出版了《大数据营销》教材。旨在为应用型本科院校商科专业的学生(如大数据管理与应用、电子商务和市场营销等专业)了解与学习大数据营销的内涵与应用,提供入门教程,为学生能够进一步掌握大数据营销技能打下基础。该书出版前后已经在校内多个专业和年级进行了四年多时间的实践应用,一经推出便受到了国内多家高校的采纳与认可。随着教学的深入,大数据营销的授课内容亟须辅以大数据分析技术实训教学。 虽然目前有很多关于大数据分析技术、数据科学和机器学习技术的理论和细节的学习资源,但关于如何具体使用这些技术进行市场营销的学习资源不多。实际上,学习数据分析和挖掘理论与将其应用到市场营销领域的真实业务中有很大不同。这本书的主要目的是继《大数据营销》之后,通过将大数据分析技术应用于不同的营销场景,使学生能更好地理解不同的市场营销问题应该选择使用何种类型的技术,掌握具体的实施步骤,以及如果有兴趣进一步研究的话,应该在哪些方向找到相关的辅助资源,进一步提高学生大数据营销的实战能力。 本书特色 本书首先回顾了大数据产生的时代背景和爆发的原因,阐述了大数据的定义及其特征,以及围绕大数据营销的内涵,归纳了大数据在营销领域的发展和主要应用场景。然后,介绍了数据挖掘标准过程模型及在大数据营销中的具体应用,包括业务需求的理解、数据的采集和存储、数据的准备和预处理、数据分析、数据报告的形成、应用和反馈等六个阶段。接下来,针对大数据分析的基础,还具体介绍了数据准备和数据探索的工作内容和具体方法。在此基础上,本书选择了大数据营销应用的六个主要场景,包括消费者行为分析、产品分析预推荐、营销效果分析、顾客终身价值预测、客户细分和A/B测试,从应用场景问题分析到大数据分析技术的选择,从具体实施步骤的详解到实战工具的应用,既包含有R语言整套详细代码,又包含无须编写代码的典型分析平台——蓝鹰BI平台的操作步骤。每个场景的应用都选用真实案例,结合理论知识进行分析,把相关知识点融入相应的操作过程,融合了实战经验和技巧,旨在提高读者大数据营销的应用能力和实施技能。因此本书内容具有以下特色: (1)全面覆盖大数据营销主要应用场景; (2)分析实战融合了理论、技巧与工具; (3)案例真实、素材公开、步骤翔实,方便学生研习; (4)实训工具多样化,包含编程语言与软件平台,满足不同层次学习对象。 为了便于读者对案例的理解和实践,本书提供了所有配套案例的真实原始数据文件、R语言代码程序和运行程序的输出图片(彩色),读者可以从华信教育资源网(http://www.hxedu. com.cn)免费下载。另外,为方便教师授课,本书还提供了PPT课件,以及蓝鹰BI平台为教师系统免费试用6个月的入口。(微信扫描关注“蓝鹰实验室”二维码,点击左下角的“试用申请”,添加助教老师微信,填写表单申请即可,见下图) 本书适用对象 这本书是为那些热衷于在营销中使用大数据分析技术、数据科学和机器学习的人设计的。本书的适用对象包括商科专业中与数据相关的本科学生、营销分析师和市场营销专业人员、大数据挖掘应用研究的科研人员和数据科学家、分析师、机器学习工程师和软件工程师。如果你对建立数据驱动的营销策略感兴趣,想从数据中理解客户行为、预测客户将如何反应,以及预测客户将做出什么反应,那么本书将会为您提供帮助。 (一)开设大数据营销课程的相关专业 目前国内不少高校的主要商科专业,如大数据管理与应用、市场营销、电子商务、工商管理等专业开设了大数据营销或与数据分析有关的课程,但目前这一课程的教学多限于理论介绍。由于单纯的理论教学过于抽象,学生理解和实际应用往往比较困难,教学效果也不甚理想。本书提供的基于营销实战案例和建模实践的应用型教学思路,能够使师生充分理解如何运用理论知识解决实际问题,以获得最佳的教学效果。 (二)营销分析师和市场营销专业人员 大数据时代对营销分析师和市场营销专业人员提出了新的要求,以数据和数据分析为导向的决策技能已成为行业人员的必备技能。即使读者对大数据分析技术、数据科学和机器学习算法背后的理论没有深入的了解,也无须担心。这本书是为专注于数据科学实用性的实践者而写的,读者可以快速地捡起所需的工具,并开始利用它们来进行一个又一个的营销策略分析和营销数据挖掘。因此,本书也适用于这类人员在理解数据挖掘原理及建模,以及解决实际营销问题时做参考。本书也可以作为这类人员的大数据营销技能培训的教材。 (三)大数据挖掘应用研究的科研人员 科研和创新是保持市场竞争力的源泉,越来越多的大学院校、科研院所,甚至企业人员加入以数据为中心的科研活动中。许多组织虽然在信息化系统使用过程中积累了大量的业务数据,但是通常没有对这些数据进行深入分析,对数据所隐藏的价值并没有充分挖掘利用。究其原因是科研人员缺乏可以实操的数据挖掘建模工具及相关方法论。本书可以弥补这一空白,用来深挖科研信息的价值,从而提高科研水平。 (四)数据科学家和分析师、机器学习工程师和软件工程师 数据科学家和分析师、机器学习工程师和软件工程师已经具备了大数据分析技术、数据科学和机器学习算法的理论知识,以及掌握了R语言工具。那么这本书将指导如何将读者已有的数据科学和机器学习的知识和经验应用到现实生活的营销案例中。本书将介绍数据科学如何帮助改进营销策略,以及如何使用预测性机器学习模型来微调营销目标。这本书将指导读者利用数据科学和机器学习来一步一步实现营销目标。 本书组织结构 本书共10章,从所讲内容,可分为基础部分和实战部分。 基础部分(第1章至第4章)介绍了大数据及与大数据营销相关的基本概念和数据挖掘标准过程模型。作为实战训练的基础,基础部分还介绍了数据准备的工作内容和数据探索的常用步骤。 第1章的主要内容是回顾了大数据产生的历史背景和爆发原因,阐述了大数据的定义及特征,以及大数据营销的概念,并总结了大数据在营销领域的发展和主要应用。 第2章首先介绍了数据挖掘标准过程模型及六个基本步骤;然后讨论了在大数据时代成为一个合格的和成功的营销工作者所需的大数据营销能力结构;最后,简要介绍了大数据营销的分析模型和工具。 第3章首先介绍了数据的结构类型和数据准备的工作内容,以及详细说明了数据清洗、数据变换和数据集成的具体方法。 第4章介绍了数据挖掘准备的工作内容和数据探索的常用步骤。 实战部分(第5章至第10章)介绍了市场营销中消费者行为分析、商品分析与推荐、营销效果分析、顾客终身价值预测、客户细分和A/B测试六大场景如何实施大数据分析应用。 第5章重点介绍了如何使用逻辑回归和决策树来挖掘客户参与度即用户黏性背后的驱动因素。本章涵盖了如何在R语言中拟合线性回归模型,以及如何从回归分析中收集见解,研究如何潜在地改进营销策略以获得更高的用户黏性。本章还介绍了一种新的机器学习算法——决策树。可以用它来进行营销分析,以便更好地理解数据,解释结果并提取转换背后的驱动因素,并对客户行为进行分析。 第6章通过探索性的商品分析,了解R语言环境中的各种数据聚合和分析的方法,以进一步深入了解产品的趋势和模式,为商品推荐打下基础。本章介绍了如何提高商品的知名度,并推荐个人客户最有可能购买的商品。本章讨论了如何使用R语言中的协同过滤算法来建立推荐模型,并应用于营销活动。 第7章讨论了如何建立机器学习模型来预测客户参与的可能性。本章介绍了如何使用R语言建立一个基于随机森林算法的预测模型,如何优化随机森林模型,并评估模型的性能,以及如何使用这些模型来实现更好的目标营销。本章讨论了五种不同的方法来评估预测模型的性能——准确性、精度、召回率、ROC曲线和AUC。 第8章介绍了如何获取单个客户的终身价值,并讨论了如何使用R语言构建回归模型,以及如何对它们进行评估。本章内容还涵盖了如何使用计算出的客户终身价值来建立更好的营销策略。 第9章使用数据驱动的方法细分客户,介绍了如何使用R语言从数据中构建不同客户细分的聚类算法,并重点演示了k-means聚类算法。本章讨论了如何更好地了解不同的客户群体,不同群体的客户有什么样的行为,以及他们需要什么和对什么感兴趣,从而可以更好地进行市场定位。 第10章介绍了一种数据驱动的方法来制定更好的营销策略。本章讨论了A/B测试的概念,以及如何使用R语言实现和评估A/B测试。最后讨论了A/B测试在现实生活中的应用。 致谢 在本书编写过程中,得到了广州城市理工学院的大力支持,特别是管理学院在教学实践方面给予了完全的配合,使本书在与读者见面前作为大数据管理与应用专业、电子商务专业和市场营销专业相关课程的教材获得了教学实践的机会,并能有机会根据教学实践的反馈进行修改和完善。在此谨向给予大力支持的广州城市理工学院和管理学院参与教学实践的师生致以深深的谢意。本书能够获得面世还要感谢北京中云国创数据科技有限公司在实践平台方面的大力支持,为本书增添了特色。在本书写作过程中,曾与多位专家、学者进行过有益的讨论,特别是华南理工大学简兆权教授、左文明教授和万江平教授,广东金融学院吴炎太教授等给予的宝贵意见使我们获益匪浅,在此一并感谢。 在本书的编辑和出版过程中还得到了电子工业出版社石会敏主任的大力支持和鼓励,一路的陪伴和无私的帮助使本书得以顺利出版,在此深表感谢。 本书力求思路清晰、内容翔实、代码测试严格,理论上既能与传统营销相呼应,实践上又能直接解决具体问题,为读者提供帮助。但由于时间仓促,书中难免存在一些不足乃至疏漏,希望得到大家的批评指正,以便进一步修改和完善。读者可以通过邮箱bigdata_marketing@163.com将书中的错误及遇到的任何问题反馈给我们。我们将尽量回复邮件,为读者提供最满意的解答,期待能够得到您的真挚反馈。 陈志轩 马 琦 2022年6月于广州城市理工学院
第1章 大数据与市场营销 1 1.1 大数据产生的背景 1 1.1.1 人类社会进步与大数据时代 1 1.1.2 大数据爆发原因 3 1.2 大数据的内涵 6 1.2.1 大数据的定义 6 1.2.2 大数据的特征 8 1.3 大数据营销概论 9 1.3.1 大数据营销的发展 9 1.3.2 大数据营销的应用 14 本章小结 15 第2章 大数据营销分析基础 16 2.1 数据挖掘标准过程模型 16 2.2 大数据营销的基本流程 18 2.3 大数据营销的核心能力 21 2.3.1 大数据挖掘成功的要素 21 2.3.2 成为合格的大数据营销人员 23 2.4 大数据营销的分析模型与工具 25 2.4.1 常用的大数据营销分析模型 25 2.4.2 大数据营销分析工具 26 本章小结 29 第3章 数据准备 31 3.1 数据准备概要 31 3.1.1 数据结构类型 31 3.1.2 数据准备工作内容 32 3.2 数据清洗 33 3.2.1 缺失值处理 33 3.2.2 异常值处理 35 3.3 数据变换 37 3.3.1 数据规范化 37 3.3.2 数据规约 38 3.3.3 数据正态化 40 3.4 数据集成 41 3.4.1 实体识别 41 3.4.2 冗余属性识别 41 3.4.3 删除动作的讨论 42 本章小结 44 第4章 数据探索 45 4.1 探索性数据分析 45 4.1.1 探索性数据分析的概念 45 4.1.2 探索性数据分析的内容和步骤 46 4.2 探索数据特征 47 4.2.1 认识数据集 47 4.2.2 探索分类型变量 50 4.2.3 探索数值型变量 56 4.2.4 探索变量的多元关系 61 4.3 发现派生特征变量 65 4.3.1 基于数据集观察的发现 66 4.3.2 基于领域知识的发现 70 本章小结 80 第5章 消费者行为分析 81 5.1 消费者行为分析概要 81 5.1.1 消费者行为的内涵 81 5.1.2 消费者行为分析的内涵 82 5.2 回归分析 83 5.2.1 线性回归 83 5.2.2 逻辑回归 85 5.3 逻辑回归分析实例 87 5.3.1 数据集 87 5.3.2 数据分析与可视化 88 5.3.3 回归分析 92 5.4 决策树 99 5.4.1 决策树简介 99 5.4.2 决策树的分类算法 100 5.4.3 决策树的使用条件 101 5.5 决策树分析实例 101 5.5.1 数据集 101 5.5.2 数据分析与可视化 103 5.5.3 决策树分析 109 本章小结 113 【实训——会员留存分析】 114 第6章 商品分析与推荐 117 6.1 商品分析概要 117 6.1.1 商品分析的内涵 117 6.1.2 商品分析的目标 118 6.2 商品分析实例 119 6.2.1 数据集概况 119 6.2.2 趋势分析 122 6.3 商品推荐实现 133 6.3.1 商品推荐系统 133 6.3.2 协同过滤算法 134 6.3.3 商品推荐实例 135 本章小结 145 【实训——服装销售数据分析】 146 第7章 营销效果预测 150 7.1 市场营销预测基础 150 7.1.1 市场营销中的预测分析 150 7.1.2 分类模型的评估 151 7.2 随机森林模型 152 7.2.1 随机森林的工作原理 152 7.2.2 随机森林算法的优缺点 155 7.2.3 随机森林算法的应用场景 155 7.3 市场营销预测实例 156 7.3.1 数据集及其特征变量的选择 156 7.3.2 特征变量的编码 158 7.3.3 建立预测模型 160 本章小结 166 【实训——价格优惠和客户态度分析】 166 第8章 客户终身价值预测 169 8.1 客户终身价值基础 169 8.1.1 客户终身价值的内涵 169 8.1.2 客户终身价值的意义 170 8.1.3 客户终身价值的计算与分析 171 8.2 回归模型的评估 172 8.3 客户终身价值预测实例 173 8.3.1 数据集概况与数据清理 173 8.3.2 数据分析 177 8.3.3 价值预测 180 本章小结 187 【实训 1 ——流量分析】 187 【实训 2 ——汽车销售量预测】 189 第9章 客户细分 191 9.1 客户管理基础 191 9.1.1 客户管理的定义 191 9.1.2 客户管理的内容 192 9.1.3 大数据在客户管理中的作用 193 9.2 聚类算法 194 9.2.1 聚类算法应用场景 194 9.2.2 聚类算法原理 195 9.2.3 k-means聚类算法的步骤 197 9.3 客户细分中的聚类算法实例 198 9.3.1 数据集概况及数据清理 198 9.3.2 k - means聚类算法 202 9.3.3 解释客户群体 205 本章小结 207 【实训——会员分群数据分析】 208 第10章 A/B测试 210 10.1 A/B测试基础 210 10.1.1 A/B测试的概念 210 10.1.2 A/B测试的步骤 211 10.1.3 A/B测试的意义 214 10.2 营销的A/B测试与检验 215 10.2.1 营销的A/B测试 215 10.2.2 统计假设检验 215 10.3 A/B测试的评估实例 216 10.3.1 数据集概况 216 10.3.2 数据分析 218 10.3.3 统计假设检验 223 本章小结 227 【实训—— A/B测试数据分析】 227