
本书以电信运营商数据为基础,依照“用户行为分析—用户行为预测—用户行为干预”的思路,针对社会计算领域的手机用户行为大数据进行深入剖析,开展面向社会治理、商业智能、个体决策各领域(包括城市交通规划、旅游行业发展、公共管理等)的理论分析及应用技术研究。 本书适合高等院校和科研单位从事社会计算、大数据研究的硕士研究生、博士研究生和相关领域学者阅读参考,也有助于电信运营商、手机厂商、政府管理部门在社会计算领域开展大数据管理应用实践。
前 言 随着移动通信技术的飞速发展,手机满足了人们多样化的生活需求,成为全球用户日常必备的随身工具。手机中日益丰富的传感器,如蓝牙、位置传感器、动作传感器、触屏、摄像头、麦克风、系统日志等,都在不断记录着用户的日常行为,并在数字空间里留下多种多样的数字行为痕迹。手机行为数据具有时空颗粒度细、用户规模巨大、行为类型丰富的特点,既可以支持微观个体层面的行为分析,也可以支持中观层面的企业组织运营优化及宏观层面的社会治理。对海量的手机行为数据的挖掘与分析,可以应用于卫生健康水平提升(传染病防范、居民运动水平提升)、公共安全(突发事件预警、犯罪追踪)、城市治理(交通规划、经济发展评价)等社会问题,也可以应用于互联网平台治理(精准推荐、平台用户交互控制)、商业决策支持(商铺选址、线下广告投放、放贷自动决策)、资源优化(物流车辆调度)等商业问题,具有巨大的社会经济价值。 面对复杂多样的经济社会发展实际需求,大数据用户行为研究面临着研究范式待转变、技术工具待升级、智能算法待开发等诸多挑战。本书以社会计算领域中的典型应用场景为导向,阐述手机用户行为数据支撑的核心理论、关键方法、智能模型和决策应用,为多个管理决策问题提供参考思路和范例。 本书依照“用户行为分析—用户行为预测—用户行为干预”的编写思路,对面向社会计算各领域的用户行为大数据价值挖掘进行深入剖析,主要分为四部分:(1)导论,介绍研究背景,包括手机用户行为大数据的现有研究、社会计算研究及智能决策研究综述;(2)用户行为分析,主要包括“基于运营商数据的路网匹配算法”“利用移动跟踪数据从旅游团组规模的角度理解游客移动模式:以中国西安为例”“大型活动期间的旅游景区游客增幅研究:目的地属性的影响”“基于标记时间点过程的手机应用程序预测算法”;(3)用户行为预测,主要包括“使用‘大五’人格特质预测日常移动行为:基于手机数据的实证研究”“基于元级手机使用数据的个人信用评估研究”“一个应用程序使用行为预测的深度强化学习框架”;(4)用户行为干预,主要包括“基于多源数据融合的商铺类型推荐系统研究”“基于App有效性预测的移动健康类App推荐方法研究”“利用蜂窝数据基于偏好补全的协同过滤方法进行位置推荐”“基于强化学习的城市地铁网络扩建研究”。 这些内容部分已经通过产学研转化,为相关合作企事业单位带来了显著的业务水平提升。作者将这些研究成果整理成学术论著,适合高等院校和科研单位从事社会计算、大数据管理等研究的相关学者阅读探讨,也适合电信运营商、手机厂商、政府管理部门相关管理与技术专家参考应用。希望本书可以在理论上助推大数据驱动管理的范式转变,在应用上为我国社会治理、商业决策提供一种新颖的理论技术工具。 本书作者来自大数据算法与分析技术国家工程实验室下设的社会大数据分析技术与应用研究中心。从材料收集、内容设计、研究成果整理及文字校正等方面,离不开以下团队成员的付出:冯耕中、赵玺、邹建华、刘园园、夏琦晖、马琳、毛晓欣、魏宇、卢晓妮、沈之浩、艾佩林、杨康、杨晓恬、安靖钊、郑龙飞、吴志超。限于水平,不足之处在所难免,敬请读者和同行批评指正。作者的电子邮件地址是zhaoxi1@mail.xjtu.edu.cn。 本书出版受到国家自然科学基金项目(项目编号:72231007)、国家自然科学基金委“大数据驱动的管理与决策研究”重大研究计划、教育部中国移动科研基金项目、陕西省重点研发计划、华为重点攻关课题等多个项目的支持。
第1篇 导 论 第1章 研究背景 2 第2章 社会计算概述 5 2.1 社会计算介绍 5 2.2 社会计算研究概述 6 2.2.1 人道主义救援 6 2.2.2 公共卫生管理 8 2.2.3 气象灾害应急 9 2.2.4 经济发展监控 9 2.2.5 农业食品安全 10 2.2.6 交通城市规划 11 2.2.7 能源 11 2.2.8 国家调研统计 11 第3章 智能决策 16 第2篇 用户行为分析 第4章 基于电信运营商数据的路网匹配 算法 20 4.1 本章简介 20 4.2 背景介绍 20 4.3 问题定义 22 4.3.1 路网匹配问题定义 22 4.3.2 现有的路网匹配方法的 局限性 23 4.4 方法设计 24 4.4.1 方法概览 24 4.4.2 位置表征模型 25 4.4.3 路网匹配模型 26 4.4.4 强化学习优化模型 27 4.5 系统实现 29 4.5.1 离线训练过程 29 4.5.2 在线匹配过程 30 4.6 实验结果 31 4.6.1 实验设置 31 4.6.2 路网匹配准确率验证 31 4.6.3 路网匹配的匹配时间验证 32 4.6.4 注意力模型的有效性验证 32 4.6.5 系统的鲁棒性验证 33 4.6.6 位置表征模型的有效性验证 35 4.6.7 强化学习优化模型的有效性 验证 36 4.7 相关文献讨论 37 4.8 总结 38 第5章 利用移动跟踪数据从旅游团组 规模的角度理解游客移动模式: 以中国西安为例 43 5.1 本章简介 43 5.2 背景介绍 43 5.2.1 游客行为 43 5.2.2 团组规模 44 5.3 案例介绍 45 5.3.1 研究区域和数据 45 5.3.2 细粒度旅游团组划分方法 47 5.4 案例分析结果 51 5.4.1 人口统计学模式 51 5.4.2 空间模式 52 5.4.3 时间模式 54 5.5 总结 55 5.5.1 结果洞察 55 5.5.2 实际意义 56 5.5.3 结论 58 第6章 大型活动期间的旅游景区游客 增幅研究:目的地属性的影响 62 6.1 本章简介 62 6.2 背景介绍 62 6.2.1 研究背景 62 6.2.2 相关研究 63 6.3 案例介绍 66 6.3.1 案例区域和数据 66 6.3.2 变量测量 66 6.3.3 数据分析 68 6.4 案例分析结果 69 6.4.1 描述性分析 69 6.4.2 相关性分析 69 6.4.3 探索性因子分析 70 6.4.4 回归分析—目的地属性对 游客增幅的影响 71 6.5 总结 72 6.5.1 理论意义 72 6.5.2 实际意义 73 6.5.3 结论 74 第7章 基于标记时间点过程的手机应用 程序使用预测算法 78 7.1 本章简介 78 7.2 背景介绍 79 7.3 方法设计 80 7.4 应用程序时间点过程算法 81 7.4.1 应用程序表征模块 82 7.4.2 应用程序使用预测器模块 82 7.4.3 环境感知优化模块 84 7.5 实验结果 85 7.5.1 数据驱动实验 86 7.5.2 现场实验 88 7.5.3 系统开销 89 7.6 相关文献讨论 91 7.7 总结 92 附录A MTPP模型的参数学习 93 附录B 模型实现 94 附录C 模型训练 94 第3篇 用户行为预测 第8章 使用“大五”人格特质预测日常 移动行为:基于手机数据的实证 研究 96 8.1 本章简介 96 8.2 研究背景 96 8.2.1 日常移动行为 96 8.2.2 人格特质与日常移动行为 97 8.2.3 研究概述 98 8.3 假设建立 98 8.3.1 神经质与日常移动行为 98 8.3.2 尽责性和日常移动行为 99 8.3.3 宜人性和日常移动行为 99 8.3.4 开放性与日常移动行为 99 8.3.5 外向性和日常移动行为 99 8.4 实验设计 100 8.4.1 数据收集 100 8.4.2 变量测量 100 8.5 分析结果 101 8.6 总结 104 8.6.1 研究总结 104 8.6.2 贡献 105 8.6.3 局限性和未来研究方向 105 第9章 基于元级手机使用数据的个人 信用评估研究 110 9.1 本章简介 110 9.2 背景介绍 110 9.3 实证研究 112 9.3.1 假设提出 112 9.3.2 样本和数据 114 9.3.3 变量 114 9.3.4 探索性分析 116 9.4 个人信用评估模型构建 119 9.4.1 变量选择 120 9.4.2 个人信用评估模型 121 9.5 结果分析 123 9.5.1 评价 123 9.5.2 变量表现 123 9.5.3 不同方法的比较 125 9.5.4 与现有模型的对比 126 9.6 总结 127 第10章 一个应用程序使用行为预测的 深度强化学习框架 132 10.1 本章简介 132 10.2 背景介绍 133 10.3 相关文献 135 10.3.1 App使用行为预测研究 现状 135 10.3.2 深度强化学习研究现状 136 10.4 方法设计 137 10.4.1 研究必要性 137 10.4.2 DeepApp框架设计 138 10.4.3 App使用行为预测的上下文 感知状态 140 10.4.4 App使用行为预测的Actor- Critic智能体 140 10.4.5 DeepApp工作流程 142 10.5 DeepApp框架的实现 143 10.5.1 DeepApp框架后端 143 10.5.2 DeepApp框架前端 143 10.5.3 前后端预测实现 144 10.6 基于数据驱动的实验与结果 144 10.6.1 实验设置 144 10.6.2 不同方法的准确率比较 145 10.6.3 通用智能体的有效性 验证 145 10.6.4 DeepApp解决用户偏好 时变性问题 146 10.6.5 参数设置实验 146 10.6.6 不同用户行为下DeepApp的 性能 147 10.7 实地实验与结果 148 10.7.1 用户调查问卷 149 10.7.2 实地实验算法性能 150 10.7.3 预测延迟问题 150 10.7.4 系统的额外开销 150 10.8 总结 151 第4篇 用户行为干预 第11章 基于多源数据融合的商铺类型 推荐系统研究 158 11.1 本章简介 158 11.2 背景介绍 159 11.3 方法设计 160 11.3.1 系统概述 160 11.3.2 商铺类型推荐模型构建 161 11.4 结果分析 165 11.4.1 数据收集及预处理 165 11.4.2 实验执行 166 11.4.3 评估度量 166 11.4.4 实验结果 167 11.5 总结 172 第12章 基于App有效性预测的移动 健康类App推荐方法研究 176 12.1 本章简介 176 12.2 背景介绍 177 12.3 方法设计 178 12.3.1 问题定义 178 12.3.2 用户-BCT矩阵构建 179 12.3.3 用户画像构建 181 12.3.4 合适的BCT预测 182 12.3.5 移动健康类App推荐 182 12.4 实验结果 183 12.4.1 实验数据 183 12.4.2 评估指标 185 12.4.3 实验结果及分析 186 12.5 总结 190 第13章 利用蜂窝数据基于偏好补全的 协同过滤方法进行位置推荐 195 13.1 本章简介 195 13.2 背景介绍 195 13.3 方法设计 197 13.3.1 问题定义及偏好补充分析 197 13.3.2 基于偏好补全的位置推荐 方法 200 13.4 实验结果 204 13.4.1 数据 204 13.4.2 评价指标 205 13.4.3 基准方法 206 13.4.4 实验结果 206 13.5 总结 212 第14章 基于强化学习的城市地铁网络 扩建研究 215 14.1 本章简介 215 14.2 背景介绍 216 14.3 方法设计 217 14.3.1 准备性工作 217 14.3.2 地铁扩建方法 219 14.4 实验结果 224 14.4.1 数据及其预处理 225 14.4.2 基准方法和性能评估 225 14.4.3 与实际规划地铁线路的 比较 229 14.4.4 多条地铁线路扩建 231 14.5 总结 232