教育>本科研究生>计算机类
基于AI的虚拟主播设计  

基于AI的虚拟主播设计  "

作者:何加亮,吴欣蕊
ISBN:9787121446535
定价:¥48.0
字数:246千字
页数:180
出版时间:2022-12
开本:16开
版次:01-01
装帧:
出版社:电子工业出版社
简介

本书主要介绍基于AI的虚拟主播的起源、现状、发展、未来,以及虚拟主播的技术理论与实现路径。全书分4篇,共9章,内容包括虚拟人、虚拟主播、AI与虚拟人、相关技术介绍、3D模型制作、语音合成、多模态融合、虚拟主播的动作实现和虚拟主播的未来展望。其中还涉及Daz Studio、Maya、Premiere Pro等软件的使用方法。本书可作为高等院校智能科学与技术、虚拟现实、数字媒体等专业虚拟人相关课程的教材,也可供对虚拟人和虚拟主播技术感兴趣的人员参考。

前言

21世纪,人类社会迈入信息时代,电视、台式计算机、移动终端等设备成为人们获取信息的主要渠道,但新闻主播播报新闻仍是人们获取新闻信息的主流方式。随着人工智能技术的不断发展,基于人工智能的虚拟主播以其高效的工作模式、无差错的语音播报、无间歇的深度学习等多重优势,为新闻主播分担工作任务,并在信息量爆炸且快节奏的大数据时代,以更短的时间实现更高的工作效率,提高用户观感体验,提升新闻内容的生产效率。 2019年,搜狗公司与新华社联合推出全球首个站立式AI虚拟女主播——新小萌,虚拟主播结合肢体动作,将“坐式播报”变为“站立式播报”,开创了播报新风向。2021年10月,国家广播电视总局发布《广播电视和网络视听“十四五”科技发展规划》,其中提出“加快推进制播系统向全IP技术架构转变。推动面向互联网、云平台的IP 化制播标准体系建设,加快制定全IP化制播标准。”虚拟主播是当前人工智能领域乃至计算机领域最热门的话题之一,近两年,虚拟主播主要应用于广播电视领域,并且在技术的不断发展和趋于成熟的条件下,虚拟主播将在广播电视行业扮演越来越重要的角色。 本书主要介绍虚拟主播的“前世今生”,不仅介绍虚拟主播的背景、现状及未来等前沿信息,而且还介绍了相关虚拟技术与实现路径。本书在带动读者了解科技前沿技术和前景市场,让读者深入其境的同时,为读者提供了可操作、可实践的虚拟主播的具体实现方式,即在理论基础上进行实践。这样既提升了读者阅读的兴趣,又增强了读者的动手实现能力。 本书分4篇共9章。 第1到3章为介绍篇。本篇按照虚拟人、虚拟主播及AI与虚拟人的顺序一步步揭开虚拟主播的面纱,开篇有益,让读者对虚拟主播的概念、职能有一定的了解。 第4章为技术篇。本篇详细介绍虚拟主播所需的关键技术,包括三维重建技术、自然语言处理与语音合成技术及多模态融合技术等。 第5到8章为实践篇。本篇重点讲解如何从技术角度实现一个虚拟主播。其中针对涉及的每个关键技术,都会详细介绍应用软件实现AI虚拟主播的具体步骤,所应用的软件包括Daz Studio、Maya、Premiere Pro。 第9章为展望篇。本篇论述本书所制作的AI虚拟主播的不足与提升方法、AI虚拟主播发展所面临的技术挑战,并对虚拟主播与传统主播的关系:“融合”或“取代”做出讨论。 本书体系清晰,通俗易懂,紧扣科技前沿信息,理论与实践紧密结合,可作为高等院校智能科学与技术、虚拟现实、数字媒体等专业虚拟人相关课程的教材,也可供对虚拟人和虚拟主播技术感兴趣的人员参考。 由于编者水平有限,加之编写时间仓促,书中难免存在不当之处,恳请广大读者批评指正。

目录

介 绍 篇 第1章 虚拟人 2 1.1 关于“虚拟人” 2 1.2 虚拟人的市场 4 1.3 虚拟数字人的应用 8 第2章 虚拟主播 14 2.1 主播是什么样的职业 14 2.1.1 主播及其职能 14 2.1.2 行业中的不同主播 14 2.1.3 传统主播及其主体地位 15 2.2 虚拟主播的优势 17 2.3 虚拟主播“出道” 18 第3章 AI与虚拟人 21 3.1 虚拟人的AI技术 21 3.1.1 三次AI热潮 21 3.1.2 虚拟人的AI技术框架 22 3.1.3 虚拟人的相关AI技术 23 3.2 AI技术在虚拟人领域的应用 25 技 术 篇 第4章 相关技术介绍 28 4.1 三维重建 28 4.1.1 三维重建的定义 28 4.1.2 三维人脸重建技术的发展历程 29 4.1.3 三维人脸重建技术的应用 33 4.2 自然语言处理技术与语音合成技术 36 4.2.1 自然语言处理技术 36 4.2.2 语音合成技术 38 4.2.3 唇形动画驱动技术 40 4.2.4 人脸表情合成技术 43 4.3 多模态融合技术 47 4.3.1 多模态融合的概念 47 4.3.2 多模态融合的方式 47 4.3.3 多模态融合的应用 49 实 践 篇 第5章 3D模型制作 52 5.1 基于单张照片的3D人脸重建 52 5.1.1 初识FaceGen 52 5.1.2 FaceGen的使用 57 5.1.3 3D人脸模型重建的方法 61 5.2 真人版3D人物模型制作 66 5.2.1 初识DAZ Studio 66 5.2.2 DAZ Studio的安装 75 5.2.3 DAZ Studio的使用 82 5.2.4 生成真人版3D人物模型 91 第6章 语音合成 101 6.1 语音合成的实现 101 6.1.1 阿里云智能语音交互平台的使用 101 6.1.2 实现真人版语音输出 105 6.2 实现口型动画 106 6.2.1 初识Maya 106 6.2.2 Maya的使用 110 6.2.3 实现真人版口型动画 117 第7章 多模态融合 125 7.1 多模态融合及实现软件 125 7.1.1 虚拟主播的多模态融合 125 7.1.2 多模态融合的实现软件 126 7.2 Premiere Pro的使用 127 7.3 实现虚拟主播新闻播报 134 第8章 虚拟主播的动作实现 138 8.1 动作捕捉技术 138 8.1.1 动作捕捉技术的定义 138 8.1.2 动作捕捉技术的分类 139 8.1.3 动作捕捉技术的应用 145 8.2 基于动作捕捉设备的动作实现 147 8.2.1 技术路线概述 147 8.2.2 动作捕捉设备与实现方法 147 8.3 基于单目摄像头的动作实现 150 8.3.1 技术路线概述 150 8.3.2 核心技术介绍 150 8.3.3 基于单目摄像头的动作实现方法 152 展 望 篇 第9章 虚拟主播的未来展望 162 9.1 虚拟主播的不足 162 9.2 虚拟主播的未来发展 163 9.2.1 虚拟主播面临的挑战 163 9.2.2 虚拟主播的发展前景 165 参考文献 169

作者简介

编辑推荐

作者寄语

电子资料

www.luweidong.cn

下一个