
自2023年以来,AI聊天机器人ChatGPT火爆互联网,其颠覆性的使用体验重塑了人们对于AI的认知。而ChatGPT背后的技术—AIGC也引起了互联网圈的关注,打开了人们对AI应用的想象空间。本书从ChatGPT入手,以AIGC为中心,对AIGC的理论知识、应用场景、未来发展等内容进行了全面的梳理。 首先,本书对AIGC的概念、技术构成、产业生态、市场现状等进行了讲解,以便读者对AIGC形成一个清晰、完整的认知。其次,本书讲解了AIGC在传媒、电商、影视、娱乐、教育、工业等领域的应用,展现了AIGC的应用价值和对各领域的赋能。最后,本书解析了AIGC领域的创投机会和未来图景,便于读者把握AIGC的发展趋势。 本书在系统地讲述AIGC理论及应用的同时,引入了大量实践案例,介绍了诸多国内外知名企业在AIGC领域的布局,也介绍了一些AI文字生成、AI图片生成、AI视频生成、AI音频生成等方面的AIGC应用,内容十分丰富。
2022年11月,美国OpenAI公司发布了其研发的聊天机器人程序ChatGPT。以AI为驱动的ChatGPT一经推出便受到众多用户的欢迎,市场影响力也在不断提升,2023年1月,其月活跃用户已经达到1亿人,是历史上用户数量增长最快的消费者应用。马斯克直言ChatGPT厉害得可怕,人类离强大又危险的AI不远了;比尔?盖茨认为ChatGPT的诞生具有伟大的历史意义,能与互联网或个人计算机的诞生相媲美。 马斯克、比尔?盖茨等对ChatGPT的赞美,显示出了他们对于AI技术的看好。ChatGPT技术引发了AI发展浪潮,国内外科技巨头纷纷加大对AI行业的投资力度。 国外科技巨头中,微软于2023年年初加大了在AI行业的投入,对ChatGPT的创建者OpenAI公司进行第三轮投资,计划利用ChatGPT提高产品竞争力。谷歌投资3亿美元在ChatGPT公司的竞品—Anthropic公司上,助力生成式AI的发展;等等。 国内科技巨头中,阿里巴巴一方面全力投入生成式AI大模型建设,旗下达摩院的多模态大模型M6参数已从万亿跃迁至10万亿,成为全球最大的AI预训练模型;另一方面致力于为市场上的模型与应用提供算力支撑。百度于2023年1月10日宣称将提升百度搜索的生成式搜索能力,对用户的疑问进行智能解答;同时加强对ChatGPT产品的研究,发布中国版ChatGPT—文心一言。 很多用户认为ChatGPT是一夜爆火,其实它是经过多年沉淀后,有备而来。从2018年到2022年,ChatGPT经历了海量数据学习训练,拥有GPT-1、GPT-2、GPT-3最后到InstructGPT模型的积累,以更大的语料库、更高的准确性、更高的计算能力、更高的适应性、更加通用的预训练、更强的自我学习能力革新了AIGC技术。 以上种种表明以ChatGPT为首的AIGC技术的发展会推动第三次技术革命的到来,我们认为未来世界将会依靠数据、算力和算法驱动,未来10年各行各业都会以数智化的方式进行重构。“工欲善其事,必先利其器。”我们需要用好先进的工具,率先完成数智化转型,享受时代的红利。 但是数智化转型不是简单的IT系统建设,不是建到处都是红绿灯的拥堵路,而是建新型高效的数智高速公路,是以数智化技术驱动企业商业模式重构和核心竞争力重塑,持续提升消费者体验、商业运营效率和效益的过程。 “数”智化转型中的数是指全链路、全要素、全场景、全触点、全网全渠道、全生命周期持续的数字化、在线化。 “智”寓意包括: AI(人工智能)—算法+,多用新方式、新方法,无行业不AI,无场景不AI,无数据不AI,现在ChatGPT最大的突破是通用性,比较好地突破了行业限制和场景限制。以前更多的是大炼模型(垂直行业、垂直场景),现在将开启炼大模型(通用行业、通用场景)。 BI(商业智能)—经验和规则+,得心存敬畏,尊重规律,不仅有结果指标还有过程指标(流量、蓄水、点击等)。 DI(数据智能)—知识图谱,机器学习,深度学习+,迎接未来,用数据发现谁好谁不好,发现问题、发现机会,将好的放大,不好的则持续改善,不断拔高上限、拉高底限。 MI(心智智能)—心智占领,形成指名购买,让客户清晰地知道为什么选择你而不选择别人。 因此,我们认为数智化转型是指从战略转型、业务重构、组织升级、IT/DT建设和数智化运营的全链路、全要素、全场景、全触点、全网全渠道、全生命周期的解构、重构和持续优化的过程。 基于这个大背景,我创立了浙江智行合一科技有限公司,旨在通过“咨询 + 软件 + 运营”的一体化服务策略,为大服饰、大快消、美家、3C消费电子、汽车、产业带/产业集群、乡村振兴等行业的企业提供“战略转型—业务重构—组织升级—IT/DT建设—数智化运营”的“一站式”数智化转型服务,助力客户持续提升增长动力、持续沉淀端到端全产业链数智资产,助力客户开源、节流、提效、创新,助力客户赚钱、省钱、值钱,持续构建新的业务增长曲线和动力。 数智化转型在不断迭代、快速发展、持续深化。随着技术与环境的变化,越来越多的企业开始尝试步入数智化转型道路,在这个过程中企业面临着诸如“直播成本高、主播门槛高、行业整体非常不健康”“消费者需求变化快,企业无法精准捕捉用户需求”“新品研发周期长、新品命中率低、产品同质化严重、价格战毛利率持续下滑”“内容生产慢,无法形成好的创意”等多种难题,导致企业运营处处是断点、堵点、卡点。 得益于数智技术的突破,AIGC生成技术爆发后被迅速应用到各个场景,可以助力解决这些问题。 电商直播 AIGC跨模态技术突破了单一模态的限制,“图片—文字”“图片—视频”已经不再构成阻碍。我们研发了直播宝,AI智能可以自动生成话术模版、自动语音讲解、智能抠图生成虚拟背景,全方位覆盖直播“人、货、场”三要素,降低开播门槛,提升直播质量。 内容生产 数智技术应用于内容生产领域则更为广泛。以服装为例,我们研发的新品宝,从面料、辅料到版型等服装设计(图生图、文字转图片)都可以用AI智能生成,抓取潮流趋势;而产品后期推广也能通过ChatGPT等捕捉关键词撰写出爆款文章、生成海报和视频进行宣传,利用数据不断优化内容,搭建内容资产平台。 用户体验 用户体验是企业的核心竞争力之一。在这个层面,我们研发的营销宝通过“算法革新+算力支持+数据共振”,使企业能够智能生成标签,自动匹配关键信息,清晰洞察消费者偏好,实现精准营销,避免无效信息轰炸,在提升企业转化率的同时也提升用户体验。 一不小心,我们在不经意中成了一家名副其实的AIGC科技公司,我们是AIGC的建设者和参与者,将应用更多AIGC开发更多实战实用、实效的宝宝系列产品和解决方案,助力各行各业全链路数智化转型。 …… 除上述领域,AIGC技术还将为更多领域提供丰富的应用场景,包括但不限于娱乐、影视、传媒等行业,技术与场景的结合将成为企业的新兴生产力,带来更多生产价值。 如今正是科技爆发的寒武纪,随着核心技术的持续演进,AIGC正在急速发展,一方面,其应用已经开始呈指数增长,另一方面,AIGC产生了“溢出效应”,许多科技创新与科技成果都指向AIGC。 产品类型多样化、场景应用多元化、关键能力显著突出、生态建设日益完善,这些都是AIGC发展的必然,可以说“AI正在推动人类社会走向数智化时代”。 本书将会对AIGC加速渗透到各行各业的情况进行详解,并说明在这种情况下从理论、方法到案例,企业将如何进行数智化转型,值得企业决策者和管理者阅读。 智行合一创始人、CEO 肖利华 2023年3月
第1章 AIGC:引爆内容生产力 001 1.1 ChatGPT:AI新纪元已经开启 003 1.1.1 智能应用ChatGPT掀起AIGC热潮 003 1.1.2 应用场景:ChatGPT的多场景应用 004 1.1.3 关注要点:安全性+版权保护+道德问题 006 1.2 发展梳理:从PGC到UGC再到AIGC 008 1.2.1 PGC:企业和平台是内容创作的主体 008 1.2.2 UGC:用户成为内容创作主体 009 1.2.3 AIGC:AI成为内容创作主体 010 1.3 内容生成:AIGC涵盖多样的内容模态 011 1.3.1 AI图像:AI绘画趋于普遍 012 1.3.2 AI文本:方案、广告、小说皆可智能生成 013 1.3.3 AI音乐:谷歌AI模型MusicLM实现音乐即兴创作 014 1.3.4 AI编程:智能系统重新定义编程 016 1.4 核心驱动力:AIGC赋能元宇宙 017 1.4.1 AIGC是元宇宙实现的生产力工具 017 1.4.2 由降本增效转向创造价值,AIGC价值凸显 018 第2章 技术构成:AIGC实现的关键技术 021 2.1 自然语言处理:赋予AI理解与生成能力 023 2.1.1 核心能力一:自然语言理解 023 2.1.2 核心能力二:自然语言生成 025 2.2 AIGC生成算法:提升AI创作能力 027 2.2.1 生成式AI VS分析式AI 027 2.2.2 AI算法成熟,创作能力爆发 029 2.3 预训练大模型崛起,赋能深度学习 031 2.3.1 预训练大模型发展,破解深度学习难题 031 2.3.2 破解通用性难题,应用全方位突破 033 2.4 多模态交互技术:实现全方位的人机交互 034 2.4.1 多模态交互:文字+语音+视觉+动作 034 2.4.2 多模态人机交互让虚拟数字人更加鲜活 035 第3章 产业生态:产业生态已现雏形 037 3.1 产业生态拆解:上中下游产业链逐步搭建 039 3.1.1 产业上游:提供核心数据服务 039 3.1.2 产业中游:搭建算法模型 040 3.1.3 产业下游:多领域应用拓展 042 3.2 产业价值:消费端+产业端+社会端 044 3.2.1 消费端:AIGC推动数字内容变革 045 3.2.2 产业端:合成数据指引AI发展路径 046 3.2.3 社会端:解放人力,助力创造力提升 048 3.3 产业发展面临的挑战 049 3.3.1 知识产权挑战:数字内容存在版权风险 049 3.3.2 安全挑战:存在多方面安全风险 050 第4章 市场现状:巨头抢占市场新蓝海 053 4.1 新赛道崛起:AIGC风口已被点燃 055 4.1.1 资本流入,AIGC初创公司呈现爆发式增长趋势 055 4.1.2 宣布布局,多只概念股涨停 057 4.2 科技巨头布局AIGC已成趋势 058 4.2.1 阿里巴巴:大模型研发+AIGC应用 058 4.2.2 百度:全栈布局AI技术,以AI虚拟数字人发力 060 4.2.3 字节跳动:发力AI视频生成 061 4.2.4 微软:以投资布局,积聚AIGC实力 062 4.2.5 谷歌:推出多种AIGC产品 063 4.3 商业化落地加速,AIGC服务已经出现 064 4.3.1 AIGC云算力解决方案实现多种创作 065 4.3.2 AIGC算法与模型实现开源创作 065 4.3.3 3D视频内容AIGC引擎服务获得发展 067 第5章 AIGC+传媒:人机协同,赋能媒体创作 071 5.1 AIGC渗透传媒多环节 073 5.1.1 采编:语音识别转文字工具+新闻内容生成工具+ 视频剪辑工具 073 5.1.2 传播:虚拟主播自动播报 075 5.1.3 互动:实现与观众的互动 076 5.2 AIGC传媒的优势 079 5.2.1 三大前沿能力赋能内容创作 079 5.2.2 媒介转变,提升数字内容的感官体验 080 5.3 AIGC重构传媒领域数字营销 082 5.3.1 AIGC+数字营销:激发内容创意 082 5.3.2 营销方案快速生成,提高效率 083 5.3.3 蓝色光标:AIGC“创策图文”营销套件 084 第6章 AIGC+电商:虚实交互,打造沉浸式购物体验 087 6.1 赋能内容:电商内容智能生成 089 6.1.1 AIGC文本生成:产品命名+产品描述+营销邮件 089 6.1.2 AIGC图片生成:AIGC绘画工具自动生成图片 090 6.1.3 AIGC视频生成:为视频创作打开想象空间 091 6.2 赋能场景:电商场景三维建模 092 6.2.1 智能生成3D模型,实现商品展示与试用 093 6.2.2 实现虚拟商城搭建,提供全景式虚拟购物场景 094 6.3 虚拟主播:电商营销的好帮手 095 6.3.1 虚拟主播与真人主播合作,实现全天候直播 095 6.3.2 搭建沟通渠道,加深品牌与消费者的连接 097 6.4 虚拟IP:邀请代言+自建虚拟IP 098 6.4.1 邀请代言:AI虚拟偶像成为代言新宠 099 6.4.2 自建虚拟IP:屈臣氏推出AI代言人“屈晨曦” 100 第7章 AIGC+影视:智能创作,为影视创作提供新思路 103 7.1 AIGC影视剧本创作,激发创作者灵感 105 7.1.1 剧本数据分析+内容智能生成,形成剧本初稿 105 7.1.2 海马轻帆:AI写作实现小说转剧本 106 7.2 AIGC实现角色和场景创作 107 7.2.1 AI换脸和AI换声 107 7.2.2 AIGC实现虚拟演员打造 110 7.2.3 AIGC虚拟场景制作节省影视成本 111 7.3 智能剪辑,升级后期制作 112 7.3.1 对象自动识别:智能剪辑影片 112 7.3.2 内容修复:修复影视内容 114 7.3.3 内容形式转换:影视内容2D自动转3D 115 第8章 AIGC+娱乐:边界扩展,带来多重新奇体验 117 8.1 趣味内容生成,激发用户参与热情 119 8.1.1 “AI动漫脸”成为破圈利器,引发用户参与 119 8.1.2 虚拟偶像内容创作,激发粉丝热情 120 8.1.3 短视频内容创作,为创作者提供创意辅助 121 8.2 虚拟形象创作,连接虚拟世界与现实世界 122 8.2.1 AI自动生成虚拟形象,优化体验 122 8.2.2 Ready Player Me+VRChat:个性化虚拟形象创建 124 8.2.3 AI生成数字服装和数字潮玩,助推数字时尚发展 125 8.3 游戏内容创作,AIGC释放游戏活力 126 8.3.1 ChatGPT游戏应用指引游戏AIGC创作模式 126 8.3.2 AIGC游戏创作平台成为发展新方向 127 8.3.3 布局方向:自研模型+接入第三方模型 129 8.4 音乐内容制作,更新音乐体验 130 8.4.1 微软AI模型:AI生成多种音频文件 130 8.4.2 AIGC助力AI歌曲创作 131 8.4.3 百度元宇宙歌会实现AIGC创新 132 第9章 AIGC+教育:双管齐下,推动教育“数智”转型 135 9.1 AIGC推动教育数字化转型 137 9.1.1 数字化工具变革教学模式 137 9.1.2 搭建更加智慧的教学环境 138 9.1.3 智慧校园解决方案:为校园筑起安全屏障 141 9.2 AIGC推动教育智能化变革 142 9.2.1 智能生成3D场景,实现虚实交互 142 9.2.2 AI分析实现个性化精准教学 144 9.2.3 网易有道:尝试将AIGC在教育场景落地 145 9.3 更新体验:教学与学习体验的双重更新 147 9.3.1 AIGC赋能教师:辅助备课、教学和作业批改 147 9.3.2 AIGC赋能学生:AI虚拟教师带来全新教学体验 149 第10章 AIGC+工业:工具革新,工业设计模式迭代 151 10.1 AIGC为工业设计提供工具 153 10.1.1 AIGC为设计师提供工具,辅助内容设计 153 10.1.2 AIGC拓展建筑图纸设计维度 154 10.1.3 人机共存,AI数字人与设计师携手共创 157 10.2 英伟达:AIGC赛道不断布局 159 10.2.1 Omniverse平台:AI实现内容生产 159 10.2.2 Magic3D:3D模型智能生成应用 164 第11章 创投机遇:找准方向,抓住时代机遇 167 11.1 以技术入局:瞄准AI顶层技术 169 11.1.1 AI芯片研发:满足爆发的算力需求 169 11.1.2 AI大模型研发:通过海量数据对大模型进行训练 170 11.2 以产品入局:多角度打造AIGC产品 172 11.2.1 文字生成:腾讯推出自动化新闻撰稿机器人Dreamwriter 172 11.2.2 绘画生成:百度发布AI辅助创作平台—文心?一格 175 11.2.3 视频生成:Meta公司推出文字生成 短视频系统Make-A-Video 177 11.2.4 音频生成:喜马拉雅为创作者提供AI音频合成工具 177 11.3 AIGC领域投资机会 180 11.3.1 关注上游厂商,瞄准AIGC基础设施建设 180 11.3.2 关注下游应用,多家企业崭露头角 182 第12章 未来图景:未来已来,迎接AI下一个时代 187 12.1 技术趋势:AI技术迭代深化AIGC发展 189 12.1.1 深度学习技术迭代,AIGC内容产出更加智能 189 12.1.2 多模态技术发展,AIGC模型通用化能力更强 191 12.1.3 MaaS有望成为现实 192 12.2 参与主体扩散:由B端向C端扩散 193 12.2.1 To B端的AIGC产品丰富,赋能企业发展 194 12.2.2 To C端的AIGC工具多样,引发用户多种消费 195 12.3 行业应用赛道拓宽:行业渗透不断提升 196 12.3.1 金属行业:优化行业管理全流程 196 12.3.2 机械行业:机械设备智能升级 199 12.3.3 银行业:优化银行业务流程 200 12.4 落地场景蔓延:渗透生活的方方面面 201 12.4.1 数字员工多领域落地,解放人工 202 12.4.2 AIGC营销多领域落地,自动生成视频 204