报告出品方/分析师:国海证券研究所/姚蕾、方博云
广义的数字虚拟人指数字化外形的虚拟人物,打破物理界限提供拟人服务与体验是其核心价值,超写实、工具化、强交互是发展趋势。我们认为数字虚 拟人技术发展大趋势:(1)视觉层面突破超写实接近真人,或者风格化强调美学表达两大方向。(2)技术工具化,为普通消费者、艺术家、企业提供 低成本高效率创作虚拟人的技术,加快在各领域的应用。(3)强交互,提供接近于实时与真人自然交流的体验,为用户带来的互动感与沉浸感是多数消 费者的核心使用动力。虚拟人自上世纪在影视音乐领域萌芽开始,随着硬件软件技术的快速发展,朝着智能化、便捷化、精细化、多样化发展。
1、虚拟人概览数字虚拟人的广义定义为数字化外形的虚拟人物,具有“虚拟”(存在于非物理世界中)+“数字”(由计算机图形学、图形染、动作捕捉、深度学习、语音合成等计算机手段创造及使用)+“人”(具有多重人类特征,如外貌、人类表演/交互能力等)的综合产物。打破物理界限提供拟人服务与体验是其核心价值。
✓ 实现场景角度,目前以图片、视频、直播等为主,未来VR设备/全息投影有望为数字虚拟人在现实世界的投射提供更丰富的道具和软硬件基础。由于各场景时延(如直播等实时场景要求低时延,但内容生成场景无该要求)、驱动方式(计算驱动对模型的深度学习能力有极高要求)等不同,对技术、运营等要求差异较大。
✓ 技术角度,数字虚拟人近年的发展来源于CG、语音识别、图像识别、动捕等相关技术的共同成熟,除CG建模+真人驱动的类别外,多模态技术与深度学习成为未来核心点。
✓ 我们认为“人”是其中核心的因素,高度拟人化(外貌形象、行为表情、交互的拟人程度)为用户带来的亲切感、参与感、互动感与沉浸感是多数消费者的核心使用动力。能否提供足够自然逼真的相处体验,是数字虚拟人在各个场景中取代真人的重要标准。
广义与狭义数字虚拟人核心差别在对“交互”的要求
分类:类别多样
发展历史
2、虚拟人技术技术:视觉制作层面建模、动/面捕捉、渲染为核心制作技术环节
◼ 数字虚拟人的制作涉及众多技术领域,且制作方式尚未完全定型,《2020年数字虚拟人发展白皮书》总结出在“数字虚拟人通用系统框架”,包含任务形象、语音生成模块、动画生成模块、音视频合成显示模块以及交互模块。
◼ 在此基础上提炼出五横两纵的技术架构。“五横”是指用于数字人制作、交互的五大技术模块,即人物生成、人物表达、合成显示、识别感知、分析决策等模块。其中,人物表达包括语音生成和动画生成,动画生成则包含驱动(动作生成)和渲染两大部分。“两纵”是指 2D、3D 数字人,3D 数字人需要额外使用三维建模技术生成数字形象,信息维度增加,所需的计算量更大。
◼ 数字虚拟人视觉制作部分的工业化流程,涵盖了建模、骨骼绑定、动捕、面捕、渲染、材质解算等各个环节。
技术层面——建模:相机阵列扫描静态重建为主流,动态光场重建为发展重点
◼ 数字虚拟人建立的第一步需要进行前期的形象设计以及建模。2D数字虚拟人需要原画等形象设计,而3D数字虚拟人需要额外使用三维建模技术生成数字形象,信息维度增加,所需的计算量更大,无论是基于IP或者真人设计,都需要进行面捕以及身体的建模。
◼ 3D建模技术目前主要包含静态扫描建模以及动态建模两类:
✓ 静态扫描建模仍为主流,其中相机阵列扫描重建快速发展,目前可实现毫秒级高速拍照扫描(高性能的相机阵列精度可达到亚毫米级) , 满足数字人扫描重建需求,替代结构光扫描重建成为当前人物建模主流方式。
✓ 相比静态重建技术,动态光场重建不仅可以重建人物的几何模型, 还可一次性获取动态的人物模型数据, 并高品质重现不同视角下观看人体的光影效果, 成为数字人建模重点发展方向。 海外Microsoft、Google、Intel、Facebook 等巨头公司都在积极展开相关研究,国内清华大学、商汤科技、华为等也展开了相关研究, 并取得 国际水平的同步进展。
技术层面——形象设计与建模技术:相机阵列扫描重建技术快速发展
技术层面——建模绑定技术:技术突破不断
◼ 2018年,腾讯游戏旗下NExT Studios高保真数字虚拟人Siren(塞壬)亮相GDC,其高还原度媲美真人的形象,以及可实时驱动的表情动作;制作中“绑定技术“环节 就耗费了大半年时间。
◼ 2021年6月,由新华社、腾讯联合打造的全球首位数字航天员、数字记者“小诤”首次出现新华社数字视频中,带领用户漫游三大空间站;小诤项目的绑定流程较 Siren(塞壬)项目缩短了一半,依靠的就是创作团队创新沉淀出的高效人脸制作管线——xFaceBuilder。
技术层面——驱动技术:智能合成、 动作捕捉为虚拟人主流动作生产方式
◼ 驱动动作技术包括手动调节关键帧、预制动作、动作捕捉、智能合成(文 字/语音驱动)等。手动调整动画关键帧与预制动作(类似MMD)无法实 现实时互动。
◼ 智能合成:其中2D、3D数字人均已实现嘴型动作的智能合成,其他面部/ 身体部位的动作智能合成未能完全实现。
◼ 动捕:通过将捕捉采集的动作迁移至数字虚拟人是目前动作生成主要方式, 核心技术是动作捕捉。可分为光学式、惯性式及计算机视觉动捕等。现阶 段光学式和惯性式动捕占据主导。计算机视觉动捕虽然相对开发难度大, 目前精度较低,但就成本/对环境要求低,可移动范围大,使用场景想象力 较大,目前已有消费级应用(部分VR设备采用),成为聚焦热点。
技术层面——驱动技术:计算机视觉动捕成热点
技术层面——渲染技术:硬件与算法突破,渲染真实与实时性大幅提升
◼ 渲染技术,是指把模型在视点、光线、运动轨迹等因素作用下的视觉画面计算出来的过程。主要由离线与实时渲染两种类型。
✓ 离线渲染,就是在计算出画面时并不显示画面,计算机根据预先定义好的光线、轨迹渲染图片,渲染完成后再将图片连续播放,实现动画效果。优点是渲染质量相对好,美学和视觉效果好,缺点是无法实时控制,主要应用于影视等方面,代表性软件包括Maya、3DMax等。
✓ 实时渲染,是指计算机边计算画面边将其输出显示,优点是可以实时操控,缺点是要受系统的负荷能力的限制,必要时要牺牲画面效果,主要应用于游戏等方面,代表引擎包括Unreal Engine(虚幻)、Unity Engine等。
◼ 随着硬件能力的提升和算法的突破, 渲染速度、效果真实度、画面分辨率均大幅提升,在虚拟人物实时渲染方面,已经能做到以假乱真。2016年,EpicGames(虚幻引擎开发商)联合 3Lateral、Cubic Motion等公司联合开发的可实时驱动的虚拟人物在当年的Siggraph会议中做了演示,成功在消费级的硬件环境下实时渲染了高质量的虚拟角色。2018年5月,腾讯发布虚拟人Siren,也一个支持实时渲染的虚拟人物。
技术层面——渲染技术:实时渲染速度、真实度、画面分辨率大幅提升
技术层面:交互式数字虚拟人可分为真人/计算机驱动两种
◼ 从驱动技术角度来看,交互型数字虚拟人可分为真人和计算机驱动两种类型。
✓ 真人驱动型数字虚拟人,以真人为核心,用户可以通过3D建模、动作捕捉技术、渲染等技术,在网络上形成真人的虚拟化身,在动作灵活度、互动效果等方面有明显优势,一方面能够在影视内容的创作中减低生产成本,为影视行业降低门槛,推动影视级内容向消费级转化。另一方面则多用于虚拟偶像、重要直播中,帮助数字虚拟人完成大型直播、现场路演等互动性、碎片化活动。
✓ 计算机驱动型数字虚拟人,以深度学习技术为主,本质上还是算法,但会拥有一个定制化的虚拟外表。计算驱动的数字虚拟人最终效果受到语音合成(语音表述在韵律、情感、流畅度等方面是否符合真人发声习惯)、NLP技术(与使用者的语言交互是否顺畅、是否能够理解使用者需求)、语音识别(能否准确识别使用者需求)等技术的共同影响。尽管在特定方向上,各感知类技术已有的商业化能力已足以支撑,然而,但要达成理想的综合效果,需要该公司在三个方面同时具有较强的综合能力。
计算机驱动:多模态技术与深度学习技术集大成者
◼ 计算驱动型数字虚拟人技术是近年来多模态技术和深度学习发展的技术 集大成者。
◼ 在计算机驱动型中,可通过智能系统自动读取并解析识别外界输入信息, 根据解析结果决策数字人后续的输出文本,然后驱动人物模型生成相应 的语音与动作来使数字人跟用户互动。数字虚拟人的语音表达、面部表 情、具体动作将主要通过深度学习模型的运算结果实时或离线驱动,在 渲染后实现最终效果。
◼ 制作过程中最重要的步骤在于对各类驱动模型的训练,充足的驱动关键 点配合以精度较高的驱动模型,能够高还原度的复原人脸骨骼和肌肉的 细微变化,得到逼真的表情驱动模型。
真人驱动:成本逐渐降低,有消费级应用,技术突破重点在于动捕
◼ 在真人驱动中,在完成原画建模和关键点绑定后,动捕设备或摄像头将基 于真人的动作/表情等驱动数字虚拟人。
◼ 由于背后有真人操作,真人驱动型在动作灵活度、互动效果等方面有明显 优势,一方面能够在影视内容的创作中减低生产成本,为影视行业降低门 槛,推动影视级内容向消费级转化。另一方面则多用于虚拟偶像、重要直 播中,帮助数字虚拟人完成大型直播、现场路演等互动性、碎片化活动。
◼ 事实上,这种技术思路可以看作是传统影视制作中,CG技术的进一步延 续。近年来主要的技术突破在于动作捕捉环节。随着图像识别技术,姿势、 表情等识别算法的进步,昂贵的惯性或光学动捕设备不再是驱动的必备工 具。普通摄像头结合理想的识别算法通用能实现较为精准的驱动(如 iPhone12摄像头已可支持简单的动作捕捉),显著降低了精细虚拟内容生 成的门槛。
技术趋势——拟人化:基础是视觉层面的高保真+实时
◼ “拟人化”这需要数字虚拟人在形象或交互上具有技术优势。基础就是视觉层面实现高保真(接近真人)+实时渲染。
◼ 虚拟人外观风格选择的两极:高保真+风格化。由于恐怖谷效应的存在,人类视觉对同类的形象、特别是对面部高度敏感,在似像非像的阶段,很容易跌入“恐怖谷”。因此虚拟人外观存在风格化+高保真两个发展路线,风格化的虚拟角色艺术创作空间较大,卡通形象做出夸张化的动作表情并不会吓到观众,过去漫画、影视等艺术形态均有过成熟的标准;而1:1接近真人的高保真技术难度相对更大。
✓ 高保真技术突破点:CG建模/图像迁移技术影响外观的拟人程度。此外CV等深度学习模型影响驱动效果,受数据量、计算框架、关键特征点等因素深刻影响。能否呈现自然的面部表情变动、肢体变动等,在极大程度上取决于语音驱动的深度模型效果;能否对情感等因素进行特别设计,同样会产生重要影响。魔珐科技等业界领先的模型可组合出超千种表情效果,并包含眼神驱动。科大讯飞、竹间智能等公司会对语音/文本中的因素进行提取,增加情感驱动模型等。
✓ 实时渲染:需要影视、游戏两个领域技术的取长补短。影视很真实但不实时,游戏正好相反。游戏人物制作因显卡运算能力和引擎渲染能力不断攀升,写实风格的角色效果正不断向影视级靠近,影视领域的照相建模、高精度3D扫描、面部和动作捕捉相关技术,已经应用到游戏的实时渲染领域,为表现力带来飞跃。而影视等非实时渲染领域,也探索出数字化复制、合成真实人类外形的技术,正向实时渲染的游戏、远程会议等领域进行迁移。
技术趋势——拟人化:“形似到神似”的重点为交互能力
◼ 数字虚拟人是否能够做到自然交流,主要受到语音合成TTS技术(语音表述在韵律、情感、流畅度等方面是否符合真人发声习惯)、NLP技术(与使用者的语言交互 是否顺畅、是否能够理解使用者需求)、语音识别ASR技术(能否准确识别使用者需求)等AI技术的共同影响。尽管在特定方向上,各感知类技术已有的商业化能力 已足以支撑;但要达成理想的综合效果,需要该公司在三个方面同时具有较强的综合能力。
◼ NLP交互技术影响交互体验:以对话能力为核心。继文本对话助手、语音AI助手后,该技术继续在数字虚拟人中发挥核心作用,可以视作为数字虚拟人的大脑。在AI 交互助手方面已有理想成效,如小冰等,公司能够为其添加较好的通用式互动能力。追一科技等公司则通过知识图谱、业务问答库、对话型工程引擎等增强数字虚拟人 的业务互动能力。
技术趋势——工具化:高效创作
◼ 未来在元宇宙的数字场景中,每个用户都需要自己的虚拟形象,开放世界中大量的非用户角色(NPC)也需要做到千人千面。影视级制作的流程和效率显然不适用。 因此,需要为艺术家、一般创作者和普通人,提供符合各自能力和需求的制作工具与素材。工具化为数字虚拟人技术发展的必然趋势,开发更轻量、便捷的工具,让艺 术家和普通用户都能快速生产高品质美术资产/数字孪生体。
◼ 从0开始制作虚拟人,需要较长周期,耗费较高成本。例如Siren项目从启动采集到能够自然地活动,就用了接近半年时间。在积累了一定数量人脸数据和素材的基础上, 更高效的工具应运而生,既满足游戏制作流程中艺术家创造多样化角色的需求,也让普通人能够便捷生成属于自己的虚拟形象。
◼ 较为有代表性的是腾讯NExT Studios的xFaceBuilder与Epic的Metahuman Creator。
3、虚拟人应用市场及商业模式市场规模:天花板高,预计至2030年市场规模达到2700亿
◼ 根据量子位《数字虚拟人深度产业报告》预测,在2030年,我国数字虚拟人整体市场规模将达到2700亿。其中:
✓ 身份型数字虚拟人:身份型数字虚拟人将占据主导地位,约1750亿,并逐步成为Metaverse中的重要一环;主要得益于虚拟IP的巨大潜力(1474亿元),以及虚拟第二分身的起步(262亿元)。
✓ 服务型数字虚拟人:服务型数字虚拟人相对稳定发展,多模态AI助手仍有待进一步发展(840亿元),多种对话式服务升级至数字虚拟人形态(115亿元),总规模超过950亿。
✓ 数字虚拟人市场天花板高,且有明确实现路径,行业进入高速发展期,主要体现在:
✓ 应用场景较多且商业价值得到验证:作为多模态升级的代表技术,数字虚拟人应用场景众多,可广泛与各行业领域相结合,变现路径和市场潜力明确。其中虚拟人技术在虚拟偶像、影视特效等领域已得到明确的商业价值验证。而虚拟分身生成等场景也已得到了资本和相关产业方的认可。
✓ 国内玩家综合基础较好:大多数国内玩家为综合实力较强,发展成熟的AI科技公司,在客户积累、技术实力、销售渠道、资金供给等方面较为可靠,行业预计可直接进入平稳发展期。
✓ 作为元宇宙交互载体潜力大:数字虚拟人作为Metaverse主要的交互载体,具有明确的巨大增长潜力,并基于NFT、VR等有理想的延展空间。行业天花板高,能够维持长期和衍生发展。
演进:数字虚拟人成为数字世界接口
虚拟偶像:2022年核心市场规模将达121亿
◼ 根据艾媒数据,虚拟偶像在网民中的认可度较高,以网民总数10.11亿(《中国互联网络发展状况统计报告》2021年6月数据)计算,2021年深度+浅度追星人群占比超80%,约8亿人;而在追星群众中63.6%
◼ 根据艾媒数据,2020年中国虚拟偶像核心市场规模为34.6亿元,YOY+69.3%,预计2021-2023年中国虚拟偶像核心市场规模分别达62.2/120.8/205.2亿元,YOY+79.6%/+94.3%/+69.8%;2020年 虚 拟 偶 像 带 动 市 场 规 模 为 645.6亿 元,YOY+70.3%,预 计2021-2023年 分 别 达1074.9/1866.1/3334.7亿 元,YOY+66.5%/+73.6%/+78.7%。
◼ 根据爱奇艺专业内容业务群总裁兼首席内容官王晓晖曾表示,中国偶像市场总规模预计在2022年将达到1400亿元,以2022年虚拟偶像核心市场规模121亿计算,虚拟偶像占比仅为8.6%,渗透率有较大提升空间。
虚拟偶像:用户范围广、花费多、时长长
◼ 根据艾媒数据, 2021年虚拟偶像用户中29-30岁青年群体占比超90%, 男女比例相对均衡,高收入人群居多。
◼ 而中国网民中近50%用户为虚拟偶像月均花费金额超500元,且86.5% 的用户为虚拟偶像的花费与现实偶像持平或者更多;近75%的用户为虚 拟偶像日均花费时间超过1小时。
◼ 随着二次元领域的主要受众群体90/00后的逐渐拥有了自主消费能力, 虚拟偶像在流量变现、内容变现等方面将会获得更好的支撑,具有非常 强的忠诚度、号召力以及商业变现前景。
虚拟偶像:对真人偶像有一定冲击,核心在于IP运营
◼ 虚拟和真人偶像各有优劣,整体看虚拟偶像对真人偶像有一定的冲击性与替代性;核心在于IP运营。
✓ 在行业发展方面,虚拟偶像处于行业发展初期,在内容和周边产品的开发上拥有更多的空间和可能性,观众对虚拟偶像周边付费意愿更强;前期技术成本投入较高,根据世优科技,虚拟偶像一年所需成本在200到500万区间内。但人力成本相对低,未来一旦技术突破标准化运营,盈利预期相对乐观。
✓ 在可控性方面,人是不可控因素的根源,虽然目前虚拟偶像大多对“中之人”依赖度较高,存在一定“翻车” 风险,但比起真人偶像风险依然更小。虚拟偶像客观上寿命趋近于无线,随着潮流的变化和时代的发展迭代进化,引领不同阶段的审美,在形象开发和内容开发上拥有更强的延续性。
✓ 在观众体验方面,虚拟偶像一般为现实美化过的形象,可实现实时互动,可保持和粉丝的高频互动,但目前无法实现物理层面的互动,受众主要为年轻人,从运营层面如何持续吸收流量
虚拟偶像——运营要点/分类:同人创作+要素抓取完善人设
◼ 虚拟偶像类型可以按生产方分为PGC与UGC模式,不同的展现形式决定其交互能力。目前主流形式的虚拟偶像分为Vocaloid/Vsinger、虚拟主播(Vtuber/VUP)以及虚拟网红。我们认为虚拟偶像运营要点:
✓ (1)鼓励同人粉丝参与创作:虚拟偶像由公司/个人运营,设定有限,采用PGC强产出完成快速完成IP累积+UGC同人粉丝使用软件制作音/画/舞等内容丰富人设。
✓ (2)抓取核心潮流设定元素:根据日本文化研究者东浩纪“数据库”理论,日本御宅族的“数据库”消费模式,也即动漫作品生产主要依托于数据库中既有的“元素”,创作者从中抽取各种“元素”重组成人设,编织故事,生产过程呈现去中心化的网状特征;取代了“大叙事”和“物语”消费模式(受众获取、消费动漫产品驱动力主要由其本身的故事性、叙事性、世界观架构等要素所提供和支撑),成为目前二次元文化主流商业模式。他认为任何作品首先吸引受众的是角色的人设,人设则可以分解成不同“要素”组合(日本动漫中为“萌”,而我们认为在中国可以分解为其他要素)。属于数据库消费的群体一旦被某个作品俘虏后就会无限消费相关产品和二次创作。
虚拟偶像——盈利模式:直播带货/打赏及代言为主流,周边衍生潜力大
◼ 收入端:营销端(代言、直播带货等)、形象端(商演、直播打赏、影视剧参演等)、声音端(歌曲、MV发售)、衍生品(游戏、动画、手办模型等)。
◼ 成本端:根据蓝色光标的《元宇宙营销工作手册》,设计一个虚拟偶像形象花费10-100万元,且后续的内容制作和智能驱动研发还需持续投入,动态虚拟人直播或者 视频制作的数据/渲染等对技术/算力要求较高;此外优秀的原创内容是虚拟偶像的主要竞争壁垒,如果拥有专业运营团队支持,运营人力成本较高。以虚拟偶像短频产 品来看,一条普通的短视频成本大约在几千元甚至上万元,数分钟的定制视频的成本则需要花费数万元乃至十几万元。
虚拟偶像——虚拟网红:人设简单、成本较低成为品牌代言营销新宠
◼ 虚拟网红人设易于控制、形象变化多样、稳定以及低成本,正在吸引品牌方的
虚拟偶像——虚拟网红:2万亿电商直播市场大有可为
◼ 直播带货领域是虚拟人进入较早且接受度较高的应用领域,2020年618天猫开启全明星直播计划,虚拟偶像鼻祖洛天依(上海禾念)受邀入列,直播在线观看人数一度高超630万,洛天依在淘宝的坑位费约90万,超过同期头部主播中报价最高的真人主播罗永浩(在抖音的坑位费约60万)。根据网经社2021年电商直播市场规模预计为2.35万亿元,YOY+82.87%,虚拟网红直播带货大有可为。
◼ 相比于真人主播,虚拟带货主播在稳定性、持续性方面有较大的优势,还通过新奇的形象增加直播间内容的吸引力;但要做到流畅互动需要较高的技术成本,且目前具备认知度的虚拟IP有限,想要持续运营还有很多需要攻克的问题:
✓ 基于平台和定位差异,虚拟IP不能像真人主播一样依赖“低价”带货,目前真人头部主播MCN机构议价能力足够强,优势是“全网最低价”。但对内容平台生长出的虚拟IP而言,优势是“一边养成、一边变现”的模式。
✓ 主播的定位人设,决定了其带货的品类,依托于主播的人设属性选品,更容易引发消费者对产品的认可和信赖;目前头部虚拟主播主要售卖食品饮料、手办等产品。
◼ 中科深智(2021年获得来自晨山资本等的B轮千万级美元融资)为头部虚拟网红一禅小和尚(粉丝近5000万,大禹网络旗下)、萌芽熊(粉丝1600万)、默默酱(粉丝近500万)等提供技术支持,提供ToB的虚拟直播解决方案,价格在几万元/年左右。动画公司重力聿画旗下虚拟IP我不是白吃自2020年3月起开启直播带货,创下400万观看、4-5万人在线的记录,2021年GMV过亿元,2022年1月销售额1500万元,成为了虚拟主播领域的头部明星。
虚拟偶像:虚拟网红以代言营销为主要盈利方式
◼ 浙文互联、蓝色光标、华扬联众、天下秀、星期六、天地在线、利欧股份等营销领域上市公司纷纷入场虚拟网红/IP应用领域,或推出自有虚拟网红,或研发虚拟人制 作/直播解决方案。
虚拟偶像——虚拟歌姬:初音未来15年生命力不减
◼ 2004年ZEROG推出首个基于Vocaloid1(YAMAHA电子音乐制作语音 合成软件)的虚拟歌姬LEON&LOLA,单纯贩卖虚拟人声软件,吸引力 不大。Crypton于2007年,添加女性二次元角色封面+女性音色,推出虚 拟歌姬初音未来,一经发售即爆火;接下来的15年中,声库版本不断更 新换代,陆续发布多个声库,在音色上迭代更新,技术层面实现功能便捷 化多样化。根据BCN数据,Crypton在日本声音软件领域市占率自2008 年后一直保持在20%左右,连续15年位居榜首。
◼ 洛天依为中国首位中文虚拟歌姬,2013年版权被上海禾念收购,开启本 土化运营,2019年被B站并购。
◼ 经过15年发展,Crypton已经基本实现了从软件销售、音乐发售到营销代言(丰田、宝马、索尼、小米等)、周边衍生贩售(手办等)、游戏(SEGA《歌姬计划》 等)、演唱会(在中国、日本、欧美、东南亚等地开展数十次)、活动(札幌冰雪节)等完整的收入链条。
◼ 初音未来发售后即有大量翻唱歌曲投稿在niconico上,并成为话题,反过来推动了初音未来(音乐软件)和其他衍生品的销售。公司Crypton开放二次创作权,鼓励 粉丝二次创作,加上本身没有详细的官方设定,同人创作十分活跃,niconico、pixiv等UGC网站上出现大量粉丝制作的手书、MMD、插画、音乐、舞蹈,极大丰 富角色内容内涵,放大了初音粉丝圈层,其每次出圈都伴随着粉丝创作的洗脑神曲(如2007年甩葱歌等),同人圈中诞生大量“大神”级别创作者,比如获得日本 公信榜单曲冠军的歌手米津玄师、以个人之力制作MMD(初音未来的3D模型自由舞蹈的简易3D动画软件,完全免费,门槛极低,后期在同人文化被广泛应用至今, 带动整个3D动画软件产业发展)的粉丝樋口优等。大量的同人创作收到官方认证,再次通过官方运营进行推广,进一步扩大影响力。
◼ 中国头部虚拟歌姬洛天依也有次经历。在经历几年PGC运营,经营情况不佳后,开启鼓励UGC创作,大量同人作品涌现,禾念官方会选择部分优质作品进行重点推 广,最终经过层层选拔、抵达受众视野中的作品,构成了洛天依的整体人物形象。洛天依演唱会90%以上的曲目都来自于网友的同人创作。
虚拟主播:国内主播迎来机遇
◼ VUP/Vtuber即虚拟主播,指使用虚拟形象在网络平台上进行视频创作和直播等娱乐活动的博主;与真人主播相比,优势在于高辨识度以及更长的生命周期。大部分会 使用原创的角色设定,以MMD或Unity等软件所制作的3D模型虚拟形象出现在观众的面前,对大多数通过真人驱动,即 “中之人”(背后进行活动的真人,是声优也 是动作捕捉的对象)进行配音。虚拟主播没有绝对的人设,能否被人们喜爱、吸引注意,取决于背后的中之人以及团队的运营能力。以第一个被大众所认可的虚拟主播 是绊爱(2016年12月诞生)为例,由于分身化运营以及中之人的变动,导致粉丝出现负面情绪和抵制行为,2021年末绊爱宣布将无限期休眠。
◼ 早期国内头部虚拟主播以海外/日本为主,Hololive、彩虹社(ANYCOLOR)这类成熟的Vtuber运营公司与B站合作,迅速抢占国内市场,霸占了头部流量。目前B站 百大UP主“泠鸢yousa”、“七海Nana7mi”等,都诞生于B站与彩虹社的“VirtuaReal”虚拟艺人项目。国内虚拟主播则学习日本主播产业进行杂谈、唱歌、游戏 实况等形式,导致内容层面和国内受众有一定差距。近年国内虚拟主播爆发,2021年6月,B站CEO陈睿曾提到,在过去的一年里共有超过3.2万名虚拟主播在B站开 播,YOY+40%,虚拟主播已经成为B站直播领域增长最快的品类。新生代虚拟主播在内容层面创新,无论是歌曲、舞蹈、游戏的选择,还是和观众互动的方式,都更 加多样化,且更接地气。
◼ Hololive2021年末旗下虚拟主播“桐生可可”和“赤井心”在各自的节目中先后触及敏感话题,加上后续Hololive公关不力,引发国内观众群体不满,并最终导致 Hololive迅速失去了中国市场,国内市场产生空缺;此外我们认为随着二次元文化在中国衍生发展创造新的文化内核,同时融入流行文化,国内虚拟主播市场将迎来新 的发展机遇。
◼ 虚拟主播按照活动方式来分类,可以分成直播势,视频势和歌势。顾名思义,以直播、上传视频、唱歌为主要活动的Vtuber可以分成这三类。三类间重合度较高,没 有刻意去区分的必要。虽然精心制作的视频内容固然能吸粉,但直播的成本更低、互动感强、变现快,目前国内虚拟偶像主要收入来自直播打赏,其优点在于可24小 时持续进行直播,头部虚拟主播的直播打赏收入已可与头部真人主播比较。以2022年1月B站月度直播营收头部的VUP来看,排名头位的嘉然(来自乐华+字节的 ASOUL)月营收在73万元(2021年部分月度头名月营收可达200万);行业的收入中位数在5-10万。
◼ 按照运营背景来分类,有个人势、企业势和社团势。个人势就是所有活动由个人进行;企业势是从属于某企业或事务所,相比于个人势可以获得更多的资源和曝光度, 但同时要遵守公司的制度;最后一类是社团势,不属于某公司而是由一众Vtuber组成的团体进行活动。目前随着竞争越发激烈,企业势更具优势。 ✓ 个人势依靠单一“中之人”,内容创作有限且有相对大的“翻车”风险,早期积累流量难度较高; ✓ 企业势专业运营团队,形象、人设、内容、技术上有较大优势,一个账号的初始建立成本在10万以上(包括建模等),人力上风险较小,早期积累快,后期商业活动/ 舞台表演/原创歌曲等进一步拉开差距,有的企业甚至采用了更接近于真人偶像的培养体系。
◼ 顶流虚拟偶像组合A-SOUL由字节跳动负责开发,乐华娱乐(2021年获字节跳动、阿里等战略融资)负责运营,A-SOUL的日常直播使用了电影《阿凡达》同类型 光学动捕棚,一个摄像头价格数十万,一个棚根据精度需求有数十个这样的摄像头。2021年6月在A-SOUL成员向晚的B站生日会直播中共吸引了6900位粉丝为其充 值,单日吸金累计高达125万元;7月队长贝拉的B站生日会直播中,其甚至创下虚拟主播区第一位、B站历史第二位万人舰长的纪录,并且创造了233万元的礼物收益。
虚拟分身:游戏行业虚拟形象需求扩大
◼ 虚拟分身(AVATAR)满足个人在虚拟世界中为自己创造独特形象的身份需求,在社交、游戏等领域被反复验证。游戏需要玩家带入角色,对人设天然要求高。随着 硬件技术迭代,游戏在画面精细度和角色操控自由度方面越发强大,游戏厂商有较好的虚拟形象技术沉淀。以最典型的RPG为例,在2021年近3000亿游戏市场规模 中,TOP100收入移动游戏中, RPG(角色扮演类游戏)占比达31.3%,较20年30.9%仍有一定提升。RPG游戏开始只有低还原度/有限的角色选择,逐渐升级至 设置自由度极高的“捏脸”系统,可以让玩家根据自己的审美细化设定角色外观,加强第二分身的游戏沉浸感、真实感。
虚拟分身:虚拟社交构建元宇宙支撑框架,虚拟分身成为元宇宙入口
◼ 虚拟社交方式带来全新体验,虚拟形象为元宇宙入口。 传统社交平台的文字、图片社交为主,虚拟社交强调沉 浸式体验,虚拟社交平台用户通过打造自己的虚拟形象 进行社交互动,将人与人更轻松地相互连接起来。社交 平台的拓展和深化,铸造了元宇宙的支撑框架,元宇宙 最终要实现多个个体在虚拟世界的交互,在聚合用户的 过程中社交平台起到了关键作用。
◼ 国内虚拟社交头部公司集中布局,先后上线获测试虚拟 社交产品。如字节派对岛(内测)、百度息壤、腾讯超 级QQ秀、网易瑶台等,SOUL、BUD、啫喱等社交 APP也相继涌现。
◼ 海外虚拟社交以VR平台为主流,包括Vrchat、Horizon 等。
虚拟分身:影视行业数字替身特效技术快速发展
◼ 影视是对视觉效果的要求最高且最大程度影响社会对数字人形象认知、品牌的一个领域。近年来中国影视数字人特效技术(动捕、CG等)取得快速发展,以《阿丽塔: 战斗天使》为例,力求阿丽塔的每一个表情更加真实,一只眼睛900万像素(《指环王》整部15万像素),观众有非常真实观感,与真人人物同屏不突兀。
◼ 目前影视行业形成成熟的盈利模式,数字人特效技术更容易在影视行业中获得收益,利于先进技术的尝试开发。反之特效技术的不断进步使得影视的真实度不断提高, 观众的观感更好、代入感更强,可以更好的带动票房。
◼ 特效电影广受市场认可,扶持政策的密集出台,以数字替身为代表的数字虚拟人+影视类的产品应用正在展现广阔的市场前景。2019年中国影视票房收入超过640亿级 别,其中特效电影约占10%。 2021年在全球TOP20票房影片中,有13部使用了大量特效技术(票房占比达67%),2部动画电影。根据IT桔子,2017年中国特效行 业市场规模合计66亿元,我们推测随着文娱市场发展与电影票房的增长,特效行业市场规模有望突破百亿。
虚拟分身:影视行业数字替身特效技术已经可以创造接近真人的虚拟角色
虚拟分身:国内影视特效距美国有一定差距,不乏优秀公司存在
◼ 国内特效、CG公司整体实力水平较美国好莱坞有较大差距,主要是由于起步相对晚,制作体系不完善。但《流浪地球》、《哪吒之魔童降世》、《战狼2》等电影在阶 段性展现了国内特效团队的实力,国内仍不乏高水平公司存在,如原力动画、数字王国等。
虚拟助手:替代真人进行服务
◼ 虚拟助手:在对交互要求相对简单的场景下,如新闻播报主持、文旅导览导航、金融客服、教育、产品说明等,数字虚拟人可以替代真人服务,通过预置知识库、知识图谱、用户自主配置触发条件等等,数字虚拟人可以对用户的基本诉求进行行为和语音识别,并以固定话术进行回应。
◼ 国内厂商针对虚拟助手特定细分领域开展业务,如追一科技、科大讯飞、相芯科技、火山引擎(字节)等均提供相关解决方案:
✓ 虚拟主持人/新闻播报:芒果超媒推出虚拟主持人YAOYAO、小漾等;新华网推出AI主播家族新小萌等(与搜狗公司合作)、数字记者小诤( 合作腾讯)。
✓ 虚拟客服:金融地产企业对新技术接受程度较高,且能承受目前较高的成本,如浦发银行与百度、原力动画联合推出数字员工“小浦”。万科集团推出数字员工“崔筱盼”,以远高于真人员工千百倍的效率在各种应收/逾期提醒及工作异常侦测中大显身手。
✓ 导航导览:在文旅展览等行业应用较多,如商汤为上海科技节特别定制数字人“小糖”,进行科普讲解。
多模态助手:提供真实陪伴
◼ 多模态助手:在通用/特定场景中,基于真人形象提供顾问、关怀、陪伴、事务处理等服务,提供关怀感与真实感,对用户系统个性化、虚拟人拟人程度、交互能力要求极高。因此我们认为人工智能研发商、互联网/硬件头部厂商相对优势较大,目前处于前期阶段,应用领域包括:
✓ 医疗健身等顾问:加拿大TwentyBN选择自主构建数字虚拟人陪伴应用。其Fiteness Ally为个性化健身教练,基于使用者实时运动情况等个性化交互。
✓ 个性化交互AI助手:目前虚拟AI助手大多以语音为载体,消费者习惯在不动用视觉/基于智能手机或音响等设备,其多模态特性不具备相对优势,更改用户习惯需要一定时间。在XR或全息投影下,有具体形象AI助手将有优势。AI助手大多由手机厂商或底层系统上开发,技术成熟后增长可能是爆发式的。目前知名AI语音助手小爱(小米)、小冰(微软)等已定制虚拟形象,但对外展示实时渲染等技术要求较高,尚未广泛搭载。
✓ 情感陪伴:韩国MBC电视台《我遇见你》节目曾找到技术团队利用8个月打造的VR系统,帮助一位母亲与已去世女儿重逢。
产业链:逐步形成
投资建议:虚拟人产业链主要包含基础层(建模/渲染引擎等基础软硬件)、平台层(动捕等软硬件系统、垂直平台、AI厂商)以及应用层,随着底层技术硬件等突破, 将赋能更多应用场景,基于此,给予行业“推荐”评级。头部综合大厂在技术沉淀、IP运营、流量有较好基础,偏好探索底层技术、硬件架构以及针对公司业务应用 做工具化产品,产业链布局相对全面,如海外Meta、Google等;国内腾讯、阿里、 B站、网易、百度、字节等。A股传媒公司主要涉及平台层垂直解决方案提供以 及应用层,建议重点
基础层:海外公司形成较深的技术壁垒
◼ 基础层为数字虚拟人提供基础软硬件支撑,硬件包括显示设备、光学器件、传感器、芯片等,基础软件包括建模软件、渲染引擎。显示设备是数字人的载体,既包括手 机电视、投影、LED显示等2D显示设备,也包括裸眼立体AR、VR等3D显示设备。光学器件用于视觉传感器、用户显示器的制作。传感器用于数字人原始数据及用户 数据的采集。芯片用于传感器数据预处理和数字人模型渲染、AI计算。建模软件能够对数字虚拟人的人体、衣物进行三维建模。渲染引擎能够对灯光、毛发、衣物等进 行渲染,主流引擎包括 Unity 公司的Unity 3D、Epic Games公司虚幻引擎等。总体来看,处于基础层的厂商已经深耕行业多年,已经形成了较为深厚的技术壁垒。
平台层:建模渲染
◼ 平台层包括软硬件系统、生产技术服务平台、AI 能力平台等为数字虚拟人的制作及开发提供技术能力。建模系统和动作捕捉系统通过产业链上游的传感器、光学器件 等硬件获取真人/实物的各类信息,利用软件算法实现对人物的建模、动作的重现;渲染平台用于模型的云端渲染。解决方案平台基于自身技术能力为广大客户提供数 字人解决方案。AI 能力平台提供计算机视觉、智能语音、自然语言处理技术能力。平台层汇聚的企业较多,腾讯、百度、搜狗、魔珐科技、相芯科技均有提供相应数 字人技术服务平台。
平台层:人工智能
平台层:垂直解决方案
头部厂商——腾讯:游戏IP可开发虚拟人形象,加码AI和虚拟人制作技术研究
◼ 腾讯在虚拟人方面主要分为两个方向:①腾讯旗下的游戏IP为虚拟人的制作提供了大量的素材;②旗下NExT Studios、腾讯云 和 AI Lab 深入研究虚拟人制作技术和AI技术。
✓ 游戏IP:先后推出QQ炫舞-星瞳,英雄联盟-KDA女团。
✓ NExT Studios:拥有独立的照相建模实验室、高质量人脸制作管线、给予光学动捕的动画生产管线,极大提高了虚拟人的制作效率。
✓ AI Lab:由 100 余位来自世界知名院校的科学家,以及 300 多位经验丰富的应用工程师组成,并与世界顶级院校与机构合作。目前已打造出AI虚拟人“艾灵”,可以展示AI作诗、AI书法等国风才艺,也可以与歌手展开跨次元合作。
✓ 腾讯云:提供虚拟人实时渲染解决方案。接入轻量级SDK,即可将虚拟人和场景搬上云端实时渲染,享受稳定、高画质、低延时体验。支持使用 iOS 及安卓设备采集语音、脸部及身体动作,同时也支持动捕设备数据传输至云端。支持观众进入虚拟场景与主播互动等超前玩法,打造更强的参与感和沉浸感。兼容原创虚拟人、虚拟场景等多类型数字资产,支持与直播、演唱会等场景耦合。
头部厂商——阿里:开发虚拟人应用于电商,达摩院 XR实验室完善底层技术
◼ 阿里在虚拟人方面主要分为两个方向:①开发虚拟人应用于电商;②达摩院 XR实验室深入研究虚拟人技术。
✓ 应用于电商的虚拟人:①电商AI虚拟模特塔玑。商家只需要上传一张商品的平铺图,就可以生成模特的实拍图,用于店铺的商品详情页。AI模特利用创新算法技术在目标人脸(Target Face)模块基础上,生成成千上万种五官组合,形成全世界独一无二的虚拟人脸,降低了商家被盗图的风险。同时利用算法技术将服装平铺图转化成3D图“穿”在模特身上,直接降低了商家上新的人力和财力成本。②淘宝人生。用户可定制自己的虚拟形象。③邀请虚拟人代言:引入天猫超级品牌日数字主理人AYAYI。
✓ XR实验室:为阿里达摩院下X实验室中的XR实验室,致力于研究物品与人物的三位建模、高真实感渲染、自然人机交互、大场景地图与定位、机器人抓取操纵领域。将产品运用于①全息店铺:通过自研硬件设备对室内外空间扫描建立VR店铺模型,并在移动端提供VR展现。可基于VR店铺模型叠加各类空间信息和服务,如商品信息、订购导览等,也可以在VR店铺模型中嵌入虚拟人,如虚拟导购员等。②AR平行世界:通过自研硬件设备对室内外空间扫描建立三维高精地图,并通过摄像头在地图中实现高精度定位,实现AR导航、AR信息叠加、AR打卡拍照、AR虚拟客服等能力。同时提供内容生产平台,帮助企业轻松实现各类效果定制化。③IDC智能运维机器人:由XR LAB自主设计开发的、具备机械臂控制能力的数据机房运维机器人,通过视觉与触觉融合的复杂操作控制算法,具备在数据中心实现“自动更换硬盘、精细化巡检、自动资产盘点”的三大核心业务能力,为数据中心提供无人值守、无人巡检和数据安全的完整解决方案。
头部厂商——网易:提供虚拟人解决方案落地多场景,AI捏脸技术服务游戏
◼ 网易在虚拟人方面主要分为两个方向:①网易伏羲为多场景提供虚拟人解决方案;②AI捏脸技术服务于游戏。
✓ 网易伏羲:网易伏羲是国内专业从事游戏和泛娱乐产业人工智能研究和应用的顶尖机构。旗下产品有有灵虚拟人、伏魔AI反外挂、伏羲游戏AI,解决方案有游戏行业解决方案、空间智能互动解决方案、文旅虚拟代言人解决方案、游戏化游览主题解决方案。其中有灵虚拟人提供虚拟人形象定制、驱动、互动娱乐等虚拟交互服务,帮助企业客户快速打造专属虚拟人应用,可落地场景有金融领域、文旅领域、娱乐社交、游戏影视领域、智能终端IOT。文旅虚拟代言人解决方案可为文旅景区设计专属虚拟形象IP,助力景区品牌建设和对外宣传。运用人工智能技术,将代言人打造数字化私人助理/玩伴,提供景区导览、文旅信息咨询、互动娱乐等多种交互式虚拟人服务。
✓ AI捏脸技术服务于游戏:由网易伏羲 AI 实验室和密歇根大学的研究人员共同打造的深度学习方法MeInGame。它是一种自动创建人物面部的方法,可以从一张肖像中预测生成面部的形状和纹理,并可以集成到大多数现有的 3D 游戏中。
✓ 国内首个沉浸式活动系统“瑶台”:用户可以随心打造专属虚拟形象,并实时控制虚拟人物的面部表情和肢体动作自主操作虚拟人物,在拟真场景中面对面畅聊互动,获得超越现实的沉浸式体验。支持云游戏、PC客户端、移动端访问。可用于工作、学习、聚会等多场景。
头部厂商——百度:发力AI技术,提供虚拟人渲染方案和智能数字人平台
◼ 百度在虚拟人方面着重研发AI技术,并且给予AI技术提供了①百度智能云曦灵-智能数字人平台;②虚拟形象智能交互解决方案;③百度智能云-数字明星运营平台与灿星计划;④沉浸式虚拟空间“希壤” 。
✓ 百度智能云曦灵-智能数字人平台:致力于打造智能的服务型&演艺型数字人,面向金融、媒体,运营商、MCN,互娱等行业。该平台可降低数字人应用门槛,实现人机可视化语音交互服务和内容生产服务,有效提升用户体验、降低人力成本,提升服务质量和效率。
✓ 虚拟形象智能交互解决方案:业界首家基于终端实时渲染的虚拟人方案,相较云端渲染推流大幅降低带宽成本,可快速定制专属3D卡通、2D真人虚拟人物形象,支持实时对话和语料定制,可快捷部署于多种终端及大屏,为景区、轨交、政务等多种场景提供问询导览服务,满足多样化需求。
✓ 百度智能云-数字明星运营平台与灿星计划:通过 4D 扫描技术+人工智能,将真人变成有智慧的超写实虚拟人。使超写实虚拟人开发,变得更简单快捷、更低成本、更易运营。该平台已打造了龚俊数字人。
✓ 沉浸式虚拟空间“希壤” :2021年12月,百度发布“希壤”,在视觉、听觉、交互三大方面实现技术创新突破。每一个用户都可以创造一个专属的虚拟形象,在个人电脑、手机、可穿戴设备上登录“希壤”,听会、逛街、交流、看展。
头部厂商——B站:布局虚拟偶像全产业链,虚拟主播带来新的收入增长点
◼ B站在虚拟人方面主要分为两个方向:①通过投资公司,布局虚拟偶像全产业链,同时加码虚拟偶像运营。2019年并购洛天依运营商上海禾念,2021年12月,B站联合索尼打造的虚拟偶像团体“Virtual Cinderella Project”正式上线,并于2022年3月正式出道。②为虚拟偶像(主播)提供平台。2021年,B站上共有32412名虚拟偶像(主播),同比增长40%,每月有约4000多名虚拟偶像(主播)开播,针对虚拟偶像的订阅和打赏同比增长350%,是中国最大的虚拟偶像平台。
头部厂商——字节和快手:侧重虚拟主播方向
字节跳动:
◼ 投资乐华,与乐华共同打造虚拟偶像团体A-soul。A-SOUL于2020年末上 线,由字节跳动提供底层技术支持,乐华提供中之人、内容策划运营等。同 时,字节跳动也收购了A-soul美术著作权所有公司。
◼ 旗下火山引擎推出“数字人与虚拟形象”产品,可定制虚拟形象。打造虚拟 人“卡诺橙”,亮相北京春晚。
◼ 2021年6月申请虚拟角色捏脸专利,在东南亚推出捏脸APP“Pixsoul”。 Pixsoul目前提供两个高清特效,一种是Avatar(虚拟化身),可将用户的 照片转变为相应的3D形象或电子游戏中的虚拟角色,从而帮助用户打造个 性化的虚拟形象,并用于社交。
◼ 收购VR创业公司Pico。Pico是国内领先的VR硬件制造商,在全球市场份 额达到第三。为培训、医疗、展览展示等行业客户打造VR解决方案。
◼ 投资杭州李未可科技有限公司。该公司开发虚拟人“李未可”,以AI人的身 份出现在AR眼镜中,定位为中国第一个真正有情感连接的AI虚拟数字人。
快手:
◼ 快手主要致力于UGC内容的降本增效,并且通过在直播中加入虚拟形象,来增加玩法的多样性和趣味性,以此来提高对观众的吸引度。
◼ 快手虚拟人相关团队:特效团队和Y-tech技术团队。
◼ 快手的两个独立开发工具:虚拟偶像创建和开播工具—A站面捕助手和快手特效开放平台—必扬特效平台。
✓ A站面捕助手:包括3D扫描、动捕以及实时渲染等技术。用户能以很低的成本(100元左右的摄像头下)创造自己的虚拟形象,并让虚拟形象跟着自己动起来(实时捕捉人的动态并几乎无延迟驱动虚拟人),进行直播互动和内容生产。
✓ 必扬特效平台:用户可以设计和创造自己的特效玩法,发布到快手让更多人体验,并可获得平台激励。通过这个方式,短视频平台、特效创作者、特效消费者形成了一个互利共赢的生态
头部厂商——谷歌:加码底层技术,开发建模动捕系统、AR头盔和全息视频聊天技术
◼ 谷歌在技术和应用场景方面主要有①推出 The relightables人体三维重建和重光照系统 ;②开发AR头盔;③开发全息视频聊天技术;④发力穿戴设备。
✓ The relightables :谷歌2019年推出的一款人体容积视频捕捉的方法,专注于3D几何重建和高分辨率的贴图。最终得到如照片真实的和高质量的可照明的全身演出采集。区别于传统的3D捕捉过程中的光线条件恒定的特点,Relightable通过装置中的331个LED发光器在3D捕捉过程中创造交替转换的两种环境光照,以60Hz运行,采集拥有两张交替颜色梯度的光照图片,最终计算得出时间一致的反射比图(Reflectance Map),可用于任意后期渲染引擎,得到如照片一样真实的渲染效果。
✓ AR头盔:内部代号为Project Iris,预计2024年发货。
✓ 全息视频聊天技术:2021年在谷歌的I/O大会上首次出现,通过高分辨率传感器、数十个景深扫描传感器以及 65 英寸的光场显示器,重新生成实时 3D 模型,以达到在裸眼的情况下让用户感觉就像坐在真人面前一样。
✓ 发力穿戴设备:2021年初,谷歌宣布收购智能硬件公司Fitbit,Fitbit是一家专门研发可记录用户在三维空间中的运动设备的公司。随后在Google I/O大会上,谷歌宣布将其Android Wear平台与三星基于Tizen的手表生态系统合并的计划。
头部厂商——微软:布局虚拟现实全产业链,研究院发力人工智能
◼ 微软的主要发力在虚拟现实方面,同时研究所发力人工智能。2021年与混合现实捕获工作室Avatar Dimension合作,团队未来将提供混合现实头显等支持。同时, 2021年推出基于Azure云服务的AR开发平台Mesh平台,利用微软自己开发的HoloLens 2头显,可以创建空间,与同事像在同一个位置协同工作。
◼ 微软研究院着重研究人工智能,开发人工智能框架“小冰”。
头部厂商——Meta:发力虚拟现实布局
◼ Meta重点发力虚拟现实布局,主要分为两个方面:①发力虚拟现实技术硬件;②在虚拟现实应用上多面开花。 ✓ 硬件方面:①收购头显设备公司Oculus,推出头显设备Oculus Quest 2,根据Steam 2022年1月数据,市占率为46.02%。②调整研发部门结构,在AR、VR硬件 领域均有专门的部门研发。 ✓ 虚拟现实应用:①收购多家VR游戏厂商。②开发VR社交平台Horizon Worlds,VR办公协作平台Horizon Workrooms。③计划打造AR广告,可实现虚拟服装试穿。 ③Oculus Avatars 平台:定制虚拟化身,支持的次方种组合。
头部厂商——英伟达:基于强大的芯片技术,提供基础底层服务架构
◼ 英伟达基于强大的芯片技术,定位为提供基础底层服务架构。
✓ Omniverse平台:英伟达推出的以元宇宙概念为基础虚拟协作和模拟平台。平台包括五大核心部件:Nucleus、Connect、Kit、RTX Render、Simulation。其中OmniSurface系统能够渲染不同的材质和表面,针对数字人也有不同的渲染机制。利用GPU渲染可以让数字人更加符合自然物理规律,而不是普通的3D动画。
✓ 开源平台-NVIDIA Riva:通过算法优化的平台,其中一个功能模块为Audio2Face,可以通过一段音频驱动数字人面部表情的动捕,就像正常人说话一样,实现口音口型和面部表情、细微动作。
✓ 制作虚拟人:①Toy-me。②蛋壳人。③应用于会议软件中的虚拟人
头部厂商——英特尔:基于芯片技术,着重应用于体育领域
◼ 在硬件方面,英特尔拥有领先的芯片技术;在落地场景方面,主要应用于体育领域。
✓ 芯片技术:①英特尔“至强”处理器,可在工作站上提供3D渲染、3D CAD所需性能。②英特尔 OneAPI AI 开发套件。③英特尔 AVX-512(英特尔高级矢量扩展 512)。④3DAT(3D Athlete Tracking,3D运动员追踪)技术。⑤双镜头立体摄影机吊舱。
✓ 应用领域:①VSS 数字孪生场馆模拟仿真服务。②3DAT技术。③Ture VR技术。
风险提示:◼ 用户增长不及预期风险 ◼ 用户接受度不及预期风险 ◼ 用户隐私数据风险 ◼ 商业模式发展不及预期风险 ◼ 版权保护风险 ◼ 竞争加剧风险 ◼ 技术成本过高风险 ◼ 技术发展演进不及预期 ◼ 核心人才流失风险 ◼ 法律政策监管风险 ◼ 估值中枢下移风险
请您
报告属于原作者,我们不做任何投资建议!
如有侵权,请私信删除,谢谢!
获取更多精选报告请登录【远瞻智库官网】