2023 年,AIGC 火出了圈,随着 ChatGPT 的爆火,随之而来的是虚拟数字人。数字人跻身于元宇宙和 AIGC 两大风口中心,再次成了创投圈瞩目的焦点。本文就虚拟数字人产品展开分析评测,以期给大家一些启发。
2023 年 AIGC 真的是火出了圈,尤其是 ChatGPT 的爆火,AI 生成式算法的突破,不夸张的讲技术圈每天一个新产品、新变化,看麻木了。另外,数字人跻身于元宇宙和 AIGC 两大风口中心,再次成了创投圈瞩目的焦点。
ChatGPT 在数字人的智能交互性、实现个性化服务上、数字人的表现形式上以及商业化价值上等都一定程度上赋能了虚拟数字人,为数字产业和应用提供新的发展机遇和前景。而数字人作为作为元宇宙的最核心要素,或可能真正打开元宇宙。有 人 的地方就有江湖,有 人 的地方就有交易。
什么是虚拟数字人?目前流行的解释:虚拟数字人指存在于非物理世界中,由计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等计算机手段创造及使用,并具有多重人类特征(外貌特征、人类表演能力、人类交互能力等)的综合产物。市面上也多将其称为虚拟形象、虚拟人、数字人等,代表性的细分应用包括虚拟助手、虚拟客服、虚拟偶像 / 主播等。
虚拟数字人的三大特征:形象能力、表达能力和感知互动能力。形象能力,即虚拟数字人拥有人的外观,具有特定的相貌、性别和性格等人物特征;表达能力,即虚拟数字人拥有人的行为,具有用语言、面部表情和肢体动作表达的能力;感知互动能力,即虚拟数字人拥有人的思想,具有识别外界环境、并能与人交流互动的能力。
毋庸置疑,虚拟数字人是个真需求,但目前的产业生态是否能支撑这个需求?它真的做到降本增效吗?移动互联网什么时候能因为数字人而转向?
当前虚拟人已涵盖影视、传媒、、文旅、房地产、汽车以及银行证券等多场景。相信不少人也是尝鲜过数字人产品了,身边也有一些朋友做数字人直播带货,当然大部分人只是尝鲜,放弃使用是常态,考虑到成本效果等毕竟目前还是处于一个尴尬的过渡期。不过 AI 生成式算法的突破,将大幅提升虚拟人的语意理解能力和用户沟通能力,不同领域应用虚拟人自动化水平将得到提升。
作者这里主要从数字人市场背景、竞品核心功能以及运营策略盈利模式几个角度来浅聊一下数字人产品这个充满希望又充满未知的物种,毕竟喜欢新鲜事物的我还是非常看好的。选择的竞品分别是腾讯智影、WarpEngine、D-ID 以及 HeyGen,这四款产品既有国内外,又有大小公司,以此来展开聊聊。
据艾媒咨询报告,在市场规模上,2022 年中国虚拟人带动产业市场规模和核心市场规模分别为 1866.1 亿元和 120.8 亿元,预计 2025 年分别达到 6402.7 亿元和 480.6 亿元,呈现强劲的增长态势。随着娱乐需求的增加,AI 等技术不断迭代的环境下,中国虚拟人产业高速发展,元宇宙的热潮加速推动虚拟人产业升级。
用户调研数据显示,中国受访者对虚拟人的知晓度达 88.0%,常接触到的虚拟人类型有虚拟员工、虚拟偶像以及虚拟主播三种,其中虚拟主播的受众最为广泛达 64.1%。虚拟人的应用已逐渐突破次元壁,虚拟和现实之间的相互交织,为市场开辟了一块属于虚拟生态的空间,虚拟文化也开始被大众接受。
国家在大力鼓励和支持新兴文化业态,发展文化产业,推动数字文化与相关新兴产业相互融合。虚拟数字人作为数字文化产业和网络直播的综合产物,是未来建设社会文化强国战略目标的重要推动力。今年也推出了相关政策。
另外,2022 年上半年北京市经济和信息化局印发了《北京市促进数字人产业创新发展行动计划(2022-2025 年)》,发展目标指出到 2025 年数字人产业规模突破 500 亿元,这是国内首个虚拟数字人专项政策。
艾瑞咨询数据显示,2022 年中国数字经济规模约为 50 亿元行业带来发展契机。
另外,陀螺研究院的《2023 年全球虚拟数字人产业报告》统计,2020 年至 2022 年期间,全球虚拟数字人企业数量同比增长 2.7 倍,投融资事件从 12 起增加至 44 起,投融资总规模从 1.65 亿元扩大至 49.88 亿元,投融资总规模同比增长超 29 被,其中最大的一笔,是来自 2021 年韩国元宇宙虚拟社交平台 ZEPETO,融资金额达 12.1 亿元。
数字文化产业逐步成为中国文化产业发展的新增长点,2022 年中国文化企业实现营收 121805 亿元,比上年增长 0.9%。全国文化及相关产业增加值自 2016 年以来总体呈稳步增长趋势,增长速率与 2021 年已基本回到疫情前水平。2022 年中国人均教育文化娱乐消费支出 2469 元,占总消费支出的 10.1%。
数据显示,2020 年到 2022 年,中国网民规模呈现逐渐增长趋势,其中网络直播用户增长趋势显著,截止 2022 年 12 月,网络直播用户已达 7.51 亿人,占网民总人数的 70.3%,其中网络虚拟主播行业在近几年随着技术的发展成为直播领域中成长最快的市场。 元宇宙 概念的火热,Z 时代 的兴起,吸引了更多的资本进入虚拟主播行业,用户和从业者规模将进一步扩大。
虚拟数字人产业的发展涉及到众多技术领域,涵盖 AI 技术、RPA、云计算、大数据、物联网、5G 等。新冠疫情也加速了产业的发展和应用。
虚拟数字人的概念也是不断随着技术的发展迭代更新的。初期,受到技术限制,人设崩坏、画面难看等被用户诟病,用户体验极差。不过这两年无论是 CG、动捕、AI 等技术不断革新,虚拟数字人视觉体验和制作更加成熟完美了。5G 的大规模发展也给虚拟人更优的支撑。
2022 年 11 月 OpenAI 发布 ChatGPT 之后,生成式 AI 更是一路高歌。国内百度的 文心一言 、阿里的 通义千问 等产品不断更新迭代,自然语言生成技术加速提升了数字人智能化水平,应用于不同领域发挥其效果已经一个必然事件。目前,24 小时直播带货已经初见端倪。
提高虚拟人的对话质量,虚拟人的回答会更加自然、准确。更符合人类沟通的习惯;
改善用户体验,可以帮助虚拟人更好地融入用户的生活,提供更加舒适的用户体验;
提高自动化水平,大语言模型可以自动化生成自然语言文本,使得虚拟人变得更加智能化。
数据显示,截止 2022 年末中国人工智能企业数量接近 4000 家,核心产业规模(增加值)达到 5080 亿元。
技术领先:虚拟数字人基于人工智能、虚拟现实、增强现实等技术,非常智能和逼真,用户体验和服务也很好,且虚拟数字人的技术还在不断更新和创新,未来市场前景很广阔。
应用场景广泛:虚拟数字人可以应用于游戏、虚拟社交、数字娱乐、医疗、教育、工业等多个领域,随着虚拟数字人应用场景的不断增多,虚拟数字人将会有更多的机会得到市场认可。
可定制性强:虚拟数字人可以根据用户需求进行定制,可以为用户提供更个性化、更符合用户需求的服务,同时,虚拟数字人也可以根据不同场景的需求进行定制,可在不同场景中发挥更大的应用效果。
可重复使用性强:虚拟数字人可以实现多次使用,不会像传统的人力资源一样有限制,可以大大降低企业的成本和人力资源的压力,对企业发展具有重要的意义。
技术风险:虚拟数字人的技术比较复杂,需要多种技术进行整合和协调,技术的不稳定性和风险性比较大,如果技术出现问题可能会给企业造成损失。
商业模式不确定:虚拟数字人的商业模式还处于探索阶段,未来的市场前景和商业价值还存在不确定性,这也是虚拟数字人在市场中发展面临的挑战之一。
需求不确定:虚拟数字人作为一种新兴产品,目前市场的需求还不是很明确,需要企业加大市场调研和产品定位,了解用户需求和市场变化,及时调整和改进产品,满足市场需求。
趋势利好:虚拟数字人受到政府和市场的支持和关注,是数字经济发展的重要方向之一,未来市场前景和商业价值非常巨大,为企业发展提供了很好的机会。
应用场景的不断扩展:虚拟数字人可以应用于游戏、虚拟社交、数字娱乐、医疗、教育、工业等多个领域,这些领域中的应用场景也在不断扩大,随着虚拟数字人应用场景的不断增多,虚拟数字人将会有更多的机会得到市场认可。
新兴市场:虚拟数字人市场规模和增长趋势非常明显,预计到 2025 年将达到 94.3 亿美元,复合年增长率达到 36.5%,这表明虚拟数字人具有巨大的市场潜力和商业机会。
市场竞争:随着虚拟数字人市场的不断扩大,已经有不少大型互联网公司、虚拟现实技术企业等在该领域投入巨资并开展相关业务,未来市场竞争将会更加激烈。
法律风险:虚拟数字人作为一种新兴技术和产品,相关法律法规还不完善,存在法律风险,需要企业关注并积极应对。
技术风险:虚拟数字人技术本身就存在风险,如果技术存在缺陷或漏洞,可能会造成用户数据泄露或其他损失,需要企业加强技术研发和安全保障,以保证用户权益和企业信誉。
总体来说,虚拟数字人作为一种新兴技术和产品,具有很多机会和潜力,但同时也存在不少挑战和风险。企业需要加强技术研发和安全保障,了解市场需求和用户需求,探索和完善商业模式和盈利模式,以提升自身在虚拟数字人市场中的竞争力,获得更好的市场发展和商业回报。
(是的,你没有看错,SWOT 这么套路的废话一看就是 ChatGPT 写的)
虚拟数字人发展至今,诞生过不少 IP,比如国内首个虚拟歌姬洛天依、讯飞的 Luya、百度的度晓晓、元圆科技的天妤、阅文集团的叶修… ..,相关的公司也一大堆。这都是特定角色,这篇文章只浅浅聊下作者在自媒体圈里有体验过的数字人制作平台:腾讯智影、D-ID、HeyGen、WarpEngine。
由于这里关心的是用户对产品的使用,所以主要从和数字人相关的核心功能和运营策略以及盈利模式浅聊一下,毕竟除了核心技术,运营赚钱能力可谓是非常重要了。其他如产品体验、用户画像等这些就不分析了。
产品 slogan:腾讯智影是一个集素材搜集、视频剪辑、后期包装、渲染导出和发布于一体的在线剪辑平台,能够为用户提供从端到端的一站式视频剪辑及制作服务。
目前,腾讯智影(zenvideo)功能也比较多,各种智能小工具,这里只看下数字人播放这个核心功能,粗整理一下他的能力。
从他的能力上来看,就是视频编辑和数字人编辑两个大方面,视频编辑的能力是常规,当然集成到数字人视频里确实也蛮强大了。数字人编辑的形象和动作目前是给定的,每个人物都对应特定形象,虽然给了展示,但目前还不允许编辑。数字人只有合成之后才能看到动态的视频,合成之前的数字人是静态的,受限于目前的技术。有文本和音频两种合成数字人的方式,从技术经验来看,这两种方式相辅相成,一定是同时出现的。
最关心的就是数字人的姿态和表现。会员可以使用的那些数字人效果还不错,除了脸部头部唇形,还有手势的一个变化。唇形的效果和数字人角色相关,有些还是不太行,不过有的数字人还是很不错的。
另外,关于 AIGC 方面的另一些能力, 文章转视频 可以实现文本自动生成,然后匹配数字人进行播报。前两个月推出配套的智影小程序也集成了 AI 绘画的能力,不过网页版暂时没有实现这个能力。
邀请好友送会员,每邀请一人注册得 1000 金币,每满 5 人注册额外获得一个月高级会员,被邀请用户中每有 1 人购买会员,可获得与其相同等级会员 1 个月;
还有微信社群运营,我目前加了群,显示已经到第六十多了;(也是 Referral 了)
目前的盈利模式也都比较明显,无论是 C 端用户还是 B 端,都是会员制收费。另外还有企业定制,代理商合作。
产品 slogan:仅需 20 分钟视频,跃迁引擎即可为您制作突破自身语言、表演、时间、空间极限的超级分身。
Warpengine 把视频制作和分身定制分开作为两部分。制作视频的方式有几种:pdf 上传、从模板制作、直接制作,这几种到其实没太多差别,只是素材来源不一样。另外一个是创意站,这里面两种是一键生成视频和趣味视频。
视频制作方面,提供了基本的内容元素编辑功能。数字人只能选择官方提供,音色不多,且目前看上去只支持中文。创意站里风格就多了,一键生成视频里边给的一些选项也是对标商品宣传来的,足见针对的目标群体还是很明确的。通过一些关键词,然后自动生成数字人视频,GPT 集成还挺好,没看到自定义文案,难道只能和普通创建视频分开?貌似也不用。同样创意视频里也集成了 AI 绘画生成头像的能力,可以提供文本或音频,这里的文本也是自定义,不过这里的头像可以支持上传。最关心的数字人能力如何?好用!脸部姿势和唇形效果都不错,不过目前只有半身数字人。
可以看到,目前是集成了一些 AIGC 的能力,虽然不够完善,但基本功能都有了。从官方给的版本迭代信息来看,上线迭代总共不到两月。前面给的分身定制场景对话的能力暂时还没看到,应该是下一步会有的能力,这个很期待。
warpengine 做的是按使用时长收费,只有 10min 和 30min 套餐,算下来 8-10 块钱一分钟。另外一种就是企业定制。包括一些核心功能信息展示整个看上去还是更倾向于 B 端用户。API 也是包含在时常套餐里的,所以主要就是套餐费用 + 企业定制
D-ID 是国外的一款数字人产品,很简洁,就两个功能,一个是数字人视频制作,一个是数字人聊天。另外,他提供了接口供开发人员使用。
D-id chat 号称是第一个使用 ChatGPT 实现面对面对话的应用程序,只能免费使用 40 次,数字人头像目前不能更换。唇形看上去效果一般,头部姿态也一般。音色是 OK 的,后端调用的是微软的音色库。
头像支持自己上传符合条件的图片,也可以使用素材库里的图片,还可以用 AI 绘画生成。这几个方式算是很优秀了。语言支持很多种,各个国家都有,还有多样音色和风格可以选。试下来中文输出唇形还是一般般,英文还是不错的。
使用上还是简洁明了,不过国外的产品对中文和头像总归还是有些差别。另外,值得一提的是开放接口给开发人员使用,这也能看出来他的产品定位。
创建视频之后,一些核心内容如:数字人编辑、文本上传编辑生成、声音编辑、视频编辑等。数字人支持上传图像,支持 AI 绘画生成,也可以直接选择素材库里的 avatar 三种方式,点击数字人图像也可以作为图层做一些编辑操作。。文本可以直接输入,也可以使用 ChatGPT 生成脚本,当然支持直接上传声音。视频编辑可以增删改处理其他各种元素,还能上传 PPT 和 PDF 文件用来生成视频内容。
包括音视频数字人的生成编辑功能是很齐全的了。来看下最关心的数字人效果,但只有头像的也有半身数字人,体验下来,无论中文还是英文,头部姿势包括手势身型,还有最重要的唇形都已经非常逼真了,官方给的宣传视频和模板里的数字人非常优秀,自己上传的略差一些。
YouTube 看到官方有宣传视频,他所有视频都是放在 YouTube 上;
除了 Free,会员有两种模式,Essential 和 Pro,每种模式都可以选择对应的时长支付相应的价格。还有就是企业定制。API 是包含在 Pro 里,只给会员使用。
从产品的 slogan、核心功能以及运营模式可以简单看到一些区别优劣,整理总结如下。
以上不够全面,缺的读者自己补上。抛开技术能力不说,整体的方向就是视频编辑、融合 AIGC、数字人定制化、数字人对话这些,产品目前没有很全面的,都还属于探索期,距离成熟期还很遥远。
以上四种最好的就属 heygen 了,也是给其他的产品提供了思路和方向,智影的定位更偏向于一个视频制作软件,加上丰富的素材,做服务提供商是方向。d-id 虽然功能单一,但如果专精数字人视频和对话的话未来提供技术服务有望。warpengine 虽然不够完善,但属于刚诞生的产品,国内还是有优势,值得期待。
作为一个很吃技术的科技行业,无论是创投圈还是普通人,都看好,但如何才能入局?降低风险?也是一个需要思考的问题。
发展上来讲,政策也是越来越完善,产品或者创业环境还是相对不错。今年生成式 AI 技术更是给数字人发展提供了加速度。另外其他行业的发展也促进了更大的市场需求,而且用户接受度也在增加, 商业的尽头是带货 ,数字人是重头戏。
整个产业链其实不不够完善,成本就高,产品端有没有办法降本?(明显的废话)
数字人假如真的用起来了,千篇一律的形式,用户不买账,产品还能活下去吗?怎么破?
话说中型企业一定要足够细分领域,创新创新再创新才可能成为那 1%,但这数字人赛道小企业有机会胜出巨头吗?(靠服务靠运营?,可以肯定的是不懂娱乐社交不懂运营一定没戏)
注,本文内容仅以一个用户的角度来看,或有不符合实际产品定位等情况,请自行甄别。J9九游会 九游会J9J9九游会 九游会J9九游会J9 J9九游会九游会J9 J9九游会九游会J9 J9九游会


