3D 数字人:开启 AI 多模态时代,赋能千行百业实现全域业务拓展

  • 2024-09-27

  • 来源:极客公园

AI 风口下,数字人技术备受各界关注。9 月 23 日,首届中国数字人大会在北京召开,政界、学界、企业界领袖齐聚一堂,共同探讨数字人应用的趋势和场景。此次大会不仅为行业交流提供了平台,也彰显了数字人在人工智能发展中的重要地位及其商业价值。

当下,数字人技术已无处不在。从影视动画中的数字偶像到企业数字员工及数字助手,数字人作为 AI 技术生产力,为各行各业商业模式创新带来新的可能性。例如,创建个性化的多模态数字人,制作各类数字人宣传视频、开启数字人直播等等。数字人已经融入金融、教育、政务、培训等各行各业,赋予了企业更加生动、高效的内容生产力及更具真实情感的沉浸式互动体验。

01 3D 数字人:ChatGPT 的终极形态

想要理解数字人的价值,不妨从人与人的沟通中寻找答案。人们最原始的交流,就是在三维空间中面对面进行。过去,受限于技术及生产力瓶颈,文字、图片和视频,还停留在二维空间。这导致很多真实世界的信息,无法被最大化还原, 例如文字没有声音、色彩等信息,视频缺乏真实世界的三维立体感和面对面的交互性。

亚里士多德曾说:「技术既超越自然,又模仿自然。」从纸质媒体时代、互联网时代到移动互联网时代,再到空间计算时代,人们不断寻回因技术制约而失去的真实世界。3D 内容,以 其独有的光、影、动态的丰富性,不仅赋予了人们超越 2D 的感官之旅,更引领我们踏入一个沉浸立体可交互的全新世界,令人心驰神往。

从 3D 电影大片,到全息投影再到苹果的 VIsionPro 空间计算技术, 3D 视频能够提供比 2D 文字、图片更沉浸、更真切的体验。 随着 3D 技术的发展,人们渴望像《黑客帝国》《头号玩家》那样,能够以 3D 分身,走进一个三维立体的、高度还原沉浸感的世界。

而从另一维度审视,以 ChatGPT 为代表的 AI 语言大模型,从文字表达上已日趋接近人类思维方式。而借助多模态表达,当 文本大模型与 3D 数字人动作大模型相结合,将带来更高的信息传递效率。

试想,若 ChatGPT 不再局限于冰冷的文字或声音,而是 化身为栩栩如生的 3D 数字人,通过丰富的表情和动作与我们进行更直观的交流, 将是何等生动有趣的场景。 融入 3D 数字人视觉形象,ChatGPT 走向多模态应用,不仅代表着技术的进步,更预示着其发展的终极形态已经显现。

02 AIGC 革命 攻克 3D 数字人技术难点赋能千行百业

未来 5-10 年,3D 互联网将创造超万亿美元的市场价值。 产业繁荣背后,是传统生产方式下内容生产供需之间的巨大缺口。 在这样的背景下,魔珐科技凭借其前沿的 3D 数字人技术及 AIGC 全栈解决方案,实现 3D 数字人高质量、高效率、规模化打造,破解 3D 视频、直播生产面临生产质量与效率无法兼顾的难题。

大会现场,魔珐科技 AIGC 业务负责人杜子航向参会领导和嘉宾们,展示了魔珐科技的自研的 3D 数字人技术产品, 对传统 3D 内容制作成本、时间和效率的革命性改进。 展示了 3D 数字人产品在沉浸感、互动性、视频生成的专业性和可编辑性方面,展现出独特优势。

魔珐科技的 AIGC 全栈技术,涵盖了文生文、文生 3D 数字人、文本生成 3D 数字人动画、文本生成语音、文生镜头等全方位革新。 相较于传统的 3D 角色生产,如 3A 游戏《黑神话·悟空》中的角色,魔珐科技提供了低门槛、高效率的解决方案。每个普通人和企业都可以借助魔珐科技的有言、有光等产品,低门槛的 拥有灵活匹配不同应用场景的高质量 3D 数字人。

有言中,内置了海量的 个性化 3D 数字人形象,他们拥有不同的年龄、性别、种族及服饰穿搭。 用户还可以根据喜好,为 3D 数字人搭配妆容、发型和服装,自由的打造个性化的 3D 专属数字人形象。魔珐科技, 打破了外界对于数字人无法被用户自行创作修改、人物呈现呆板、动作有限、无法呈现人物空间感的认知。

魔珐科技自研全球首个文生动作大模型,可以根据文本语义和场景,生成出 自然灵动的表情、动作和手势表达,结合不同的应用场景,可以表现出真人一样的肌肉动态与动作,甚至可以精细的还原出人物的眼球生理状态与神韵。

在有言中,3D 数字人拥有大量不同的动作风格。同时, 人物动作可编辑、调整,可以根据用户喜好,表现出多样化的动作节奏。 在人物声音方面,魔珐科技的自研 TTS 语音技术,能够还原人物的语音节奏、停顿、音色,海量的音色库,和语音风格,能够匹配带货、主持、解说等各种不同的场景风格。

这些先进技术已落地于魔珐科技的视频、直播、1V1 服务产品,赋能金融、娱乐等多个行业。真正实现个性化编辑、灵活匹配不同应用场景的高质量 3D 数字人, 可以还原出更加沉浸的视觉体验,轻松传递出更多的真实情感。

此外,魔珐科技还拥有 3D 数字人 AI 镜头生成能力,可以通过 AI 生成多种专业影视级镜头。借助有言的 AIGC 能力,可以根据文本轻松生成多机位、多景别、专业影视级的镜头效果。 专业的运镜技巧与真实可感的 3D 场景与灯光呈现,能够增强视频叙事性,让视频更生动,从而提升观众观看视频的时长。 同时,专业的镜头语言和 3D 视频,能够让观众更轻松地理解视频内容,提升视频的质感,展现企业实力,与用户建立起更专业的认知。

通过魔珐科技的 3D 数字人 AIGC 全栈技术,让一切交互和体验更为亲切,还原人与人面对面的沟通。通过产品化的方式,借助 AI 技术让每个普通员工都能轻松操作,帮助企业提升视频、直播与 1V1 服务的生产效率。

借助有言,3D 数字人可以活跃在企业的各个对外营销场景中, 高频生产出产品介绍、品牌营销、活动宣传、电商运营、企业培训等各类品牌对外、对内视频; 还可以通过有光实现 24*7 快速开播,或者借助星云平台定制生成品牌代言人或客服代表, 可全天候、跨地域与消费者进行互动,提升品牌形象与客户满意度。

活动现场,杜子航也向在场嘉宾分享了魔珐科技 3D 数字人产品在各行各业的应用落地案例。

魔珐科技为中金财富打造数字人「Jinn」,并通过全域运用提升了客户服务体验和品牌影响力。通过视频、直播以及 1V1 的服务,魔珐科技的 3D 数字人技术,不仅拓宽了中金的投顾服务范围,增强了客户陪伴感。并通过可感的 3D 人物, 将品牌价值与服务能力相融合,提升了客户服务体验的同时,塑造了兼具科技感与活力、智能化与专业度的品牌形象。

海尔集团面临庞大产品体系和经销商体系中的培训挑战,通过采用有言平台,有效解决了售前销售培训、产品卖点传达及售后维修讲解的难题。利用有言,海尔快速沉淀优秀销售话术,提升培训效率,实现 AIGC 批量化视频生产。海尔集团 8 大产业部门、33 个小微等业务部门 的培训需求得以满足, 视频生产效率提高了 50% 以上 以数字化创新和 AIGC 技术推动组织高效发展与业绩增长,保持保持行业领先地位。

对高校而言,各个学科有大量视频课件制作需求。但外包公司制作不但成本高而且周期漫长,也无法根据教师们的需求,随时更新课程内容。四川开放大学使用有言,破解了视频课件制作的难题。有言操作简单,教师们可以自主制作日常教育教学课件,打造各类精品课程,有言内置的多语种也可以用于海外教学交流。通过有言, 赋能高校打造 3D 视频精品课程、课件,参与学科竞赛及教育教学出海交流,有力提升该校教学质量和国际影响力。

徐家汇书院面临传统政务宣传方式单一、难以满足高频多样化信息需求的痛点,亟需创新升级。为此,依托有言平台,运用 AIGC 技术快速生成高质量短视频,并定制 3D 虚拟人「徐小萱」作为宣传纽带,线上线下全场景打通,高效传达核心理念和文化价值。突破了政务宣发视频的产能限制, 打通线下播报与线上数字化平台宣传壁垒,成功吸引了年轻人的关注与好评,让文化魅力在数字时代"无界"绽放光彩。

魔珐科技已服务数百家行业领军企业,通过 3D 数字人技术助力企业打造独特的品牌 IP,生产高质量的品牌宣传、营销推广内容,举办线上发布会,并制作各类企业培训视频。这些应用已深入教育、法律、金融、政务、文旅等多个领域。借助数字人直播和 1V1 服务产品,企业能够提供 24*7 的全天候咨询和指导服务,确保每一位客户都能得到及时、专业的服务。 提升企业宣发效率,提升客户满意度,为企业带来了实实在在的业务增长。

3D 数字人技术与产品,不仅为企业带来了营销和服务方面的变革,更以其独特的商业价值,为企业开辟出新的增长空间。

来源:互联网

推荐

    我要评论