元宇宙

内部-打造多模态认知AI引擎,「拓元智慧」已实现首款产品商业化落地

作者:CETCIT小编

2022-11-29 15:19:06

随着元宇宙、AIGC、虚拟人等概念的流行,有关多模态内容生成等新一代AI技术的商业化落地引起了多方关注。比如,以Stable Diffusion、Midjourney为代表的文本生成图像工具,激发了大量传统内容制作行业的需求。而在图像生成外,文本生成视频、文本生成3D模型等更多模态内容的生成、落地则成为了不少科学家、工程师以及创业者持续研究、讨论和攻克的方向。

36氪日前接触到的「拓元智慧」是其中一家利用多模态认知AI技术,进行商业化落地的公司。据介绍,拓元智慧成立于2022年初,也在同年获得由银杏谷资本、源数投资、卓源资本和汉仁资本投资的数千万元天使轮融资。

据介绍,拓元智慧创始团队包含林倞教授领衔的AI知名科学家及资深商业化及管理人才。公司创始人林倞教授,是中山大学人机物智能融合实验室创立人,IAPR Fellow,并具备丰富的产业界工作经历。据介绍,拓元智慧团队致力于让AI技术,尤其是以推理决策为核心的认知型AI技术,走出实验室在现实生活和生产中创造价值。

谈及创业契机,拓元智慧团队表示,近两年海内外对元宇宙的关注度很高,不论是Meta还是国内公司都有所动作。但在他们眼中,当前市面上还缺少可以规模化、标准化应用的相关产品,而在这一相对的市场空白之下,创始团队对这一领域具备技术积累和市场观察及产业经验,拓元智慧也就此成立。

拓元智慧认为,AI的本质是人的智慧和能力的(时间和空间上的)延展,公司计划从多模态认知AI引擎切入,通过低成本大模型、因果图模型、心识模型等多技术栈结合,模拟人脑计算框架,赋予人工智能认知和交互能力,促进虚实世界的深度融合,创建与用户新的链接方式,并成为未来元宇宙基础设施的重要部分。

拓元智慧表示,未来,AI将真正实现类人化和智能化,从“模仿”,到具备“智商”,再到拥有“情商”,兼具想象和创造、推理和交互、陪伴和情感的能力,在数字空间(虚拟世界)中可能是我们某个真人的个性和价值观的代表,也能够创造有温度能共情的虚拟身份和虚拟服务。他们彼此交互连接,运行发展创造,又与真人用户紧密连接,进而反哺真实世界的运行,真正深入服务我们的生产和生活。在拓元智慧眼中,这才是“元宇宙”真正的意义和价值。

现阶段,拓元智慧计划以“数智人”为首个商业化落点,为普通人提供复刻"数字分身"的能力。这背后需要两层技术的支持,首先在表皮层,拓元智慧可以快速做到对人外观形象、神态动作及语音语调的模仿和复刻;而在大脑层,拓元智慧可以相对拉齐人的意图、兴趣和价值观。在整体效果上,"我们的数智人会1:1复刻人的外形、声音和动作,还有个性偏好,也就是实现'真人复刻'。"拓元智慧表示。

这两层能力背后的主要的支撑除了大模型外还有两个主要的模块,分别是因果模型和心识模型。拓元智慧介绍,因果模型的引入会提升AI生成的内容效果,如让数智人的外观构建、声音动作模仿的过程更加符合常识、稳定和可控。而心识模型会更好地模拟人的价值观,与大模型、因果模型融合从而实现人机互动与协同。

也基于此,拓元智慧当前构建了公司的第一个标准化产品——元分身。元分身主要帮助内容分享者制作从声音到形象的真人数字分身,可广泛应用于IP型短视频创作、企业宣传、模拟真人直播等场景,解决以下三大痛点:

1.提升内容创作效率和质量:仅需一次建模,即可不断创作视频,帮内容创作者省去繁杂的拍摄过程,让时间回归创作本身。

2.发布内容可控稳定:视频由数字分身以最佳状态演绎,内容通过文字驱动,发布的作品可以通过图灵测试(非专业人士难辨真假),并且支持大规模批量视频生产。

3. 基于数字分身实现多模态人机交互:赋予数字分身各类行业知识及了解用户意图的能力,用高度自然的方式链接及服务用户。

另外拓元智慧还表示,公司当前的制作价格是传统视频拍摄、制作的1/10甚至更低,相对做到了成本的降低和批量化生产。这背后也和公司的技术路线相关,拓元智慧林倞介绍,当前在业界,关于大模型的一个痛点是搭建成本和对数据的要求较高,而如果调用第三方的大模型,也会涉及到难以进行针对场景进行调参和训练的问题。对此,拓元智慧在模型架构上进行了优化,通过引入面向多模态生成的通用大模型,构建少标注、低成本的模型训练和场景迁移能力,从而实现形象模仿、声音复刻、文本重构和对话生成等多样化内容生成。

在整体差异化上,拓元智慧表示,当前业内具备构建AI"大脑"能力的公司较少。不同的技术背景(如CG、NLP、3D建模等)决定了大家通过不同的路径构建虚拟人和数智人。这其中也会产生效果差异,比如,CG和3D建模仍在努力解决流程复杂且无法模拟大脑智能的问题。综合来看,公司表示,拓元智慧是较少能做到将认知层AI和感知层AI融合、应用好的厂商。

当前,公司的主要产品元分身平台已经发布月余,多个头部客户已呈现复购趋势。接下来,公司还计划打造元销售、元陪伴等产品,在销售和情感关怀场景落地。"不论是元宇宙还是内容创作,都可以挖掘出不少实实在在的需求,这些机会也必然会促进人工智能技术与应用场景快速融合,创造新的价值。"林倞总结表示。

web3.0教程