聚力维度赵天奇:打造高精度虚拟数字人,做AI生产端平台领军者
技术创新,助推数字人快速普及。
图 | 聚力维度CEO:赵天奇
2022,“人”潮汹涌。
镁客网注意到,伴随着去年以来“元宇宙”概念在世界范围内的走红,几年前还籍籍无名的“数字人”一跃成为了新的技术与产业明星,吸引了无数资本与创业者的目光。
在现实生活中,数字人的需求正在迎来“井喷”般的增长,目前已广泛应用在包括金融、直播、游戏和影视等多个业务场景中,帮助这些行业起到了降本增效的作用。
需求的旺盛、资本的投入与创业者的争相入局自然推动了产业的发展。根据艾媒咨询提供的数据:2021年中国数字人产业市场规模和核心市场规模分别达到1074.9亿元和62.2亿元,预计2025年将达到6402.7亿元和480.6亿元。
但在当下数字人产业“野蛮生长”的阶段,也不乏一些乱象产生。记者注意到,目前各个行业和用户对数字人技术了解仍然不多、技术创新较为缓慢,一些低质高价的产品也已经进入市场。中国数字人产业急需尽快多方面“破局”,走向真正的高质量发展。
镁客网注意到,创立于2016年的北京聚力维度科技有限公司(以下简称:聚力维度),是目前国内在数字人创新技术研发方向上的佼佼者,也是世界范围内少有的可以同时实现“高级别+实时驱动+普及应用”这被称为“元宇宙数字人三要素”的人工智能企业。于是,我们邀请到了聚力维度的CEO:赵天奇,就数字人当下在中国的发展情况、元宇宙与数字人的未来,以及数字人产业前景等话题进行了深入的交流。
1、元宇宙概念推波助澜,数字人赛道风起云涌
“从驱动的主体不同,数字人可以分为由AI驱动的数字人,和由真人驱动的数字人两种。”在谈到数字人的具体分类时,赵天奇这样表示。
记者注意到,目前市面上AI驱动的数字人和真人驱动的数字人的应用场景相互交叉。但在交互体验上,AI驱动的数字人还远谈不上理想。毕竟就现在的技术来看,人-机关系与人-人关系的体验之间还不可同日而语。赵天奇认为,AI要想提供和人一样真实的交互体验,可能还要花费十几年的时间。因此,真人驱动数字人目前是更有前景的数字人发展方向,也是聚力维度目前的主攻方向。
实际上,早在2017年,聚力维度就已经选择将数字人作为创业方向,在记者看来,这是个颇为大胆的决定,毕竟当时元宇宙还没“起风”。
“当时我们做,人家都不知道我们是干什么的”,赵天奇对记者笑言,“只好说我们是做影视动画的,这样大家还好懂一点,但这种描述毕竟是不准确的。
聚力维度在2017年开始定位研究数字人相关技术的时候,也没有预测到将来会有‘元宇宙’的概念深入人心。我们只是认为数字人有价值,是社会发展到这个阶段的一个必需的技术。2021年我们赶上了元宇宙这个时代,确实是非常好的一件事情。”
尽管元宇宙已经是一股巨大的“推力”,但在赵天奇看来,数字人赛道仍然处于行业早期,目前各家企业之间还远谈不上是竞争关系——“蛋糕做的还不够大”。
究其原因,用户层面依然对数字人缺乏广泛且深入的认知,且行业内普遍长期没有突破技术“瓶颈”,这些都在限制着数字人产业的发展。尽管在技术上聚力维度已经成功实现了用单个摄像头打造高水平数字人捕捉,降低了技术门槛,但行业整体的技术水平突破仍然需要一定的时间。
而在用户层面对数字人的“认知”上,赵天奇认为,依然需要借助元宇宙的发展趋势。
“我认为可以把元宇宙的变革分为两个大阶段、第一阶段可以称之为‘小元宇宙’的阶段,实现了用数字人技术为他人服务的目的,构建起了完整的内容创作生态;第二阶段可以称之为‘大元宇宙’,所有人都拥有数字人,真正实现生活、娱乐、工作等方方面面都在元宇宙中。
距离我们更近的‘小元宇宙’,又可以分为三个阶段。首先,我们预计今年年底到明年年初,会有元宇宙新的内容和上千个数字人被普及到元宇宙生态中,形成用户认知上的第一个爆点;第二、三个阶段将在明、后年到来:通过第一阶段大量元宇宙内容和上千个数字人对行业的教育,数字人可能会进一步达到十万量级,真正形成一个产业;后年数字人将有望达到百万级,真正形成数字人内容创作上完整健全的生态。”
2、理想构建于现实之上,选对方向比努力更重要
赵天奇告诉记者,目前谈及数字人的相关技术,科研界一般将其分为四块:建模、驱动、渲染和交互。在他看来,尽管这四个环节承担了各自的任务且缺一不可,但对于聚力维度来说,建模和驱动明显是更为合适的创业方向。
“简单地说,建模相当于在数字世界中得先有个‘人’;驱动就是让‘人’动起来;渲染包括了‘人’是否好看、动作是如何具体显示在大家面前的;交互就是让数字人与数字世界和现实世界等方方面面的对象进行现实或超现实的互动。
但对聚力维度来说,我们选择研究的技术是驱动和建模。渲染技术的行业整体水平已经很不错了,是已经被‘解决’的环节;交互则正相反,现实中的需求还远远不足。”
记者注意到,在这种“创业方法论”的指导下,聚力维度找到了中国数字人产业目前真正的痛点:价格高:单个高级别数字人定制百万起步;时间长:单个高级别数字人定制最少需要3个月时间;驱动技术、硬件、场地等要求限制无法普及使用。而这些痛点实际上都受到了建模和驱动技术的制约。
聚力维度目前推出的高级别虚拟数字人AI生产端平台——“赛博演猿”,则在建模和驱动两方面都做出了自己的独特优势:通过自主研发的算法等技术,在按具象要求定制的建模方面,实现了全流程制作时间压缩至行业的1/3,价格却只需行业的1/2;按非具象定制需求的建模方面实现了快速上手投入生产使用,模型价格上低至几万元。
在驱动方面,聚力维度做到了“0+0+0”。即0穿戴:不穿戴任何设备即可驱动虚拟形象;0外接设备:无需任何外接设备,即可精准捕捉上千个面部微表情;0门槛:实现动作捕捉,仅需单个家用普通RGB摄像头即可。
“我们认为,通过推进建模和驱动这两项技术,让每一个人都可以拥有数字人,同时还能够用自己的表情和动作等非常方便的方式,去驱动这个数字人创作各式各样的内容。
另外,在建模和驱动技术上的‘护城河’也是聚力维度的优势所在:我们最早发现这个方向、最懂这个方向,也是最先解决这个方向的技术难题的。目前从整个行业看,如果有第二家企业想追上聚力维度的技术水平,至少也要花费两三年的时间。所以创业角度来说,我们也希望利用好这两到三年‘人无我有’的窗口期,真正把整个产业真正做起来。”赵天奇这样告诉记者。
3、创业艰辛需厚积薄发,不忘初心让科幻成真
记者注意到,在聚力维度推出“赛博演猿”之前,公司也曾长期布局影视赛道,推出过产品“人工智能立体设计师——峥嵘”,其能自动将2D视频转换成3D视频,可将院线级3D转制效率提升1000多倍,获得了业内的广泛好评。而在开发这款产品时所获得的技术积累,也为今天聚力维度在数字人赛道的领先提供了深厚的技术铺垫。
“如果不考虑元宇宙这个新场景,人工智能2D转3D技术和我们现在做的人工智能数字人技术都可以被认为是人工智能与影视制作行业相结合的技术,在赛道上说是比较接近的。也正是在人工智能2D转3D赛道上的积累,让聚力维度在如何用人工智能完成影视行业的高标准与高要求有了深厚的经验和自信。
另外从具体技术来上说,人工智能2D转3D技术可以实现用“单眼”来理解画面的深度关系,这对我们现在的‘赛博演猿’用单摄像头就能非常好地实现动作捕捉特别有帮助,也是这款产品技术上的优势所在。”
记者注意到,借助同时实现“高级别+实时驱动+普及应用”的技术优势,聚力维度的“赛博演猿”已经广泛服务于各行各业,包括了运营商(移动、联通和电信)、游戏(完美世界)、媒体(凤凰卫视)和个体UP主等等。
并且,借助着产品“价低质高”的优势和快人一步的产品理念,目前聚力维度逐渐开始了对海外市场的探索,包括亚马逊等海外客户都开始了与聚力维度不同方式的合作。
在采访的最后,赵天奇充满乐观地对记者表示:“就像我们的核心实验室叫‘科幻成真实验室’一样,‘科幻成真’是我们的理念和存在的意义,希望把业内之前做不出来的产品能够变成现实,这也是我们的使命。”
可见的是,在中国数字人产业狂飙突进的今天,创业者不仅需要满足用户的多样化需求,更需要坚实的自主核心技术来保持独有的竞争力。雄关漫道真如铁,未来聚力维度等专注于数字人技术开发的中国企业,将怎样为中国数字人产业乃至中国元宇宙产业添砖加瓦?镁客网将继续保持关注。
最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!
硬科技产业媒体
关注技术驱动创新