本周,2021年中国国际服务贸易交易会在北京落下帷幕。在此次的服贸会上,新技术和新产品层出不穷。其中,利用了人工智能技术的虚拟数字人主播尤为惹人关注。
据介绍,这些虚拟数字人主播采用了TTS数字语音合成、计算机图像处理、NLP自然语言处理等人工智能技术,主要用于各个短视频平台的电商直播间,可以7×24小时不间断进行直播。数字人主播不仅可以实时与观众进行互动,还能表演各类才艺,从而引导观众停留更长时间。
除了数字人主播之外,本届服贸会上还展示了诸多数字人技术的实际应用。凌云光对外展示了冬奥手语播报数字人系统,这一系统将在北京东奥会期间正式投入应用进行赛事报道,为听障人士提供更加便捷的服务。
无独有偶,近期新华社媒体融合生产技术与系统国家重点实验室与腾讯互娱NExT Studios工作室共同打造的全球首位数字航天员、新华社数字记者小诤也发布了更多信息。
今年6月份,新华社已经陆续发布了多条有关中国空间站的介绍视频,向大家介绍空间站情况的就是这位数字记者小诤。三位航天员返回地球之前,小诤还会持续地输出航天科普内容。
二十世纪七十年代开始,“数字人”这个概念就已经诞生。随着近几年人工智能技术的不断演进,游戏行业中涌现的一些新技术让数字人的制作过程得到了有效地简化,使得数字人成功地进入了公众的视野之中。
现在数字人不仅达到了照片写实级逼真程度,还具备了表达情感和沟通交流的能力。一些厂商使用数字人技术应用到大众娱乐中,虚拟偶像就是数字人技术蓬勃发展下的新风口。
然而,数字人可以发挥的效用远非娱乐产业那么简单。虚拟互动技术的扩展,让数字人已经可以发挥一些常人无法企及的作用,尤其是医学、矿学和航天学等精细或危险领域。未来,数字人技术势必会进一步发挥其社会价值,造福全人类。
01 数字人技术发展史:立体化、仿真化、智能化是未来
要了解一个事物,首先要明确他的定义。笼统地说,通过3D图像软件或其它模拟仿真工具制作,以数据形式存在的人与类人角色,都可以算作数字人。与具备实体的机器人不同,数字人依赖显示设备存在。人类的外观、行为和思想是判断数字人的三个重要特征。
上世纪90年代,美国科学家们就提出了可视人计划。这一计划的目的就是要把人体进行数字化,然后在电脑中合成三维的人体结构。这一计划也被看作是数字人的雏形。自此之后,数字人技术开始了漫长的发展之路,一直延续至今。
CG和动作捕捉技术没有出现的时候,人们只能用手绘来实现数字人的构想。1984年,英国人George Stone创造出了一个叫做Max Headroom的虚拟人物,这个虚拟形象参演了一部电影,并且还拍摄了很多支广告。受制于当时的技术限制,Max Headroom的人物形象就是手绘完成的。
到了本世纪初,3D技术在影视行业的普及让数字人这一话题再次活跃起来。《指环王》中咕噜和后来《猩球崛起》里凯撒的形象,代表了CG技术与动作捕捉结合所激发出的潜能。2007年,日本制作出世界上第一个被认可的虚拟偶像初音未来,意味着数字人开始深入人们的生活,人们可以在公共场合直接看到它们。
即便是当时的初音未来,我们也很难把他和数字人相提并论,因为他并不具备识别外界环境、并能与人交流互动的能力。
近五年来,深度学习算法和人工智能技术得到了突飞猛进的发展,数字人的制作过程得到有效简化,人们逐渐得以实现最初的构想。2018年,搜狗与新华社联合发布了全球首个全仿真智能AI主持人,拉开了数字人应用在社会场景中的序幕。
数字人技术发展到今天,高保真、智能化和工具化是其三个重要的技术方向。视觉表现上,主流公司已经可以做出从外形、表情到动作都1:1还原真实人的高保真虚拟人;人工智能技术使虚拟人初具智能和情感表达;而开发便捷的工具可以让厂商们实现批量生产。
正是在这样的技术趋势下,催生了一批专注数字人技术的工作室,NExT Studios就是其中的代表。NExT Studios 2017年开始探索实时高保真数字人技术,在高保真数字虚拟人领域已有数年深耕和积累,并于2018年联合世界各地的多个先进团队,推出了代表当时业界最高水平的高保真实时数字人Siren。
这些技术方向的背后,其实也带出了数字人发展遇到的难点。比如英伟达在今年GTC 2021技术大会黄仁勋的演讲中加入了14秒虚拟人的动画,而这段动画则骗过了所有人。
这段14秒的动画耗费了英伟达极大的人力、时间和成本,难点就是要复制一个“以假乱真”的黄仁勋。英伟达的Omniverse平台包办了渲染、材质、光影和照明等所有工序。而为了配合Omniverse平台,英伟达打造了专业的绘图显卡NVIDIA RTX A2000。
从结果上来看,英伟达突破了高保真的技术难点,但这个虚拟的黄仁勋并不具备情感表达,更不要说可复制性。不过,这短短14秒动画还是震动了业界,因为他们已经从英伟达的身上看到了数字人技术未来无限的可能性。
02 身份发生转变,数字人走入人们的生活
技术的演进只是数字人发展的一个方面,伴随着技术的发展,数字人的形象和功能也在悄然发生着变化。
手绘时代的数字人,他们只能出现在动画、电影和电视中。前面提到的Max Headroom,以及同时段出现的《超时空要塞》里的虚拟歌姬林明美,都是类似的逻辑,观众无法与这些所谓的“数字人”进行互动,只能观看他们进行表演。
初音未来的出现打破了人们对于所谓“数字人”的固有印象。一方面得益于CG技术的革新,让那些平面的数字人变成了立体形态。同时,全息影像技术的出现,使得初音未来虚拟歌姬的身份扩展到了线下。
2010年3月,世嘉在日本举办了第一场初音未来全息投影演唱会,现场2500张门票立即抢购一空,同时还有3万名观众在网络上观看了直播。初音未来此时已经不再是一个电视或者网络上观看的形象,而是变成了一个真正的歌手。
后来,数字人相关的一些技术在游戏领域取得了巨大的突破,包括了动作捕捉以及3D建模,一个个数字人开始在游戏中不断涌现。
近年来,越来越多的影视明星参与到游戏制作中,光是去年就涌现了《赛博朋克2077》和《星球大战:绝地武士团》等多款游戏。有野心的游戏厂商大多会选择知名影视明星进行动作捕捉和3D建模,制作出的主角或者NPC角色其实就是一个具备互动能力的数字人。
到了当下,人工智能和便捷的工具让数字人可以实现批量生产。KizunaAI绊爱出现之后,立即引发了Vtuber的浪潮。Live2D搭配摄像头捕捉技术,大量Vtuber出现在人们的视野中。现在,Vtuber已经形成了一条完整的产业链,背后代表了数字人的批量生产已经走向成熟。
数字人生产的成熟在小诤身上也有体现。小诤项目今年3月立项,NExT Studios抽出15名精英研发人员,和新华社团队密切沟通合作,完成了小诤的数字人资产建模与绑定。目前,小诤已经完成了多次太空报道,涵盖了“天问一号”火星探测任务和中国空间站。这种效率从侧面说明了当前数字人技术的成熟度已经到达了一定的水平。
同时,数字人互动技术的发展,则意味着它们可以扮演更多的角色,从而发挥其社会价值。比如前面提到的数字记者小诤,主要承担了此次神舟十二号载人飞船和空间站情况的介绍。随着技术的进化,小诤在交互环境中的作用将被进一步放大。今后,小诤实时与航天员进行互动,为地面输出具体的报道内容将会成为家常便饭。
虚拟主播直播带货、数字记者报道中国空间站、祝融号数字人发回火星图景。这些案例充分说明了数字人的功能和形象早已不再拘泥于文娱行业,而是走向了各行各业。
03 陪伴感吸粉无数,数字人的未来可能性无限
和早期的数字人不同,当下数字人技术上可以替代人类去处理一些高风险的工作,同时与普通人之间的连结更加紧密,亲切感、陪伴感和引领感尽显。数字人角色的不断转变,加上这些特质,让大众看到了它们身上的可能性和社会价值。
众所周知,医学是精细程度和危险性都比较高的领域,虚拟互动技术的扩展让数字人技术可以通过数字展示形式和触控互动方式,为临床医生、医学规培生和医学生提供完整充实的学习参考资料,彰显了数字人在高风险领域的作用。
一些行业人士认为,虚拟主播能够大火,背后体现的是个体化社会中对于陪伴感需求的旺盛。当下年轻人普遍个性较强,表达欲旺盛,且具有一定的孤独感。对于这部分群体而言,三次元主播很难打动他们。
相比之下,一些脱胎于三次元真人的虚拟偶像,能够比较快地打破第一印象,不会受到时间与空间的限制,容易打动年轻人。比如由唱见转型出道的虚拟艺人泠鸢yousa,凭借着优秀的唱作能力吸引了无数粉丝。
这种陪伴感如果引入到宣教领域,潜力也是非常巨大的。比如前文提到的数字记者小诤,通过实时渲染、等技术,链接用户产生更多互动,打破虚拟与物理世界界限,形成IP效应之后可以推出更多的衍生产品。而小诤作为数字人具有的陪伴感也能让年轻人接受航天知识的科普。这背后体现的正是数字人与科技教育领域的结合点。
过去,人们把影视作品看成是向公众普及科技知识的最佳载体,《星际穿越》就向公众普及了什么是虫洞,近期的《你是我的荣耀》也通过爱情剧的形式宣传了中国航天知识。这种软性的宣传永远要比《火箭侠》一样粗制滥造的作品能够争取到受众。现在,有了小诤这样的强陪伴感的数字记者,航天知识对于年轻人群体将会更具穿透性。
除了上述提到的这些社会价值之外,海外数字人的社会角色更加多元,甚至已经进入了办公领域。
上个月,Facebook推出了一款名为Horizon Workrooms的VR会议软件。这款软件最大的亮点莫过于营造了一个虚拟的数字空间,在这个空间中佩戴Oculus Quest 2用户可以自行创建数字人形象进行线上会议。
Horizon Workrooms是Facebook元宇宙构想的重要组成部分。后疫情时代,居家办公成为常态的情况下,这种数字人构成的线上会议将会成为行业的新趋势。
游戏技术革新带动了虚拟数字人技术的进化,实现了游戏与现实世界的连结,进而发挥更大的社会价值。数字人技术已经将诸多不可能变成了可能,存在于科幻小说中的世界,距离我们或许真的并不遥远。