除了画面的高质量,此次直播备受关注的还有鹿鸣的配音。在直播简介中,鹿鸣的声音一栏赫然填写着“逆熵AI生成”,引起了非常多的讨论。
米哈游的逆熵科技早在2020年就已经成立,主攻基于DeepLearning等AI技术来提升内容生产效率,说到底就是要追求游戏制作的工业化。而鹿鸣的AI生成语音便是逆熵科技的研究成果之一。这一成果早在2021年的一段鹿鸣视频中就已经有所展示。
“AI生成”这一说法其实有些暧昧。鹿鸣的语音到底是后台程序员手打文字让AI按台本念出来的,还是直接将动捕演员的声音通过AI重新输出为鹿鸣的声音,各方网友观点莫衷一是。
从直播效果来看,鹿鸣的声音明显没有电子音的感觉,音色更接近真人,说话非常流畅,这说明在语音输出方面鹿鸣已经能做到以假乱真。但鹿鸣在与观众互动时的现场效果,在活跃气氛与展示自身性格方面还是有些生涩。直播后段,鹿鸣连续跳舞之后会带有明显的喘气声,舞蹈时拍手的声音也录入到了声音里。有观众根据这些细节推测鹿鸣直播背后依然有中之人,只是大家听到的不是中之人本人的声音,而是经过AI合成后的鹿鸣声音。
关于这一点,大伟哥2019年在他的母校上海交大的一次演讲中就讲解过。据他介绍,逆熵AI的目标是通过深度学习记录配音演员的声音和情感,做到输入文字就能输出对应的配音。未来还可以将声音塑造成IP,永久保留,甚至出售声音的版权。
鹿鸣直播时的AI生成语音已经达到了大伟哥预期目标的哪一步,现阶段尚不明确,但若是真的只靠文字输入就能达到媲美真人的语音输出,并且还能带上真人特有的感情色彩,这无疑是令人兴奋的技术突破。
而对于务实的米哈游来说,逆熵的AI语音系统其实已经有部分进入实际应用阶段。此前在《崩坏:星穹铁道》内测时,米哈游就做到了让所有角色的口型都能与不同语种的配音匹配。这个匹配口型的细节工作之所以能够高效率地完成,其中很可能就有逆熵AI的功劳。
鹿鸣此次直播,背后体现的是米哈游这两年来的技术积累。有人怀疑此次直播只是录播,有人推测互动情节都是按台本演出。30分钟的实时渲染到底需要多少硬件支持,烧掉多少成本?在米哈游公布技术细节之前,这些问题暂时都还没有答案。
但正如有评论指出的,当大家开始认真讨论鹿鸣背后到底是中之人还是AI时候,米哈游此次直播的目的就已经达到了。
米哈游的野望
米哈游做这次直播其实是有点醉翁之意不在酒,它的目标已经不止于虚拟直播这个圈子。
如今的米哈游现金流充裕,并不需要通过画饼一个虚拟偶像去寻求投资或提升估值,以鹿鸣切入虚拟主播这一行似乎也并非它的目标。正如大伟哥在讲演中所说,鹿鸣直播之后的下一步,更有可能是进行技术输出,将成熟成套的技术打包成工具包提供给更多的内容创作者。
米哈游此前就在积极投资脑机接口、核聚变等公司。就在7月18日,米哈游又出资1亿元与三七互娱等公司成立创投基金,物色VR/AR等领域的初创公司进行投资。这些动作都反应了米哈游未来想进军硬件甚至钻研更底层技术的野心。
当然,这条道路并不是那么好走。竞争对手非常多,且都有各自强项。像上文提到促使米哈游决定开启鹿鸣项目的虚拟人Siren,其实正是腾讯NExT Studios与Epic合作推出的高保真虚拟人项目。如今腾讯基于UE4引擎创造的星瞳已经实现周更直播,《和平精英》虚拟数字人吉莉、《王者荣耀》虚拟男团“无限王者团”也相继上线,星瞳更是在UE5引擎上市后第一时间推出基于新引擎的短片,在技术赛道上极力抢占高地。而在腾讯身后,网易、百度、字节等公司这几年也纷纷推出自己的虚拟企划,各显身手。
作为一家两年前还被当作“初创公司”看待的企业,米哈游如今已将“上海四小龙”的其它三家甩到身后,成了财经媒体口中紧随腾讯、网易之后的国内游戏厂商“第三极”。外界之所以对米哈游有如此高的期待,就在于米哈游对技术有近乎执着的追求,而颠覆往往产生于追逐技术的过程之中。
鹿鸣直播只是米哈游的一次阶段性成果,面对强大的竞争对手,米哈游要想实现自己的二次元伟业还有很长的路要走。在大伟哥的愿景中,他是希望所有在未来进入米哈游HoYoverse虚拟世界的用户都能拥有自己的虚拟化身。鹿鸣只是一个开始,让每一个阿宅都能创造属于自己的鹿鸣或许才是米哈游的终极目标。
一夜之间,年轻人集体换上了“业主群闹事头像”。
老实说,袈裟还是得争取的
游侠网有幸采访到了11 bit工作室联合项目主管兼首席设计师 Jakub Stokalski先生和11 bit 工作室联合项目主管兼艺术总监Łukasz Juszczyk先生,在采访中他们为玩家们揭露了关于游戏设计的大量信息,下面让我们一起来看看吧!