通过UP主的介绍,要实现和AI“奶奶”对话并不是那么麻烦,只需要使用几个现有的AI工具即可:
首先,UP主将自己和奶奶的照片上传到AI绘画工具Midjourney上,生成具有个人特征的AI画像。
刚刚经过5.0更新的Midjourney显然能够胜任这项任务,在生成了多个图像之后,这张无论是从皮肤细节还是神态来看,都是最合适的。
在人像处理好之后,声音的处理也是必不可少的一环。
UP主接着将奶奶的录音利用音频处理软件切割成3-15秒的短句,继而通过AI Studio平台的语音合成项目中,使用这些录音切片训练并合成属于奶奶的AI语音包。
在对话方面,为了让“奶奶”的话语更接近真实,UP主选择了当前最优秀的AI对话模型——ChatGPT。
通过训练ChatGPT学习奶奶的家庭背景和生活习惯,尝试让它以奶奶的口吻进行交流。
UP主使用的是3.5版本的ChatGPT,4.0版本表现会更好
最后一步,则是将这些画面和语音合成到一起,输出一个既能够用自己的声音说话,还能根据对话内容产生面部和嘴部变化的视频。
当然依照目前现有的AI技术,想要一直和“奶奶”交流是不太可能的。
就像在我之前所写的一篇“将ChatGPT调教成二次元老婆后,技术宅决定给她安乐死”中,就提到过ChatGPT只能够记忆大约3000个单词。
而即便是目前GPT已经升级到4.0,能够记忆大概2.5w个单词,但长期对话之后,它依旧有可能缺乏上下文的连贯性,并且失去“奶奶”本身的说话习惯。
但是以目前AI技术的迭代速度来看,或许在未来真的能够利用这些技术,塑造出一个真人在虚拟世界的完美映照。
少为人知的FFyasueda的半生。
中国有句古话叫做“识时务者为俊杰”。
只是懂lsp还不够,还得懂玩家