游戏版ChatGPT,要用AI实现NPC自由

2024-01-09 20:21:37 来源:游戏主播网

游戏版ChatGPT,要用AI实现NPC自由

还有谁能阻挡微软吗?

在公司成立近50年后,老牌巨头微软在近几年强势崛起。2023年,更是微软的大年,一方面对动视暴雪超过700亿美元的惊天收购顺利完成,让公司一举成为全球第三大游戏公司;另一方面,作为OpenAI的最大“金主”,借着ChatGPT东风,微软又一跃成为科技巨头中的“AI领头羊”。

目前,微软市值已达2.73万亿美元,和老对手苹果只差9000万美元的差距,反超似乎就在一瞬间。

最近,一单不太受关注的合作,似乎暴露了微软的下一步的目标——将游戏和AI结合起来。

不久前,微软和AI初创公司Inworld达成合作,将引入基于AI的“角色引擎”及“Copilot助理”,为开发者提供一系列开发工具,以创建更真实、动态的NPC。

对于此次合作,微软称“利用先进的AI技术,为游戏中的NPC注入更多的交互力和生命力,从而提升游戏的沉浸感和体验感。”

所以,Inworld这家初创公司,到底凭什么拿到超过1亿美元的融资,并且抱上了微软的大腿?双方的合作,又会让AI对游戏产业造成怎样的影响?

一、如何打造AINPC?

三年前,一部好莱坞大片《失控玩家》(FreeGuy)让大家意识到,一个有了自主意识的NPC,可能会把一个游戏“霍霍”成什么样。

但事实是,如果一个游戏里的NPC真的能有“意识”,可能会帮游戏公司一个大忙。因为NPC这个东西,开发起来真的太麻烦了。

一款有着复杂剧情大型RPG游戏中,需要开发无数个NPC。例如,《荒野大镖客2》中有超过1000个NPC角色,每个NPC都有自己的歌手、美术作者和配音演员,分布在6个章节的100多个任务中,耗时近8年、研发成本接近5亿美元。

尽管如此,研究显示,52%的玩家都在抱怨目前的NPC“只会重复对话”,99%的玩家在期待更智能的NPC,甚至有81%的玩家愿意为其支付更多费用。

因此,Inworld希望打造有“灵魂”的NPC,通过用生成式AI来驱动NPC行为,使其动态地响应玩家的操作,从而提升游戏“沉浸感”,同时降低开发成本。

作为游戏界的新秀,目前,Inworld获得的融资总额已超过1亿美元,公司估值也已经达到5亿美元,成为了AI+游戏领域资金最充足的初创公司。

可见,Inworld的差异化竞争优势在于提供“个性化”的AI会话功能,而不是像OpenAI和Google等老牌厂商,提供由通用的机器学习模型驱动的AI对话。

虽然加入AI大模型后,NPC有了更多对话可能性,但面部手势、肢体动作、情感语气也要有相应的表现,NPC才能更流畅自然地与玩家对话。

因此,Inworld让文字、声音及图像成为相互训练的数据,并在以GPT-3为核心的大语言模型的基础上,整合了多个大模型、音频模型以及30多个机器学习模型,打造了一个多模态开发引擎——“角色引擎”(CharacterEngine)。

这些模型专责内容生成、信息处理、情绪感知、关系维护和行为预测等多个方面,从而支持多模式角色表达。

因此,“角色引擎”(CharacterEngine)打造出的AINPC可以模仿人类互动的深刻社会属性,表现出“复杂”而“逼真”的人类行为,可用于任何角色设计,从而帮助开发人员增强游戏性,提高玩家参与度。这也正是Inworld的强大之处。

事实上,“角色引擎”(CharacterEngine)的技术架构着眼于构建一个模拟人脑的复杂系统,由三层组成,分别是角色大脑(CharacterBrain)、情境网格(ContextualMesh)和实时AI(Real-TimeAI)。

角色大脑(CharacterBrain):这层旨在用AI技术赋予NPC近似于人类的认知、沟通和行为能力,还能让AINPC从互动中学习成长。用情商处理人际关系,并具有记忆和回想能力,能够自主发起目标、执行行动并遵循自己的动机,从而推动故事发展,融入更广泛的玩家体验。

情境网格(ContextualMesh):这层旨在通过允许开发人员为内容和安全机制、自定义知识和叙事控制设置参数,从而防止可能破坏叙事流程的AI“幻觉”或违背游戏逻辑的互动,确保了AI角色在各种交互场景中的一致性和合理性。

实时AI(Real-TimeAI):这层针对实时体验进行了优化,可提供可扩展的低延迟交互,实现以更快的推理速度和更低的成本实现高质量互动。

简而言之,“角色引擎”(CharacterEngine)的技术架构,不仅模拟了人类大脑的复杂结构,还涉及记忆处理、决策制定和情感演变的深层模拟,大大增加了玩家的“沉浸感”。

为了让用户和开发者快速构建并在游戏或应用中部署AI角色,Inworld构建了AI虚拟角色的生成平台——InworldStudio,还提供了给游戏开发者接入Studio中NPC的SDK(软件开发套件)。

在InworldStudio创建NPC非常简单,无需任何代码,输入自然语言就能快速创建。

用户登录后,首先需要用几句话设定好NPC的身份,并调整角色的个性组合,然后可以通过设置关键词,来决定该NPC的生活状态、背景认知、目标动机、情绪记忆等等,还可以设置具体问题进行固定对话。

在完成AI角色的创建后,可以使用与常用游戏引擎Unity、UnrealEngine、Roblox等相适应的SDK,快速实现角色与游戏场景的集成,大大提升交付速度,实现一次构建,随处部署。

还值得一提的是,Inworld生成的虚拟角色在准备正式进行交互和测试之前,会经历一个“训练”过程,可以选择通过Inworld的Oculus配套应用程序在VR中进行。

对此,Section32,inf的执行合伙人AndyHarrison表示,“Inworld的AI平台消除了开发智能虚拟角色的复杂性,具有开启各种全新在线体验的潜力。”

目前,Inworld采取了订阅制的商业模式,不同的定价标准取决于集成时间、超时费用、功能多样性以及定制化程度,主要采取了四种不同的标准,分别是免费、10美元/月,50美元/月和定制收费。

Free:无限制互动时间(不包括Arcade)、每天200分钟集成互动时间、无限次数的角色创造。

Starter:无限制互动时间(包括Arcade)、每天1000分钟集成互动时间、可创建多个Workspace。

Professional:每天5000分钟集成互动时间、超低超时费用、可分享Workspace、具有分析功能和Beta功能使用权。

Custom:高级叙事与安全控制、定制化和声音克隆、定制化集成与数据、离线模式、客户服务。

Inworld的商业化路径是为小型游戏工作室和个人开发者服务;其次,与大型游戏厂商合作定制化项目,帮助他们建立和整合角色。

尽管如此,Inworld的商业化前景目前还不明朗,面临着来自游戏引擎、游戏厂商,和其他Chatbot的三重竞争压力。

二、“角色大脑”背后的人

Inworld成立于2021年7月,总部位于美国硅谷,由IlyaGelfenbeyn、MichaelErmolenko、KylanGibbs共同创立,三人分别担任CEO、CTO和CPO。

这三位创始人都在AI领域有着丰富的工作经验。

IlyaGelfenbeyn、MichaelErmolenko之前创立了API.AI。这家公司被Google收购后更名为Dialogflow,合并到了GoogleCloud之中,成为了市场上最受欢迎的对话式AI平台。KylanGibbs曾在DeepMind担任应用生成语言模型产品的产品总监。

从过去的经验,他们发现语音、文字等单一应用的生成式AI市场已被苹果、Google等大企业掌握,但很少有平台能同时做到文字、声音及图像的生成,于是,Inworld尝试填补这个空白。

因此,Inworld团队的目标是开发能够学习、适应并与玩家建立关系的AINPC,同时提供高质量的性能,并保持游戏的“沉浸感”。

事实上,Inworld创立之初的目标是为元宇宙提供自由互动的虚拟人,但元宇宙发展缓慢,而大语言模型迅速崛起,团队看到了LLM与NPC结合的机会,便把目标调整为提供虚拟角色的“大脑”,同时希望能将技术应用到整个泛娱乐行业。

正如Inworld创始人之一,IlyaGelfenbeyn所解释的,“我们提供的是一个工具集,使开发人员能够为世界、不同类型的环境添加大脑并构建这些角色,使这些虚拟世界更加吸引人。”

除了构建AINPC,复刻现实生活中的“社交关系”,打造虚拟世界“生态”,也成为了Inworld发展的重心。

因此,Inworld鼓励用户,创建虚拟世界的本地人口、虚拟影响者、以及可以与用户建立关系,并解锁更深入参与的数字人类。

构建真正智能的虚拟角色是复杂的,需要大量的专业化技术支撑。Inworld目前仅自行开发了NPC的“大脑”,但NPC创建的生态系统还包括视觉、Avatar、硬件、运动等,因此Inworld建立了与这些系统兼容的产品,目前3D角色模型由ReadyPlayerMe提供。

凭借独特的“优势”,创立之初,InworldAI就完成720万美元的种子轮融资,该轮融资由KleinerPerkins和CRV共同领投,Meta参投。

几个月后,Inworld又受邀加入“迪斯尼孵化计划”(DisneyAccelerator)。迪士尼将为其提供指导、投资资金以及进入迪士尼创意园区共享工作空间的机会,共同打造沉浸式体验的未来。

2022年8月23日,Inworld宣布完成5000万美元的A轮融资,该轮融资由IntelCapital与Section32领投,微软风险投资基金M12和NTTDoCoMoVentures跟投。

新的投资将主要用于研发、人员招聘、基础设施的投资,以及推出开源版本的“角色引擎”(CharacterEngine)。

对此,InworldAI的联合创始人之一,MichaelErmolenko表示,“InworldAI对开源的承诺证明了我们的信念,即合作推动创新。我们将与开源开发者社区合作,推动生成式AI的创新,提升整个游戏产业。”

目前,InworldAI已经为TeamMiaozi(网易游戏旗下)、Niantic8thWall、LGUPlus(韩国第三大移动运营商)、AlpineElectronics、Skyrim、StardewValley以及GrandTheftAutoV等提供了AI驱动的NPC。

更有开发商大方承认,“玩家的参与度、满意度和留存率都得到了提高。”

如今,InworldAI已成为开发者值得信赖的资源,开发者纷纷涌向该平台。为包括元宇宙、VR/AR、游戏等在内的沉浸式现实,创建虚拟角色,激发着新形式的游戏和媒体。

三、AI革新游戏行业

一直以来,技术的局限性和可能性都决定了开发者所能创造的游戏世界。大型语言模型和生成式AI的出现,为游戏中的故事讲述和角色参与带来了无限的可能性。

InworldAI的联合创始人之一KylanGibbs表示,“AINPC背后的技术将成为故事讲述、创意表达和创新游戏新时代的催化剂,未来的大部分游戏将是我们尚未想象到的游戏。”“最终,AI技术的普及,将使游戏开发过程中的普通玩家也能参与到内容创作中来,形成玩家驱动的叙事,强化游戏循环。”

风险投资公司KleinerPerkins的首席产品官BingGordon也表示,“AI将重塑游戏玩家和游戏设计师的世界,将玩家置于幻想的中心,实现真正身临其境的世界和复杂的叙事。”

这对于游戏公司和游戏开发商来说,这将是一个巨大的机遇。

从脚本对话转向玩家驱动的动态叙事,将提高游戏的沉浸感,从而提高游戏的可玩性、留存率和收入。

对此,英特尔投资公司董事总经理SriniAnanth也公开表示,“对沉浸式内容和体验的需求正在不断上升,这将带来蓬勃发展的创造者经济,并为个人开发者带来机遇。”

事实也的确如此。

财报显示,微软在游戏和AI领域的研发投入已连续多年保持增长,与此同时,竞争对手如索尼、任天堂等也在不断加强自身在游戏AI技术方面的研发。

2023年2月,网易《逆水寒》手游已官宣实装国内首个“游戏GPT”,其游戏内的智能NPC系统完全由AI驱动。

完美世界也相继成立了AI研发中心,并已将AI相关技术应用于游戏中的智能NPC、场景建模、AI绘画、AI剧情、AI配音等方面,《神魔大陆2》将落地智能NPC等。

与此同时,Unity也声称正在为游戏创作者构建AI游戏开发工具的生态系统,切入UGC游戏制作的市场。

不过,AI大模型想要在游戏领域大规模落地,还需要解决昂贵的算力成本。可以说,在初期,这些巨额成本可能是阻碍智能NPC普及的重要原因。

除了对游戏公司和开发商的意义外,AI的普及还将为长期支持游戏行业的芯片公司带来机会。

多年来,功能强大的芯片与游戏之间的互动,一直是Nvidia成功故事的一部分。

今年5月,英伟达更是宣布将提供定制AI模型代工服务——AvatarCloudEngine(ACE)forGames。开发者可以使用该服务在其软件和游戏中搭建和部署定制化的语音、对话和动画AI模型。英伟达称,“该服务通过AI驱动的自然语言交互为NPC带来智能,从而改变游戏。”

最近,英伟达性能技术副总裁JohnSpitzer还公开表示,“所有开发人员都对AI影响游戏开发过程的方式感兴趣。他将为NPC的一个关键测试提供硬件支持。”

Inworld的尝试,或许也预示着游戏行业的未来。若将来,围绕大语言模型搭建AINPC系统的技术路线能够实现并跑通,游戏中的AINPC真的能够与环境交互、具有记忆、不断形成社会,那么大型游戏体验,有没有可能不再是巨头的“自留地”,真正实现游戏的“创造平权”?


相关阅读

大家都在看