在一项开创性的开发中,谷歌推出了 GameNGen,这是全球首个完全由神经模型驱动的游戏引擎。这一里程碑式的 AI 和游戏技术标志着一个新时代的开始,在这个时代,游戏可以通过人工智能创建和驱动,而无需任何传统编码。这款 AI 游戏引擎在零代码游戏生成和基于神经模型的游戏开发方面实现了重大进展。
GameNGen 概述
GameNGen 是一款革命性的 AI 游戏引擎,可以实时生成可玩游戏,无需传统编程。其主要特点包括:
- 零代码游戏生成
- 基于神经模型的游戏引擎架构
- 以每秒 20 帧的速度进行实时游戏渲染
这款 AI 游戏引擎对 2000 亿美元的游戏行业潜在影响巨大,因为它可以大幅缩短开发时间和成本,同时使游戏创作民主化。
技术基础
GameNGen 是第一款完全由神经模型驱动的 AI 游戏引擎,能够在高质量下与复杂环境进行实时交互,支持长时间轨迹。
技术细节可在研究论文中找到: https://gamengen.github.io/
革命性游戏:谷歌 GameNGen,全球首个 AI 游戏引擎
GameNGen 实践:为 DOOM 的零代码游戏生成
GameNGen 的 DOOM 模拟展示了 AI 在游戏开发中的强大能力。GameNGen 的出现标志着 AI 在游戏模拟领域的重大突破,使得首次能够在无需编写代码的情况下完整模拟视频游戏 Doom,其高质量的图形和复杂的交互。
自 1993 年发布以来,Doom 已成为衡量技术进步的基准,以其卓越的第一人称射击体验和遗产而闻名。然而,GameNGen 的引入无疑将这些早期的创新尝试提升到了一个新的水平。
传统游戏引擎依赖精心编写的软件来管理游戏状态和渲染视觉效果,而 GameNGen 则采用 AI 驱动的生成扩散模型,自动模拟整个游戏环境,而无需依赖游戏引擎的常规组件。这不仅大幅减少了游戏开发的时间和成本,还有可能将游戏创作的权力交到更广泛的人群手中,使他们能够创造出前所未有的复杂互动体验。
GameNGen 对 DOOM 的模拟质量
GameNGen 的模拟质量卓越,生成的图像和视频与 Doom 游戏几乎无法区分。
- 图像质量:GameNGen 的 AI 游戏引擎生成的图像与原始游戏几乎无法区分。在长时间游戏会话中,它能够保持与原始游戏相似的图像质量。
- 真实感:AI 生成的游戏图像如此真实,以至于在人们观看短片段时,很难区分这是 AI 模拟还是实际游戏的图像。
- 评估指标:使用两种专业指标,LPIPS 和 PSNR,评估图像质量。这些指标展示了 GameNGen 在 DOOM 的零代码游戏生成中的能力。在测试中,GameNGen 在 2048 个不同关卡轨迹中平均达到了 29.43 PSNR 和 0.249 LPIPS,证明了其高质量的图像输出。
- 视频质量:尽管在长时间的自回归生成中,模拟和真实游戏视频之间存在小差异,但这些差异主要是由于帧之间的小速度差异的累积造成的。
- 人类评估:在一项测试中,10 名评估者观看了长度为 1.6 秒和 3.2 秒的 130 个游戏片段。结果显示,评估者认为 AI 生成的游戏片段在 58% 到 60% 的情况下是现实的,进一步证明了 GameNGen 的模拟质量。
GameNGen 的未来与挑战
GameNGen 的推出标志着游戏开发的范式转变。这种基于神经模型的游戏开发方法为零代码游戏生成开辟了新的可能性。在这个新的 AI 驱动的时代,游戏不再受限于程序员编写的代码行,而是由神经网络模型的权重定义。这意味着游戏开发者可以通过简单的指令或示例图像快速创建全新的游戏体验。
GameNGen 的潜力不仅限于重塑游戏行业;其应用范围还涵盖虚拟现实、自动驾驶汽车和智慧城市等多个领域。在这些领域中,实时模拟是培训、测试和运营管理的关键。
尽管 GameNGen 显示出巨大的潜力,但它也面临许多挑战。开发一种能够运行从 DOOM 模拟到现代游戏的广泛游戏的通用 AI 游戏引擎仍然是一个挑战。此外,对于图形要求较高的游戏,GameNGen 可能需要更多计算能力来支持。然而,这些挑战也推动了技术的发展。
腾讯 RTC 游戏内语音聊天与 GME SDK
腾讯 RTC 游戏内语音 SDK 是一款旨在彻底改变游戏环境中玩家互动的尖端解决方案。该 SDK 专注于增强用户体验和社交参与,能够在多个平台和游戏类型中无缝集成。
主要特点
- 3D 定位语音聊天:利用先进的空间音频技术,SDK 提供虚拟立体声和 3D 沉浸式体验,让玩家能够感知游戏角色的距离和位置。
- AI 驱动的噪声消除:最小化背景噪声,确保清晰和明亮的语音通信,提高整体游戏体验。
- 接近语音聊天:根据游戏内接近度启用通信,促进真实互动,使虚拟世界更加生动。
- 语音控制:允许玩家静音、调节音量并选择谁能听到他们的声音,提供可定制的游戏体验。
- 无限联合主播:支持无限数量的用户在单个房间内联合主播,无限制地容纳大型游戏活动。
- 轻松沟通:文本转语音、语音转文本和文本翻译等功能提升了游戏体验的便利性。
- 跨平台连接:确保与各种平台上的玩家进行实时互动,包括 PC、主机或移动设备。
- 全球部署:该 SDK 在超过 200 个国家和地区提供服务,平均端到端延迟低于 300 毫秒,优化了全球使用并符合 GDPR 标准。
- 平台和引擎支持:该 SDK 与多种引擎和平台兼容,包括 iOS、Android、Windows、macOS、webGL、Linux、Unity、Unreal 和 Cocos,确保在所有设备上顺畅的语音聊天体验。
性能指标
- 30 亿分钟:每天发布的音频,展示了 SDK 的广泛使用。
- 6000+ 开发者:信任该 SDK 以满足他们的游戏开发需求,凸显其可靠性和质量。
应用案例
- 电子竞技游戏:支持竞争游戏场景中的实时语音聊天。
- 派对游戏:增强社交游戏体验中的互动功能。
- MMO/沙盒游戏:在广阔的游戏世界中提供沉浸式空间音频。
- VR/AR 游戏:在虚拟和增强现实环境中促进自然沟通。
结论
腾讯 RTC 游戏内语音 SDK 是一款全面的工具,大大增强了游戏中的玩家参与和社交互动。它是开发者在其游戏项目中集成高质量沉浸式语音通信的首选解决方案。
结论
总之,谷歌的 GameNGen 代表了 AI 驱动的游戏开发的一次重大飞跃。随着这款基于神经模型的 AI 游戏引擎的不断发展,它可能重塑不仅是游戏行业,还可能影响虚拟现实、自动驾驶车辆和智慧城市等领域。通过利用零代码游戏生成和先进的神经模型,GameNGen 正在为一个由 AI 能力驱动我们的虚拟体验的未来铺平道路,从 DOOM 模拟到全新游戏概念。
如果您有任何问题或需要在线帮助,我们的支持团队随时准备提供帮助。请随时 联系我们 或加入我们的 Telegram 或 Discord。对于技术问题,您也可以直接在 Stack Overflow 上寻求开发者的帮助。