NVIDIA 推出了一系列新的 AI 基础模型、工具和硬件,旨在将生成性和代理性 AI 功能直接带入消费者 PC 和企业系统。
在 CES 2025 上,NVIDIA 推出了一系列新的 AI 基础模型、工具和硬件,旨在将生成式和代理式 AI 功能直接带入消费级 PC 和企业系统。这些创新由 NVIDIA 最新的 GeForce RTX™ 50 系列 GPU 和 NVIDIA NIM™ 微服务提供支持,旨在重新定义开发者、企业和爱好者与 AI 的互动方式。
RTX AI PC 的 AI 基础模型
NVIDIA 的新基础模型在 RTX AI PC 上本地运行,将彻底改变内容生成、生产力、AI 开发以及 Nvidia 所谓的数字人类创造。这些模型由 GeForce RTX 50 系列 GPU 提供支持,该 GPU 具有高达每秒 3,352 万亿次 AI 性能和 32GB VRAM。这些 GPU 基于 NVIDIA Blackwell 架构构建,是首款支持 FP4 计算的消费级硬件,可将 AI 推理性能提高一倍,并使生成式 AI 模型能够以较小的内存占用在本地运行。
NVIDIA NIM 微服务和 AI 蓝图
NVIDIA NIM 微服务让开发人员和爱好者能够轻松部署这些模型并将其集成到工作流程中。它们针对跨 NVIDIA GPU 的部署进行了优化,无论是在 PC、工作站还是在云端。NIM 微服务与流行的 AI 开发框架(如 LangChain、Langflow 和 AI Toolkit for VSCode)兼容,从而能够无缝集成到现有应用程序中。
这些微服务由领先开发商的一系列模型提供支持,包括 Black Forest Labs、Meta、Mistral 和 Stability AI。用例涵盖大型语言模型 (LLM)、视觉语言模型、图像生成、语音处理和检索增强生成 (RAG)。
其中一个亮点是 Llama Nemotron 系列开放模型,这些模型针对指令跟踪、函数调用、编码和数学等代理 AI 任务进行了优化。例如,Llama Nemotron Nano 模型旨在在 RTX AI PC 和工作站上高效运行,从而直接在消费级硬件上实现聊天和编码等高级 AI 功能。
为了展示 NIM 微服务的潜力,NVIDIA 预览了 Project R2X,这是一个由 NVIDIA RTX Neural Faces 和 Audio2Face™-3D 提供支持的视觉 PC 虚拟形象。该虚拟形象可以帮助用户完成总结文档、管理桌面应用程序和增强视频会议通话等任务。Project R2X 连接到云 AI 服务(如 OpenAI 的 GPT4o 和 xAI 的 Grok)以及 NIM 微服务,展示了 NVIDIA AI 生态系统的多功能性。
NVIDIA 还推出了 AI 蓝图,这是一种预配置的参考工作流程,可简化代理和生成 AI 应用程序的开发和部署。这些蓝图使企业能够构建和实施定制 AI 解决方案,创建数据驱动的 AI 飞轮以提高生产力。这些蓝图利用 NIM 微服务来简化复杂的任务。例如,PDF 到播客蓝图从 PDF 中提取文本、图像和表格,生成播客脚本,并使用 AI 生成或用户提供的语音样本创建录音。另一个为 3D 引导生成 AI 设计的蓝图允许艺术家使用在 Blender 等工具中创建的 3D 场景来控制图像生成。
蓝图展示了 AI 如何增强创造力和生产力。它们为开发人员和创作者提供了强大的工具来简化他们的工作流程。通过在 RTX AI PC 上本地运行,这些蓝图消除了对基于云的处理的需求,从而提供了更快、更安全的解决方案。
Agentic AI 和 Nemotron 模型系列
NVIDIA 还推出了 Llama Nemotron 和 Cosmos Nemotron 模型系列,旨在推动代理 AI 的发展。代理 AI 是 AI 的新时代,在这个时代,专业代理可以协作解决复杂问题并自动执行任务。这些模型针对企业应用进行了优化,包括客户支持、欺诈检测和供应链管理。
Llama Nemotron 模型基于广受欢迎的 Llama 基础构建,使用 NVIDIA 的 NeMo 和最新技术进行修剪和训练,以提高效率和准确性。它们有三种尺寸可供选择 - Nano、Super 和 Ultra - 以满足各种部署需求,从 PC 上的实时应用程序到数据中心规模的操作。这些模型还可以使用 NVIDIA NeMo 微服务进行定制,使企业能够根据特定领域和用例对其进行定制。
另一方面,Cosmos Nemotron 模型专注于视觉语言任务,使 AI 代理能够分析和响应图像和视频。这些模型适用于自动机器、医疗保健、零售和媒体应用。NVIDIA 还宣布了用于生成物理感知视频的 Cosmos 世界基础模型,进一步扩展了 AI 代理在机器人和自动驾驶汽车中的能力。
可用性和行业支持
NVIDIA 的 NIM 微服务和 AI 蓝图将于 2025 年 50 月上市。初始硬件支持将提供给 GeForce RTX 40 系列 GPU、部分 RTX XNUMX 系列和专业 GPU。包括宏碁、华硕、戴尔、惠普、联想和 MSI 在内的领先制造商以及 Corsair 和 Falcon Northwest 等定制系统制造商将提供支持 NIM 的 RTX AI PC。
Llama Nemotron 和 Cosmos Nemotron 模型也将很快作为可下载模型和托管 API 提供,可通过 NVIDIA 开发者计划免费访问以供开发和研究。企业可以使用 NVIDIA AI Enterprise 软件平台部署这些模型,确保无缝集成到他们的工作流程中。
这些公告对今天意味着什么
RTX AI PC 和 NIM 微服务将生成式和代理式 AI 功能直接带入消费级 PC,让更广泛的受众能够使用尖端 AI 工具。曾经需要强大数据中心才能完成的任务现在可以在本地执行,从而实现更快、更安全、更个性化的 AI 体验。从创建数字人类和自动化工作流程到构建智能 AI 代理,这些工具使开发人员和爱好者能够突破可能的界限。
在游戏领域,NVIDIA ACE 正在重新定义玩家与虚拟世界的互动方式。由 ACE 提供支持的自主游戏角色为 NPC 带来了全新水平的真实感和动态感,使它们能够像人类玩家一样感知、计划和行动。这项技术已被整合到以下重要游戏中: 绝地求生:战场 和 奈良:刀锋,其中 AI 队友和敌人会适应玩家行为,从而创造出更具沉浸感和不可预测的游戏玩法。除了游戏之外,ACE 的生成 AI 功能还在改变游戏开发,Audio2Face 等工具简化了动画工作流程并实现了逼真的角色交互。这些创新共同预示着未来 AI 将无缝融入我们数字生活的各个方面,从生产力到娱乐。
ACE 最令人兴奋的应用之一是即将推出的谋杀悬疑游戏 死肉,玩家可以使用自然语言与任何角色交谈。由 NVIDIA ACE 和小型语言模型提供支持, 死肉 允许玩家审问嫌疑人,提出开放式问题,操纵或诱惑他们透露秘密。这种互动水平以前只有人类玩家才能实现,它创造了一种动态而身临其境的体验,其中每一次对话都可以影响游戏的结果。
结语
NVIDIA 在 CES 2025 上发布的公告凸显了该公司致力于推动跨行业 AI 创新的决心。通过推出强大的 Nemotron 模型系列和 NIM 微服务 AI 蓝图,NVIDIA 使开发人员、企业和创作者能够充分发挥生成式和代理式 AI 的潜力。这些进步由尖端的 GeForce RTX 50 系列 GPU 提供支持,将 AI 功能直接带入消费级 PC,使其比以往更快、更安全、更易于访问。
从彻底改变生产力和内容创作,到利用 NVIDIA ACE 自主角色改变游戏,NVIDIA 为 AI 驱动体验的新时代奠定了基础。无论是在游戏中启用栩栩如生的 NPC、简化创意工作流程,还是帮助企业构建智能 AI 代理,NVIDIA 的创新都在重塑我们与技术的互动方式。随着这些工具和技术的普及,它们有望重新定义 AI 在个人和专业领域的可能性,为更加智能和身临其境的未来铺平道路。
参与 StorageReview
电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅