NVIDIA DGX Spark 与 GB10：桌面级 AI 超算的革新力量

创建时间：2025-09-09 10:19

在人工智能迅猛发展的当下，算力成为了推动这一领域持续进步的核心要素。从大型数据中心到科研机构，从企业创新实验室到个人开发者的桌面，对强大、高效算力的需求无处不在。而在这一算力需求的浪潮中，英伟达凭借其前沿技术与创新产品，尤其是 NVIDIA DGX Spark 和 GB10，为桌面级 AI 超算领域带来了革命性的变化。

NVIDIA DGX Spark：开启个人 AI 超算新时代

NVIDIA DGX Spark 的诞生意义非凡，它的前身是备受瞩目的 Project Digits 项目。作为全球最小的桌面级 AI 超级计算机，DGX Spark 将原本仅存在于大型数据中心的强大 AI 性能成功压缩至小巧的台式机形态中，其尺寸仅为 150×150×50.5mm，却蕴含着巨大的能量，真正开启了 AI 开发的 “个人时代”。

从硬件配置上看，DGX Spark 的核心是专为桌面设计优化的 GB10 Grace Blackwell 超级芯片。这款芯片采用了先进的架构，其中的 NVIDIA Blackwell GPU 配备了第五代张量核心和对 FP4 精度的支持，这使其能够爆发出高达每秒 1000 万亿次的 AI 计算能力。如此强大的算力，使得开发者能够在本地轻松地对最新一代的推理 AI 模型，如 NVIDIA Cosmos Reason 世界基础模型和 NVIDIA GR00T N1 机器人基础模型，进行高效的原型设计、微调以及推理工作。

在内存方面，DGX Spark 配备了 128GB 的统一 LPDDR5X 内存，其内存带宽达到 273GB/s，这一出色的内存配置为运行高达 2000 亿参数的模型提供了坚实保障。存储上，它可灵活配置 1TB 或 4TB 的 NVME SSD，部分版本还支持可选的自加密功能，确保数据存储的安全与高效。网络功能同样强大，不仅具备 10Gbe 以太网端口，还能通过 ConnectX-7 智能网卡连接两个 DGX Spark 系统，实现高达 200Gbps 的传输速度，当双机互联时，更是能够支持处理最多 4050 亿参数的 AI 模型。此外，它还集成了 WiFi 7 和蓝牙 5.3 功能，为用户提供了便捷的无线连接方式。同时，HDMI 2.1a 视频输出端口和 4 个 USB4 Type-C 端口的配备，满足了多样化的外接设备需求。从功耗和尺寸重量来看，DGX Spark 功耗仅为 170 瓦，重量 1.2kg，在保障强大性能的同时，实现了低功耗与便携性的良好平衡。

软件系统层面，DGX Spark 预装了基于 Linux 系统的 NVIDIA DGX OS 系统，该系统加载了完整的 NVIDIA AI 堆栈，涵盖了 CUDA、CUDNN、Rapid 等一系列丰富的工具、框架和库，并且还贴心地提供了预训练模型。这一系列软件配置，使得开发者在拿到设备后，无需复杂的环境搭建过程，即可快速投入到 AI 开发工作中，大大提升了开发效率。

GB10 超级芯片：桌面级 AI 超算的强大心脏

GB10 超级芯片作为 NVIDIA DGX Spark 的核心组件，其技术创新令人瞩目。它采用台积电 3nm 制程工艺制造，通过先进的设计，将联发科设计的 CPU 芯片和英伟达自家设计的 GPU 芯片巧妙地整合在一起。这两个芯片借助台积电 2.5D 先进封装技术，并通过英伟达专有的 NVLink 芯片间互连技术连接，实现了高达 600GB/s 的双向带宽，极大地提升了数据传输速度，有效解决了传统架构在内存密集型任务中数据传输效率低下的问题。

在 CPU 方面，GB10 采用大小核架构，拥有 20 个 Arm v9.2 核心，这些核心分布在两个集群中，其中 Cortex-X925 核心和 Cortex-A725 核心数量各占 10 个。每个计算集群都配备了 16MB 的 L3 缓存，并且还有额外的 16MB L4 缓存，这种缓存配置极大地优化了 GB10 计算引擎间的通信效率，确保在复杂的 AI 计算任务中，数据能够快速、准确地在不同核心间传输与处理。

对于 GB10 的 GPU 部分，虽然英伟达透露的具体细节相对有限，但已知其在稀疏性条件下能够提供约 1 petaFLOP 的峰值 FP4 性能，或者约 31 teraFLOPS 的单精度计算性能（FP32）。这样的性能表现使得 GB10 在 AI 计算领域具备了强大的竞争力，例如在处理深度学习模型的训练和推理任务时，能够快速地完成复杂的数学运算，为模型的高效运行提供了坚实的硬件支撑。

与传统显卡如 RTX 5070 相比，GB10 在功耗和显存容量方面展现出明显优势。RTX 5070 的 TDP 为 250 瓦，而 GB10 仅为 140 瓦，更低的功耗意味着在长时间运行过程中，GB10 能够以更低的能源消耗维持高性能运算，不仅节省了能源成本，还减少了散热负担。在显存容量上，GB10 配备了 128GB 显存，远远超过了 RTX 5070 的 12GB，这使得 GB10 在处理大规模 AI 模型时，能够轻松应对模型权重存储的需求。因为即使在 FP4 精度下，模型权重仍需要每十亿参数约 500MB 的存储空间，GB10 的大显存容量确保了在运行高参数模型时不会因显存不足而导致性能瓶颈。

此外，受功耗和成本限制，GB10 采用了时钟频率为 9400MT/s 的 LPDDR5x 内存，通过与 CPU 芯片的 256 位内存总线结合，可提供 273GB/s 至 301GB/s 的带宽。虽然在内存带宽上有所妥协，但从整体设计来看，这是在内存容量、带宽、功耗和成本之间进行综合权衡后的最优解。并且，GB10 还配备了 ConnectX-7 网卡，拥有一对 200GbE 端口，允许两台 DGX Spark 设备协同工作，当需要处理更大规模的计算任务时，可将微调和推理能力提升一倍，进一步增强了其扩展性和适应性。

应用场景与行业影响

NVIDIA DGX Spark 与 GB10 的结合，在多个领域展现出了广阔的应用前景。在科研领域，研究人员可以利用 DGX Spark 在本地快速搭建 AI 实验环境，对各种前沿的 AI 模型进行深入研究和优化。例如在生物信息学中，通过对海量生物数据的分析来寻找疾病的潜在治疗靶点，GB10 强大的算力能够加速数据处理和模型训练过程，帮助研究人员更快地获得有价值的研究成果。

在企业创新方面，尤其是对于中小型企业而言，以往构建强大的 AI 计算基础设施需要投入巨大的资金和资源，而现在通过 DGX Spark，企业可以以相对较低的成本获得超算级别的算力。企业能够利用它进行产品研发创新，如在智能产品设计中，通过 AI 模型对产品的性能、用户体验等进行模拟和优化，快速迭代产品，提升市场竞争力。

对于 AI 开发者和数据科学家来说，DGX Spark 更是成为了他们手中的得力工具。在模型开发过程中，开发者可以在本地实时对模型进行原型设计和微调，无需像以往一样依赖远程云计算资源，避免了数据传输延迟和数据隐私安全问题。同时，借助 NVIDIA DGX Spark 预装的丰富软件系统，开发者能够快速将自己的创意转化为实际的 AI 应用，加速了 AI 创新的进程。

从行业发展的宏观角度来看，NVIDIA DGX Spark 和 GB10 的出现，正在推动 AI 行业从 “云端垄断” 向 “端云协同” 的模式转型。随着生成式 AI 应用的爆发式增长，开发者对于本地化算力的需求日益迫切。传统的云端部署方式在数据隐私保护、网络延迟以及成本方面面临着诸多挑战，而 DGX Spark 的出现为这些问题提供了有效的解决方案。它使得中小型企业和个人开发者能够以消费级的成本获得超算级别的算力支持，极大地降低了 AI 创新的门槛，激发了整个行业的创新活力，有望推动 AI 技术在更广泛的领域得到应用和普及，为各行业的智能化转型注入新的动力。

展望未来，随着技术的不断进步，我们有理由相信 NVIDIA DGX Spark 和 GB10 将在性能上进一步提升，应用场景也将不断拓展。它们将持续引领桌面级 AI 超算领域的发展潮流，为人工智能技术的发展和应用带来更多的惊喜与变革，助力人类在探索 AI 的道路上不断迈出坚实的步伐。

更多N8N+DeepSeek一体机配置请查看：https://www.kuanheng168.com/agent

企业构建知识库+落地智能体解决方案请查看：https://www.kuanheng168.com/agent

넶浏览量：0

新闻中心

NVIDIA DGX Spark 与 GB10：桌面级 AI 超算的革新力量

RTX PRO 5000 释放 AIGC 生产力，宽恒科技硬件方案赋能 AI 短剧工业化生产

DGX Spark 推动算力下沉，宽恒科技本地部署大模型方案破解企业数据安全难题

企业级 MR 生产力优选，宽恒科技 PICO 4 Ultra 企业版采购方案推荐

官方授权赋能企业 AI 转型，宽恒科技 NVIDIA 代理服务与 NVIDIA AI Enterprise 全栈价值解读

弹性算力赋能 AI 产业升级，宽恒科技算力租赁、AI 服务器租赁与大模型部署全栈方案落地

RTX PRO 5000 专业工作站算力加持，宽恒科技打造 AI 短剧全链路 AIGC 制作方案