GoForum › 🌐 V2EX

[求助] DGX Spark 上 Ollama 推理极慢，改用 llama.cpp 部署是否更合适？

diudiuu · 2026-03-03 10:37 · 0 次点赞 · 0 条回复

现在手上有一台 NVIDIA DGX Spark（对就是 3 万多的那个，闭眼别问为啥），目前已完成以下配置：

问题描述

推理速度极慢，具体表现如下：

查阅官方论坛及社区资料后发现：

Ollama 的部署方式并未针对 DGX Spark 做专项优化，社区普遍推荐在该平台上改用 llama.cpp 直接部署，以充分发挥其 GB10 超级芯片 Unified Memory 统一内存架构的优势。

或者上面的我说的不对,我有看专门设置,但是实际就是很烂

有没有在 DGX Spark 上实际跑过 llama.cpp 的老哥？希望得到以下指点：

希望有经验的老哥帮我指点一二！🙏

0 条回复

添加回复

你还需要登录后发表回复

登录后可发帖和回复

登录注册

主题信息

作者: diudiuu

发布: 2026-03-03

点赞: 0

回复: 0