GoForum › 🌐 V2EX

Gemma 4 31B 大概什么水平，本地部署是不是又成为现实了

unt · 2026-04-04 00:04 · 0 次点赞 · 10 条回复

（无内容）

10 条回复

philobscur · 2026-04-04 01:14

各项评分也就和 qwen3.5 27b 不相上下的水平，已经在等 qwen3.6 了

tomchen · 2026-04-04 01:29

写码离 kimi 、glm 等开源最好的还差一截吧？（ Qwen Coder 似乎也差一截）

unt · 2026-04-04 01:29

@tomchen 一般用它不会用来写代码吧

tomchen · 2026-04-04 01:39

@unt 哦不清楚。。不过我再看一眼 Gemma 4 的介绍 https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/ 他其实主打的是执行任务、tool calling ，那和 code 也算是一类东西吧，https://arena.ai/leaderboard/code Arena 测试就把他们作为一类

coefu · 2026-04-04 01:39

非常强悍，g 厂出手，都是弟弟。

31B ，要真正跑起 256k 的 context ，Q8 起码要 64G 显存。

对于一般 web 代码来说，体现不出来它的上限。当然，一般人也用不到它的上限。

现在打榜的 benchmark ，都是对标博士级别的水平，只有你的 case 是真正的挑战，才知道和别的差距。

coefu · 2026-04-04 01:44

@philobscur qwen3.5 就是阿里开源的最后绝唱了，你还等什么 3.6 咯，事情都搞不明白。

coefu · 2026-04-04 01:49

@unt 当前开源里，普罗大众能用到的最强悍模型了。2* 2080ti 22g ，不到 4k 的成本，跑 31B Q8 ，估计能有个 10 Token/s 的速度，凑合能用。

coefu · 2026-04-04 01:54

@unt 我觉得，和 gemini 来比，gemini 现在搞的这种情绪价值提供，反而让人不客观了。今天，试用了一下午 gemma4 31B,可能是 system prompt 没有设置什么情绪相关，反而更理性客观，没有 gemini 的夸夸味。

wwhc · 2026-04-04 02:24

差一点就能赶上 Qwen3.5 了

philobscur · 2026-04-04 02:39

#10

添加回复

你还需要登录后发表回复

登录后可发帖和回复

登录注册

主题信息

作者: unt

发布: 2026-04-04

点赞: 0

回复: 0