https://blog.google/innovation-and-ai/technology/developers-tools/diffusion-gemma-faster-text-generation/
在生成文本时,理论上可以比现在的版本快 4 倍。
目前 V2EX Chat 用的模型就是 gemma4:26b 。
https://edge.v2ex.com/chat
端侧模型和扩散 LLM 像是找到了彼此的最佳舞台。
qwen 这次估计要落后 Gemma 团队了,Gemma 总能整出一些新活儿。😂
登录后可发帖和回复
端侧模型和扩散 LLM 像是找到了彼此的最佳舞台。