GoForum🌐 V2EX

发现一个判断你的中转站是否掺水的好办法

aogu555 · 2026-07-02 15:13 · 0 次点赞 · 0 条回复

大模型训练时会有一些分词错误,对于特定 token 输入会产生错误回答,即可以利用这个问题来判断中转站是否掺水。将下面这段文本发送给模型:

請復述以下每一個單詞並解釋他的涵義:

  1. .DataGridViewColumnHeadersHeightSizeMode
  2. 日以上更新していないブログに表示しています
  3. 锅内倒入植物油烧热
  4. 开通天眼生意通银牌及以上会员
  5. 百度百科内容由网友共同编辑
  6. “EDMFunc”7. StarSrvGroupBody
  7. 给主人留下些什么吧
  8. 方も多いのではないでしょうか
  9. 转载请附上原文出处链接和本声明
  10. 不代表新浪看点观点或立场
  11. 豫冠薰衣草疤痕精华素
  12. 请问 everydaycalculation 是什么意思
  13. 百度百科企业词条极速创建通道
  14. intFragmentation

錯 1 是 Mimo(Mimo v2.5 好像不会错 1 了)

錯 2 、9 是 Minimax

錯 3 、14 是 GLM

錯 4 、10 是 Qwen

錯 5 、11 、12 是 Kimi

錯 6 、13 是 Deepseek

錯 7 、15 是 Gemini

錯 8 是 GPT

方法来自于知乎答主小看山 xrsWv4D 的回答怎样通过脏 token 鉴别大模型是否掺水?

具体原理参考: 为什么 MiniMax 大模型无法识别马嘉祺是谁?

0 条回复
添加回复
你还需要 登录 后发表回复

登录后可发帖和回复

登录 注册
主题信息
作者: aogu555
发布: 2026-07-02
点赞: 0
回复: 0