
相关搜索
大,甚至执行结果会跟 benchmark 关联度很小,还记得去年很火的 AI 量化的项目,qwen、deepseek、gpt、gemini、claude、grok 六个比拼的结果,最后胜出的是 deepseek 和 qwen,让人大跌眼球的是 gpt。后来我也跟朋友们分析过,结论是 gpt 太安全了,遇到高风险场景不敢做决策,但是往往那些才是收益率最大的地方。另外,服务于模型的 benchmark
当前文章:http://f2oikep.hengluotai.cn/try7/3v1.doc
发布时间:13:09:34