OpenAl采用智谱标准评测GPT-4.1系列大模型

ncnews

2025年04月15日 21:10 · 阅读 9

最后更新：2025/04/15/ 21:10:10

4月15日消息，OpenAI发布的了最新GPT-4.1系列大模型，其中在评测函数调用能力时采用了ComplexFuncBench。

ComplexFuncBench是由智谱团队提出的专用于评估大模型复杂函数调用能力的测试基准。

据悉，ComplexFuncBench主要评测大模型在128K的长上下文下进行多步带约束的函数调用的能力。相比于现有函数调用测试基准，ComplexFuncBench要求大模型对真实场景下的用户需求进行细粒度理解，并在此基础上进行多步带推理的函数调用，这对模型的函数调用能力提出了更高的挑战。（果青）

本文来源于极客网，原文链接: https://www.fromgeek.com/internet/50-682377.html

分类：暂无分类标签：暂无标签

温馨提醒

本网站的所有内容仅供参考，网站的信息来源包括原创、供稿和第三方自媒体，我们会尽力确保提供的信息准确可靠，但不保证相关资料的准确性或可靠性。在使用这些内容前，请务必进一步核实，并对任何自行决定的行为承担责任。如果有任何单位或个人认为本网站上的网页或链接内容可能侵犯其知识产权或存在不实内容，请及时联系我们沟通相关文章并沟通删除相关内容。

ncnews

博主

获得点赞 0

文章被阅读 9

OpenAl采用智谱标准评测GPT-4.1系列大模型

评论

最新文章

目录

登录

OpenAl采用智谱标准评测GPT-4.1系列大模型

评论

相关推荐

最新文章

目录