UC伯克利「LLM排位赛」最新排名:GPT-4 稳居第一!

内容摘要:本博客文章分享了Chatbot Arena排行榜的最新更新,该排行榜现在包括更多开放模型和三个指标:Chatbot Arena Elo,基于Chatbot Arena的42K匿名投票使用Elo评分系统;MT-Bench得分,基于具有挑战性的多轮基准测试和GPT-4评分;以及广泛采用的基准测试MMLU。此外,我们很高兴介绍我们的新系列Vicuna-v1.3模型,参数范围从7B到33B,经过扩展的用户共享对话训练。它们的权重现在可供使用。

简要总结:本博客文章介绍了Chatbot Arena排行榜的最新更新

原文:https://lmsys.org/blog/2023-06-22-leaderboard/

UC伯克利「LLM排位赛」最新排名:GPT-4 稳居第一!
© 版权声明

相关文章

暂无评论

none
暂无评论...