内容摘要:本博客文章分享了Chatbot Arena排行榜的最新更新,该排行榜现在包括更多开放模型和三个指标:Chatbot Arena Elo,基于Chatbot Arena的42K匿名投票使用Elo评分系统;MT-Bench得分,基于具有挑战性的多轮基准测试和GPT-4评分;以及广泛采用的基准测试MMLU。此外,我们很高兴介绍我们的新系列Vicuna-v1.3模型,参数范围从7B到33B,经过扩展的用户共享对话训练。它们的权重现在可供使用。
简要总结:本博客文章介绍了Chatbot Arena排行榜的最新更新
原文:https://lmsys.org/blog/2023-06-22-leaderboard/
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...