C-EVAl 中文基准模型评估套件 C-Eval: A Multi-Level Multi-Discipline Chinese Evaluation Suite for Foundation Models
AG1-Eval AG1-Eval平台是上海交通大学、同济大学、华东师范大学、DataWhale等高校和机构合作发布的大模型评测社区,旨在打造公正、可信、科学、全面的评测生态以“评测助力,让AI成为人类更好的伙伴"为使命。专门设计用于评估基础模型在人类认知和问题解决相关任务中的一般能力。
Hugging Face 开源大模型排行。 We’re on a journey to advance and democratize artificial intelligence through open source and open science.
H2O.ai 基于elo的大模型评测Our Al-powered search assistant helps you get answers to questions about your documents, websites and workplace content.