LOADING STUFF...

中文通用大模型综合性评测基准SuperCLUE正式发布

AI行业动态3年前发布我对AI一无所知

SuperCLUE是一个针对中文通用大模型的测评基准，旨在全面测试这些模型在不同任务下的效果，并比较它们与国际上的代表性模型和人类的表现。这个基准由三个榜单组成：总榜单、基础能力榜单和中文特性榜单，并由多个维度、70多个子能力组成。SuperCLUE选取了9个国内外有代表性的模型进行测试，并提供了一键测评和人类基准的指标对比。

中文通用大模型综合性评测基准正式发布！此基准旨在回答中文大模型的效果情况，以及相较于国际上的代表性模型做到了什么程度，模型与人类的效果对比如何等问题。 #SuperCLUE #中文大模型 #人工智能 #NLP URL https//github.com/CLUEbenchmark/SuperCLUE

原文：https://mp.weixin.qq.com/s/6CDnyvMsEXtmsJ9CEUn2Vw

AI行业动态 # SuperCLUE

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

聊聊你知道和不知道的ChatGPT

聊聊你知道和不知道的ChatGPT

3年前

0690

1023日报 | Claude 3.5重磅升级 | Runway推Act-One | Stable Diffusion 3.5发布 | OceanBase 4.3.3上线 | 微软发布10个自主AI代理 | NVIDIA联合MIT推出SANA

1023日报 | Claude 3.5重磅升级 | Runway推Act-One | Stable Diffusion 3.5发布 | OceanBase 4.3.3上线 | 微软发布10个自主AI代理 | NVIDIA联合MIT推出SANA

2年前

01350

1031动态速递 | Meta政府合作引关注 | Waymo发布新驾驶模型 | ComfyUI细节增强工具上线 | AI Agent社交媒体迅猛增长 | NVIDIA机器人控制网络革新

1031动态速递 | Meta政府合作引关注 | Waymo发布新驾驶模型 | ComfyUI细节增强工具上线 | AI Agent社交媒体迅猛增长 | NVIDIA机器人控制网络革新

2年前

01100

01.05 | AI改写零售规则 | 就业市场大洗牌 | 技术伦理引担忧

01.05 | AI改写零售规则 | 就业市场大洗牌 | 技术伦理引担忧

2年前

01040

暂无评论

none

暂无评论...

AI账号获取

Optimized by WPJAM Basic。