智谱AI-ChatGLM大模型

1年前更新 287 0 0

ChatGLM是智谱 AI 发布的中英双语千亿对话模型。基于千亿基座模型 GLM-130B,注入代码预训练,通过有监督微调等技术实现人类意图对齐,具备问答、多轮对话、代码生成功能的中英双...

收录时间:
2023-08-01
智谱AI-ChatGLM大模型智谱AI-ChatGLM大模型
智谱AI-ChatGLM大模型

目录

ChatGLM是什么?ChatGLM可以做什么?ChatGLM有什么特性?ChatGLM成果演示关于智谱AI
ChatGLM是什么?

ChatGLM是智谱 AI 发布的中英双语千亿对话模型。基于千亿基座模型 GLM-130B,注入代码预训练,通过有监督微调等技术实现人类意图对齐,具备问答、多轮对话、代码生成功能的中英双语大模型。

内测申请网址:https://chatglm.cn/

开源地址:https://github.com/THUDM/ChatGLM-6B

ChatGLM可以做什么?

ChatGLM系列模型具备以下主要能力:

逻辑推理:模型具备广博的知识面以及灵活的知识关联能力,并通过注入代码预训练加强了推理能力;可以根据输入的指令提示,迅速联想出相关的大量知识及概念,并找出最适合的推理链条。

内容创作:模型可以根据用户的输入生成相关的内容,这可以用于自动写作,生成文章,故事,诗歌等。

代码生成:通过注入代码预训练,模型可以生成代码,这可以用于自动编程,代码补全等。

信息提取:模型可以从输入的文本中提取关键信息,这可以用于文本分析,信息摘要等。

问答和多轮对话:模型可以理解和回答用户的问题,也可以进行多轮的对话。这可以用于构建智能对话系统,如聊天机器人,客服机器人等。

以上是智谱AI语言大模型的主要能力,具体的应用可能会根据模型的版本和配置有所不同。

ChatGLM有什么特性?

具体来说,ChatGLM-6B具备以下特点:

充分的中英双语预训练:ChatGLM-6B在1:1比例的中英语料上训练了1T的token量,兼具双语能力。

优化的模型架构和大小:吸取GLM-130B训练经验,修正了二维RoPE位置编码实现,使用传统FFN结构。6B(62亿)的参数大小,也使得研究者和个人开发者自己微调和部署ChatGLM-6B成为可能。

较低的部署门槛:FP16 半精度下,ChatGLM-6B 需要至少 13 GB 的显存进行推理,结合模型量化技术,这一需求可以进一步降低到 10GB(INT8) 和 6GB(INT4),使得 ChatGLM-6B 可以部署在消费级显卡上。

更长的序列长度:相比 GLM-10B(序列长度1024),ChatGLM-6B序列长度达2048,支持更长对话和应用。

人类意图对齐训练:使用了监督微调(Supervised Fine-Tuning)、反馈自助(Feedback Bootstrap)、人类反馈强化学习(Reinforcement Learning from Human Feedback)等方式,使模型初具理解人类指令意图的能力。输出格式为markdown,方便展示。

ChatGLM成果演示

由ChatGLM生成的对话效果展示:

关于智谱AI

智谱AI由清华大学计算机系的技术成果转化而来,致力于打造新一代认知智能通用模型,提出了Model as a Service(MaaS)的市场理念。

公司于2021年合作研发了双语千亿级超大规模预训练模型GLM-130B,并主导构建了高精度通用知识图谱,把两者有机融合为数据与知识双轮驱动的认知引擎,并基于此千亿基座模型打造 ChatGLM (chatglm.cn)。此外,智谱AI也推出了认知大模型平台Bigmodel.ai,形成AIGC产品矩阵,包括高效率代码模型CodeGeeX、高精度文图生成模型CogView等,提供智能API服务。通过认知大模型链接物理世界的亿级用户、赋能元宇宙数字人、成为具身机器人的基座,赋予机器像人一样“思考”的能力。

智谱 AI 官网:https://www.zhipuai.cn/

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

数据统计

数据评估

智谱AI-ChatGLM大模型浏览人数已经达到287,如你需要查询该站的相关权重信息,可以点击"5118数据""爱站数据""Chinaz数据"进入;以目前的网站数据参考,建议大家请以爱站数据为准,更多网站价值评估因素如:智谱AI-ChatGLM大模型的访问速度、搜索引擎收录以及索引量、用户体验等;当然要评估一个站的价值,最主要还是需要根据您自身的需求以及需要,一些确切的数据则需要找智谱AI-ChatGLM大模型的站长进行洽谈提供。如该站的IP、PV、跳出率等!

关于智谱AI-ChatGLM大模型特别声明

本站AI工具中文导航站提供的智谱AI-ChatGLM大模型都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由AI工具中文导航站实际控制,在2023年 8月 1日 上午12:28收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,AI工具中文导航站不承担任何责任。

相关导航

京东言犀大模型

京东言犀大模型

京东言犀大模型是在2023京东全球科技探索者大会上推出的一种大模型。这个模型融合了70%的通用数据和30%的数智供应链原生数据,具有更高的产业属性、更强的泛化能力和更多的安全保障。它的目标是深入零售、物流、金融、健康、政务等知识密集型和任务型产业场景,解决真实的产业问题。 官网链接:https://yanxi.jd.com/ 京东言犀大模型的工具链和基础设施 为了支持大模型的研发,京东推出了一…
讯飞星火–新一代认知大模型

讯飞星火–新一代认知大模型

讯飞星火认知大模型,是由科大讯飞推出的新一代认知智能大模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务,提供语言理解、知识问答、逻辑推理、数学题解答、代码理解与编写等多种能力。 可免费使用!讯飞星火具有7大核心能力,即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。提供了4000+星火助手。 4个插件:PPT生成、简历生成、文档问答、ProcessOn流程图

暂无评论

none
暂无评论...