万字长文:第一性原理看大模型Agent 本文讨论了大模型Agent的发展和智能时代的趋势。随着大规模模型技术的兴起,未来的5到10年可能会带来一场大变局,99%的开发、设计和文字工作将被AI接管。在智能时代,Agent可能成为新的核心载体... AI概念AI行业动态 1年前04050
GPT现状:OpenAI创始成员分享,a16z力荐,清晰讲解大模型内部原理 {文章来源:Founder Park 公众号,文章摘要:OpenAI 创始人Andrej Karpathy在Build 2023开发者大会上详细介绍了GPT的发展现状。文中详细讲解了GPT的模型训练过... AI概念AI行业动态 2年前03910
【通俗易懂】用弹子球机讲述LLM原理——如何用损失函数、梯度下降做训练和微调 本文介绍了用弹子球机来展示大语言模型(LLM)的一些内部原理,包括调整参数、损失函数和梯度下降等。作者通过比喻弹子球机的柱子调整来说明模型参数的调整过程。同时,文章还提到了微调过程中需要存储大量参数和... AI概念好文推荐 1年前02600
DeepSpeed Chat:一键搞定不同规模 ChatGPT 类模型训练! DeepSpeed 是一个深度学习优化库,它使分布式训练和推理变得简单、高效和有效。一键式 RLHF 训练,让你的类 ChatGPT 千亿大模型提速省钱 15 倍。说人话就是:自己本地可以训练部署类 ... AI工具使用教程AI概念 2年前02390
AI: The Coming Revolution(人工智能:即将到来的革命) AI被认为是下一个技术超级周期,有潜力显著改善我们的世界。AI的采用速度快,已经开始改变我们的世界,从数据中心到消费者应用程序。超过300,000个模型已经在Hugging Face上共享,50%以上... AI概念AI观点 1年前02280
【渐构】万字科普GPT4为何会颠覆现有工作流;为何你要关注微软Copilot、文心一言等大模型 视频是关于GPT的底层原理和未来影响。将抛开技术细节,少用专业名词,在整体功能上讲解 ChatGPT 的「工作原理」「制造过程」「涌现的能力」「未来的影响」以及「如何应对」: 1、ChatGPT是如何... AI概念 2年前02040
初识AI Agent——以大模型为核心的智能体 这篇文章主要介绍了AI Agent(人工智能代理)的概念和应用。AI Agent是一个通过传感器感知环境并通过执行器作用于环境的智能体。它可以根据任务执行不同的操作,可以是单Agent(单一任务)、多... AI概念 1年前01920
真·万字长文:可能是全网最晚的ChatGPT技术总结 最近ChatGPT可以说是火遍了全世界,作为由知名人工智能研究机构OpenAI于2022年11月30日发布的一个大型语言预训练模型,他的核心在于能够理解人类的自然语言,并使用贴近人类语言风格的方式来进... AI概念 2年前01900
LLM vs. ChatGPT:开源模型面临的真相与错觉! 文章来源: 浮之静公众号,文章摘要:作者指出,最近出现的多个开源大语言模型虽然宣称参数更少和价格更低,但其实际性能难以达到商用模型如GPT-3的水平。这是因为这些开源模型过于依赖模仿和微调,训练数据和... AI概念AI观点 2年前01700
这篇文章把ChatGPT如何工作的讲清楚了 原文:ChatGPT 在做什么……以及它为什么起作用? https://writings.stephenwolfram.com/2023/02/what-is-chatgpt-doing-and-wh... AI概念 2年前01700