【通俗易懂】用弹子球机讲述LLM原理——如何用损失函数、梯度下降做训练和微调
本文介绍了用弹子球机来展示大语言模型(LLM)的一些内部原理,包括调整参数、损失函数和梯度下降等。作者通过比喻弹子球机的柱子调整来说明模型参数的调整过程。同时,文章还提到了微调过程中需要存储大量参数和...
一个失败的 AI 女友产品,以及我的教训:来自一位中国开发者的总结
这篇文章讲述了作者KeFang探索LLM+Memory是否能够产生意识的过程。他受到斯坦福大学的一篇论文启发,尝试开发了一个名为Dolores的应用,让用户可以与虚拟角色互动。文章提到了一些关键点,包...
Open AI首席科学家:ChatGPT可能已经有了意识,AI将万世不朽
OpenAI首席科学家IlyaSutskever在接受采访时表示,ChatGPT可能具有意识,并且他认为人工智能将会成为永世存在的存在。他谈到了OpenAI早年的创业史、实现AGI的可能性,以及Ope...
微软CEO纳德拉万字专访:我已经历过四次重大技术变革,AI是第五次
微软CEO纳德拉在采访中提到了几个重要观点。首先,他认为人工智能是微软的最大机遇,将在生产力和沟通方面产生革命性影响。其次,他承认自己在职业生涯中犯下最大战略失误是退出移动电话领域。此外,纳德拉强调了...
万字长文:第一性原理看大模型Agent
本文讨论了大模型Agent的发展和智能时代的趋势。随着大规模模型技术的兴起,未来的5到10年可能会带来一场大变局,99%的开发、设计和文字工作将被AI接管。在智能时代,Agent可能成为新的核心载体,...
State of AI:2023 年度人工智能报告之 Research 篇
本周,stateof.ai发布了2023年度人工智能报告,由AirStreetCapital的NathanBenaich等合作编写。报告涵盖了AI领域的多个方面,包括科研进展、产业发展、政治影响和AI...
字节跳动李航:对语言大模型的若干观察和思考
本文总结了关于大规模语言模型(LLM)的主要观点和特点:1.**LLM强大之所在**:LLM(如ChatGPT和GPT4)的突破在于规模带来的质变和模型调教方法的创新。它们使用Transformer模...
How To Use Midjourney For Logo Design 如何使用Midjourney进行logo设计
这篇内容介绍了如何使用Midjourney进行AI生成的标志设计,提供了一些提示和技巧。Midjourney是一个能够快速生成独特创意标志设计的AI艺术平台。文章提到了选择标志类型、引用艺术风格、使用...
3分钟成AI代理商,轻松赚副业!
这篇内容介绍了一个名为"OneAPI"的开源项目,它允许用户通过标准的OpenAIAPI格式访问各种大型人工智能模型。该项目支持多种功能,包括模型管理、令牌管理、兑换码管理、用户分组、渠道设置等。用户...
「Agent」通俗易懂地聊聊AI Agent(附66个开源+44个闭源Agent项目)
这篇内容介绍了AIAgent的概念和重要性。与传统的大语言模型不同,AIAgent具有独立思考和行动能力,能够处理复杂任务。它通过与外部工具的结合,克服了大语言模型的局限性,例如幻觉、信息不真实等。这...