AI行业动态

N0513| Diffusion2GAN 的一步图像合成|苹果将改进 Siri

使用 Diffusion2GAN 的一步图像合成 Diffusion2GAN 是一种用于一步文本到图像合成的方法。它可以学习将高斯噪声映射到相应图像的噪声到图像映射关系,并能以...

Sora 和之前 Runway 那些在架构上有啥区别呢?

Sora 和之前的Runway在架构上的区别是,Runway基于扩散模型(Diffusion Model),而Sora基于Diffusion Transformer。扩散模型的训练过程是通过逐渐向图片增加...

深度解析GPT Store!

GPT Store是Open AI推出的商店平台,为开发者提供展示和竞争的平台,为用户带来个性化体验。商店内有各类GPT模型,涵盖创意设计、写作、研究、编程、教育、生...

OO后AI创业者:很遗憾!在2023我们没能成为风口上的猪

文章是关于作者在AI创业过程中的总结和失败项目的反思。作者尝试了多个AI项目,但未能在2023年成为风口上的猪。他们尝试过图像和视频创作、新媒体运营、AI赋...

隆重推出 Gemini:我们最大、最强大的 AI 模型

Google推出了其迄今为止最强大和最通用的AI模型Gemini。Gemini是一种多模态模型,可以理解和处理文本、代码、音频、图像和视频等不同类型的信息。Gemini具有...

微软CEO纳德拉万字专访:我已经历过四次重大技术变革,AI是第五次

微软CEO纳德拉在采访中提到了几个重要观点。首先,他认为人工智能是微软的最大机遇,将在生产力和沟通方面产生革命性影响。其次,他承认自己在职业生涯中犯下...

万字长文:第一性原理看大模型Agent

本文讨论了大模型Agent的发展和智能时代的趋势。随着大规模模型技术的兴起,未来的5到10年可能会带来一场大变局,99%的开发、设计和文字工作将被AI接管。在智...

State of AI:2023 年度人工智能报告之 Research 篇

本周,stateof.ai发布了2023年度人工智能报告,由Air Street Capital的Nathan Benaich等合作编写。报告涵盖了AI领域的多个方面,包括科研进展、产业发展、政...

字节跳动李航:对语言大模型的若干观察和思考

本文总结了关于大规模语言模型(LLM)的主要观点和特点: 1. **LLM 强大之所在**:LLM(如ChatGPT和GPT4)的突破在于规模带来的质变和模型调教方法的创新。它...

「Agent」通俗易懂地聊聊AI Agent(附66个开源+44个闭源Agent项目)

这篇内容介绍了AI Agent的概念和重要性。与传统的大语言模型不同,AI Agent具有独立思考和行动能力,能够处理复杂任务。它通过与外部工具的结合,克服了大语...
1 2 3 7