AI界「拼多多」:一家可能改变中国大模型牌局的公司|36氪独家

一句话总结:

DeepSeek通过创新的MLA架构和开源策略,引发中国大模型市场的价格战,并推动技术创新。

摘要:

DeepSeek,一家中国大模型创业公司,通过推出低成本的DeepSeek V2开源模型,引发行业价格战,并以其创新的MLA架构和DeepSeekMoESparse结构,显著降低显存和计算量。公司坚持开源和未全面商业化的策略,目标是实现人工通用智能(AGI)。

主要观点:

  1. 创新驱动:DeepSeek通过MLA架构和DeepSeekMoESparse结构,实现了成本和性能的双重突破。
  2. 开源策略:公司坚持开源,未全面商业化,以促进技术发展和普惠。
  3. 价格战影响:DeepSeek的低成本模型迫使其他大厂降价,改变了市场竞争格局。
  4. 技术生态:DeepSeek致力于构建强大的技术生态,而非仅仅追求商业利益。
  5. 原创式创新:创始人梁文锋强调原创式创新的重要性,认为中国应成为技术创新的贡献者。

文章金句:

  • “DeepSeek被迅速冠以‘AI界拼多多’之称。”
  • “DeepSeek看重‘弯路’中积累的价值,并认为中国的大模型创业者除应用创新外,也可以加入到全球技术创新的洪流中。”
  • “我们认为随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。”
  • “创新的成本肯定不低,过去那种拿来主义的惯性也和过去的国情有关。但现在,你看无论中国的经济体量,还是字节、腾讯这些大厂的利润,放在全球都不低。”
  • “我们认为先有一个强大的技术生态更重要。”

链接:https://mp.weixin.qq.com/s/OQd-AdUBzqg7Pwoy7DIiuQ?v_p=90&WBAPIAnalysisOriUICodes=10000001&launchid=default&wm=3333_2001&aid=01A0VjFEC-8TX6msntzx_IZJsVSdIBL5NqzASu9SjrmTcS5LA.&from=10E6393010

© Copyright notes

Related posts

No comments

No comments...
en_USEnglish

Optimized by WPJAM Basic