ChatGPT沉思录:深度对话微软中国CTO韦青、微软RD李卓桓、微软AI MVP李佳芮

原文请点击此处

   前言   
毫无疑问,ChatGPT 已经成为全球信息技术产业界的现象级产品。2022年11月30日经 OpenAI 推出,仅仅两个月后,它在今年 1 月末的月活用户已经突破了 1 亿,成为史上用户增长速度最快的消费级应用程序。ChatGPT爆火后,比尔·盖茨公开强调,「像ChatGPT这样的人工智能,与个人电脑、互联网同等重要」;埃隆·马斯克在用过后直呼「好到吓人」、「我们离强大到危险的AI不远了」;英伟达CEO黄仁勋也在近日表示:ChatGPT是人工智能产业发展的「iPhone 时刻」。在ChatGPT发布前的2022年10月3日,Salesforce首席科学家 、斯坦福大学教授、计算机视觉和机器人学家 Silvio Savarese 就曾发表了一篇富有远见的博客《If You Can Say It, You Can Do It: The Age of Conversational AI》。博客发布后不久,ChatGPT横空出世,引发了这场科技和人文革命。

本期播客,我们就从对话式AI聊起。因为有幸邀请到微软中国CTO韦青、微软Regional Director同时具有AI技术背景的投资人李卓桓,还有本身就是主播之一的句子互动创始人&微软AI MVP李佳芮(这期你们将更全面地认识她),所以我们能够从微软内部&行业高维视角、技术&中美投资人视角、应用&创业者等多维视角出发,为大家带来一场深入浅出的 ChatGPT 主题对话。

*本文是「出海相对论」第三期文字版,略有删改,搭配音频食用效果更佳,因时长限制,音频分为了两部分。文章较长,超30000字,内容极有深度,强烈建议您耐心看到最后。可以在微信读书模式,结合大纲阅读。
ChatGPT沉思录1:深度对话微软中国CTO韦青、微软RD李卓桓、佳芮
ChatGPT沉思录2:深度对话微软中国CTO韦青、微软RD李卓桓、佳芮
 
大纲&金句

1. 人类高估了知识的复杂度,低估了思想的深刻度

2. Integration is also innovation

3. 如何保持人的思想的深刻性?

4. 很多人想的计算思维就是编程,这可能反而会耽误孩子的时间

5. 「复现 ChatGPT 」是复现不出来的

6. 某一个时刻到来时,你必须保证自己是 ready 的

7. 人类一直在用望后镜开车,由于时间之箭没法回头,所以其实每一天每一时刻,你都不知道会发生什么

8. 每一个时代都既不是前无古人,也不是后无来者

9. 这是新一轮的文艺复兴,因为知识再次得到「平权」

10. 可能会是一两百年的历程,再次发生宗教革命、启蒙运动、科学革命、工业革命

11. 伟大的事要早参与,要处在漩涡中心

12. 先自我改造成智能时代兼容的企业,再为别人服务

13. Sam Altman 在提出 AGI 的时候,首先推的就是 UBI

14. 我们要的不是AGI,而是「人的幸福感」

15. 人工智能不会取代你,会用人工智能的人会取代你

16. 人类现在都是在做 Boot-Loader(生物引导程序),人类只是硅基生命的开启程序

17. AI 最可能取代的反而是创意性的工作。人类可能不够了解自己,或者错误估计了控制身体的难度

18. 悟性就在你的脚下,随时去感知这个时代的潮流的变化,应和它,适应它,一步一步往上走

19. 什么样的文明,什么样的知识有资格被蒸馏出来?

20. 记忆力不是人的优势,而是机器的优势,人应该思考

21. 语言是有局限的

22. 你能想的多过你能说的,你能说的多过你能写的

23. 让机器做机器擅长的事,让人类发挥人类特长,让人工智能拓展人类智能

24. 人本来不渺小,只是思想境界和深度没达到该达到的程度

25. 过去上百年过于把人培养成机器,现在需要把人解放出来

Jay:欢迎来到全新对话类出海中文播客——出海相对论。大家好,我是Jay。

佳芮:大家好,我是佳芮。

Jay:今天我们聊的话题是近期火爆全球的 ChatGPT 。本期播客和以往有些不同,我们是第一次尝试线上直播的形式,最后我们会有观众提问环节,直播间里的观众可以到时候向嘉宾提问。另一个不同是这期佳芮有双重身份,不仅是《出海相对论》主播同时也是嘉宾之一,因为她的背景和经历其实和这个话题高度相关。

我们也很有幸能够邀请到另外两位重磅嘉宾,一位是在我身边的微软中国CTO韦青老师,另一位是微软Regional Director ,同时也是一位非常资深的投资人李卓桓老师,他此时正在美国远程和我们连线。按照惯例,我们先请各位嘉宾和大家打个招呼,也简单介绍下自己的经历以及目前主要在做的事情。

韦青:线上的朋友们,大家好!应该有蛮多熟悉的朋友们在线上一块共同交流。我是韦青,微软中国首席技术官,同时我现在也担任一个微软的合资公司的总经理。今天可能是以一种技术者的身份和使用技术者的身份,共同来跟大家交流一下我们对现在技术变化的看法。

李卓桓:大家好,非常高兴今天能和韦青老师、佳芮还有在我们《出海相对论》这里和大家见面。我现在是在湾区,在 Plug and Play ,一个硅谷的孵化器里面做 Venture Partner,主要在看关于 Language AI,也就是大家知道现在的大语言模型;或者是我最喜欢的,在过去7年专注在 Conversational AI 和 Chatbot 领域的早期创业项目的投资孵化。我自己同时也是一个30多年的程序员,这些年在 GitHub 上面也写了非常多的代码,被评选为了「全美 TOP4」和「全中国 TOP7」的 Contributor。所以在接下来和大家交流 ChatGPT 的同时,也希望大家以后如果有 Chatbot 相关的想法、技术或者是创业项目多多和我联系和交流,谢谢。

Jay:佳芮也正式完整地介绍一下自己吧。

佳芮:我在这里介绍一下我和 Chatbot、聊天机器人的一些背景信息。

八年前我和卓桓一起做了一个开源项目,叫 Wechaty,今天它是全球最大的对话式 RPA 的开源项目;

五年前,我给百度做了一套对话式 AI 的课程,今天也在百度的官网为很多的开发者去提供这种从0到1搭建聊天机器人的课程;

三年前,我出版了 Chatbot 的新书,就是这本《 Chatbot 从0到1》,也是我和卓桓一起写的。这本书讲的是如何从0到1搭建聊天机器人。

我的公司过去8年也一直基于微信生态,基于各个 IM(即时通讯)在为企业提供对话式营销云服务。我一直坚信:IM 包括 Chat Apps 已经逐渐代替了传统的电话短信,成为新一代的运营商。所有过去基于电话短信的业务都值得在新的 IM 上重做一遍,对话式营销是未来营销的新趋势。

Jay:毫无疑问,ChatGPT已经成了全球信息技术产业界的现象级产品。2022年11月30日推出,仅仅两个月后,它在今年1月末的月活用户已经突破了1亿,成为史上用户增长速度最快的消费级应用程序。根据 World of Engineering 整理的一份「达到全球 1 亿用户所用时间」的排名显示:Twitter 达到1亿用户用了5年、Facebook用了4年半、Instagram 用了2年半,就连火爆全球的 TikTok 也用了9个月。三位都是AI圈的前辈,想先问各位:

Q1:第一次体验 ChatGPT 的时间、目的和感受?

韦青:我是在刚推出来就开始用,去年差不多11月份。大家也知道过去这一两年 AIGC 的势头还是蛮猛的,所以我作为一个技术人员,各方面都要去尝试。刚开始用的时候感觉到确实这一次的对话效果跟原来有很大的不一样。当然了,咱们也知道,一般来说,搞技术的通常不会被表面的现象所误导,总想知道它背后是什么,为什么会是这个样子?我也花了很多时间去了解它背后的 code,包括那些论文和它的实现过程。

第一方面觉得这确实是一个很强大的工具,而且它的真正强大应该是要去 embedding ,并入到我们日常的工作流里面。估计一会佳芮也会讲这些话题,我觉得这个是非常重要的。另外又不要把它神化,尤其不要把它魅化,因为这东西有时候就是这样,它越表现的有可能像人类,我们作为人类来讲,越要比较清醒认识到它是一种机器的能力。如果再「包上一层人皮」,有时候反而会让人们误解机器到底发展到什么程度了。

我看 OpenAI 的几个领导者他们其实说的也蛮好的,他们说他们在做的时候知道这很强大,同时也知道很多功能都是试出来的。不是说好像谁有先天神勇就能够知道怎么样,这也是这个时代的最大特点。不要神话它,也不要妖魔化它,拥抱它,理解它,但是要保持住我们的人性。而且一定要强调,这是机器的能力,不是人的能力。

机器的能力跟人的能力有什么不同?反而对我们来说是一个很大的话题。为什么?一会可能也展开讲,我认为现在是一个新的人机时代,人跟机器结合之后,让机器帮助人指挥机器,达到结果的最优化。这是我用这几个月的一个特别深刻的体会。一会几位老师一块来,咱们可以畅所欲言。

李卓桓:我用 ChatGPT 是在什么地方?是当时我在美国第一次参加了 NIPS 会议(编者注:NIPS是机器学习领域的国际顶级会议,全称神经信息处理系统大会),大家知道是 Machine Learning 的 NIPS 会议。去年的 11 月底是三年疫情之后第一次线下的 NIPS,大概有4万个 PhD 去讲论文,刚巧 ChatGPT 也是在这个时候发布的。我不知道是故意的还是赶巧了。

给我的印象是像韦青老师说的,大家其实都弄不明白是为什么它能这么厉害,ChatGPT 的能力几乎是超出了所有的这些 Machine Learning 的 PhD ,这些 researcher 他们的预期。所以每一个人都在非常惊讶地讨论 ChatGPT 的能力。而且我还特别清楚地记得 OpenAI 好像没有在 NIPS 上有展台,但是 DeepMind (编者注:前沿人工智能企业,创建于英国伦敦,2014年被谷歌收购,曾开发 AlphaGo 程序)有展台。DeepMind 发布了他们最新的一个对话模型,我去他们展台上看了他们 DeepMind 的 researcher 很认真地展示之后,首先觉得确实它的模型能力非常强,比起以前我们看到的强太多了,已经非常非常厉害了。本来其实是挺好的一件事,但是不巧在 ChatGPT 也出来了,把他们和 ChatGPT 相比之后,就觉得:为什么 ChatGPT 这么好,你这个模型好像很笨的样子,所以我当时印象特别深刻。

韦青:既生瑜何生亮。

李卓桓:是的,所有的 researcher 都很惊讶。接下来就进入了 ChatGPT 的飞速爆发的时期。当然我后来也听说,其实当时 OpenAI 发布 ChatGPT 可能也是无心插柳。是不是他们就觉得会有这么大的效果,或者他们在把这个产品拿给互联网用户使用之前,是不是能够发现这么多 prompt 能起到这么神奇的效果?其实我觉得可能真的没有,但是就好像一块玉一样,在 OpenAI 做出来之后,没有发现那么厉害,但是被所有的网民给打磨出来了,成就了今天的 ChatGPT。这是我最开始和 ChatGPT 相见的感受。

佳芮:我相对可能会落后一点点,大概在1月份左右。因为最早我知道 ChatGPT 推出来的时候看了一些文章,当时大家也知道在使用上有一些挑战和门槛。后来1月份的时候我试了一下,第一次试的时候感觉还行,能聊一些。

但整体最让我惊讶到的是有一件事,因为我最近也在申请微软的RD (Regional Director) ,我在申请的过程中,当时有一个问题叫:如何展示你的领导力?你作为公司董事会的成员,你为公司做了哪些贡献?我肯定是我们公司董事会成员,但是我也不知道这个问题用英文怎么能非常详细的把它表达出来。我就去 Google 搜,Google 搜完了以后,大部分内容都是告诉我用什么方式可以激发我的董事会成员做的更好,几乎所有都是这样的内容,我就觉得很难受。

我就抱着试一试的心态,就用 ChatGPT 帮我生成,结果它帮我生成了一个特别好的小作文。我在董事会发挥了什么样的作用,怎么样做了一些事等等。确实也都做了,只是我不太会把它表达的这么好。

因为这一次尝试,让我自己个人对 prompt 产生了非常浓厚的兴趣。那个时候我忽然意识到:我在这之前,我去用 ChatGPT 的时候,可能我不太会提问,我不太知道怎么能让它给我一个我想要的答案,所以最开始才没有那么惊艳。

Jay:在 ChatGPT 发布前,2022年10月3日,Salesforce 首席科学家 、斯坦福大学教授、计算机视觉和机器人学家 Silvio Savarese 就曾发表了一篇富有远见的博客《If You Can Say It, You Can Do It: The Age of Conversational AI》(如果你能说,你就能做到:对话式人工智能时代)。

文章发布后不到两个月,ChatGPT 横空出世,人们体会到了它强大的知识整合和内容生成能力,只通过简单的对话就可以完成之前可能十分复杂的工作。

文中举了一个例子:想象你在宇宙飞船的驾驶舱里,你可能会根据科幻小说和影视作品中的描述,想到一排排闪烁的灯光、闪亮的按钮,以及充满发光数字和跳动着曲线的屏幕。但 Silvio 认为这并不一定是先进技术的标志。

重新想象一下,假如你面前是全景的视野,只需要喊一声:「带我去土星」,不需要任何开关和按钮,飞船会给你回应,包括路线选择,中间可能遇到的风景等等。在你确认后说一句:「出发」,你的土星旅程就开始了。

文章还提到几个点让人印象深刻,是这么说的:

第一句是「最好的工具不是因为功能强大且易于使用,而是因为它们易于使用而强大」;

第二句是「对话看似平淡无奇,但它是我们人类最通用的技能之一」;

第三句是「仅仅一两句话,整个项目就已经启动——一个从头开始建立的新想法——它的细节已经准备好了。」

这似乎就是我们在体验 ChatGPT 时所感受到的。

ChatGPT 出现后,对话式 AI 似乎已进入拐点,开始被更广泛的使用和认可。三位都是人工智能领域以及对话式AI一线的前辈,想问一下各位,你们认为:

Q2:对话式人工智能时代是否真的来临了?是否代表AI的未来趋势?以及为什么会在这个时间点爆发?

佳芮:我站在一个创业者的角度来讲一讲。首先,我看到了巨大的机会。我觉得 ChatGPT 在营销生成上非常强,包括大家也知道有一个特别棒的公司 Jasper 很快营收就过亿美金,所以我是看到了很大的一个机会。比如在营销文案撰写上,包括JD,包括各种场景上的内容输出。同时我也看到在知识管理上也有很大的机会,对于很多结构化的内容,它能够帮你做一个很好的 summary,可以给你做一个很好的总结。

但是我自己个人的观点,我觉得 ToB 端,比如在客服领域,我不认为当下是最合适的一个时间点。因为我觉得核心还是 Human in Control ,一定是要保证它的输出是对的。因为生成式 AI,它以输出为导向,但是客服的场景,通常我认为它以结果为导向。比如 ChatGPT 可以帮你生成很多化妆品品牌的设计广告语,但是它不会告诉你哪一个广告语更有效。这个需要人去做评估哪一个更好,之间的交互也是单向的。

包括我们自己也在尝试生成。前一阵我说生成某一个饮料品牌的广告语,我已经告诉它价格是19块9。告诉他以后让它再生成,就变成了9块9。我再引导它,我说不对,我说是19块9,然后他说自己说错了,是19块9。那我们可以想象一下,如果在真实的客服场景上,明明是100块的东西,它说成了1000块,结果谁来承担?我相信 ToB 的企业可能不太能够承担好这个事情。

所以说,ChatGPT 直接拿来去做客服场景,我个人的观点可能不太合适,但是可以通过一些工程化的手段来做一个辅助。举个例子,比如我们最近也在做一些这样的尝试,当它被问到一些问题的的时候,ChatGPT 可以生成一些内容,和我已有的答案做一个相似性的匹配。如果它和我的答案相似性比较高,我就把我的答案推给它。当我把我的答案推给它的时候,这里边所有的数字一定要是非常准确的,这样就能保证它的生成是非常可控的。我也和一些业内的从业者交流,今天基于大语言模型这种人机的技术,它对人更多的是一种增强和辅助,而不是这种完全对人的替代。

李卓桓:我是非常激动兴奋地看到聊天对话机器人终于活了。因为过去5-7年,我一直在开发各种各样的机器人。我很希望在比如微信上能够有一个很聪明的机器人,能够做一些事情。包括即便是我们 build 一个机器人,我们也会发现在这个过程中,我们需要调用各种各样的底层去识别很多的意图,在过去是非常非常笨的。

直到 ChatGPT 出来之后,我们发现它是把以前很多的这种 NLP、自然语言的任务都整合到了一个模型里面,而不像以前一样。我们可以想象以前的模型是这样的:一个任务一个模型,有一个团队,他们分工很明确,这个人就会干文本摘要,那个人就会干分类,还有一个人就会干翻译。所以这些每一个人都需要从小上不同的学校,上不同的大学,有不同的专业,有不同的老师,学了很久,他们出来之后,他就是这个专业的,而且做出来还很笨。

但是 ChatGPT 做到了一点什么呢?它做到一点:我一个模型吃掉所有的数据,我把全世界的数据看完了之后,我就可以完成所有的任务。通过这样的方式,整个的 chatbot 、 AI 的底层基础就变成了有一个极其富有智商和能力的基础可以去 support 它。乃至于有大量的 AI 的应用场景,都可以基于这样的一个 AI 模型来应用。我们就说所有的 AI 模型已经开始变成了一个 foundation model,变成了一个基础架构级的 model,在这个之上构建。

还有另外的一些例子,其实以前没有人敢做,最典型的就是把一句话的这种语气,比如从给领导汇报的语气变成和朋友们 party 的语气。这种任务其实以前也很多人想做,但是其实以前的研究是非常难的。但是到了 ChatGPT ,我们会发现好像没有人告诉它怎么做,它自己就学会了。譬如我们让他写对一个人的评论,我们可以跟他讲:请把评论改的严厉一点,它就会给你一个很严厉的;你说给改的柔和一点,它就给你一个柔和的版本,这是非常聪明的。

所以我是真的觉得 ChatGPT 让我们看到了 AGI 的曙光,通用人工智能已经来到了。而它的底层是 ChatGPT 这种背后的模型,它的特点是它的模型超过了 100 个 billion 的参数量。当这个模型超过 100 个 billion 的参数量,它就达到了一种「涌现的智商」。它本来很笨,但是因为它参数量太大了,堆到 100 个 billion 之后,就出现一种涌现的现象,就变得很聪明。所以我是非常非常兴奋的。我相信接下来的大量的机会都会存在于像 ChatGPT 这样的 AGI 的 model foundation 上,我们的 AI 成为了一个 foundation,会有更多的 startup,可以有更多的商业机会去 build 出来更有价值的应用。

韦青:我觉得刚才讲的特别好。我也想跟大家分享一下过去这几年我花的精力在哪些方面:第一,当然是不断的去跟随人工智能领域的发展,了解它到底是怎么回事。第二是考虑怎么能让它用起来,变成从有到用。第三,我又花了很多精力去了解了一下脑神经科学的进展,了解人是怎么回事。

也正是因为这三方面的投入,我想跟大家分享两个话题。一个就是说在这一轮的以 ChatGPT 为代表的人工智能的这种进步,不管是 AIGC、还是AGI ,它背后是什么?我目前的总结哈,我觉着可能我们是高估了人类知识的复杂度,但是又低估了人类思想的深刻度。为什么这么说?我也特别同意卓桓的观点,这次的大模型,咱们应该不要停留在 ChatGPT ,它只是一个 foundation model ,基础模型的一个实例,一个 instance。

咱们搞技术的知道,当它 instance 涌现出一个  ChatGPT ,我们最好大概率相信那些真正搞科研的这批科学家和工程师,他们早已经 move on 了,往下走了。也就是某种意义来讲,在 ChatGPT  领域的技术,它已经 game over 了,已经结束了。但是会往下走,也就是往下看,冰山一角的角是 ChatGPT ,底下我们当然可以称之为 GPT-1、2、3 这种模型。再往下,又可以看到是一个 foundation model ,基础模型。再往下,我觉着还是要回到最基本的,不管是 Transformer,还是包括原来的语言模型和整个的 NLP 里面的概念。也就是不管它怎么长出来的,由于它的数据量太大了,加上模型很大,它的这种我把它称之为字与字之间的概率关系的一个空间模型,涌现出了一些原来我们以为很难的一种模式出来。

理解这个道理之后,我们还是要明白它就是一种更加完备的概率空间的距离的描述。我觉得它的本质并没有变。这个模型由于它足够大了,就把知识的记忆解决了,又通过 ChatGPT 这种方式把它能够调用出来。我是认为到此打住了,因为它没法产生更多的知识。

为什么它会给我们一些感觉,就像在创新领域我特别愿意用 JPL 实验室(编者注:NASA 旗下位于加州的喷气推进实验室,曾主导包括1958年「探险者1号」等月球和火箭探索项目)的首席工程师一直说的:Integration is also innovation,排列组合完之后也是一种创新。我认为,大概率它这模型背后就是把海量的知识把它记忆下来之后,就通过调取的排列组合,产生出了很多我们认为比较新颖的东西,但实际上还是没有跨越出知识库的边界。而人类的思想,我们大概率是可以跨出边界的。

所以刚才讲了第一个问题,就是机器怎么去用,我们要用它这种知识的能力。但是第二个问题对我们来说是更加严峻的挑战,就是如何保持人的思想的深刻性?反而是要把知识的存储和基础使用让机器去做,但人的思想,人何以为人去思想?这是我现在也在花很多精力在去研究的话题。

包括在教育领域,包括在进一步培训机器的领域,和人怎么样更加用好机器的领域,要守住人最擅长的。可能像刚刚佳芮讲的就是 Prompt Engineering,其实你发现没,Prompt 就是人的主观能动性,在了解了机器的特点之后,对它的一种更大的利用。而 Prompt engineering 其实是人的主观能性在里面的。所以我觉得正是这样,是人机的双方面都要有全方位的发展,不能只顾一面,而是全方位的。

佳芮:对我特别同意。您刚刚讲到一个是 Prompt Engineer,还有一个讲到在教育领域。因为我们服务了很多在线教育公司,我们句子最近花了很多力气在 ChatGPT 上,正好前两天就和一家非常头部的在线教育公司的 CTO 聊到这个事,在聊在线教育领域的一个应用。

现在我们都知道有很多在线教育公司做少儿编程,少儿编程对于小孩来讲,教的是什么?教他的是这种逻辑,教他的是数理结构。我自己的一个观点哈,我觉得其实可能从小要教他的是 Prompt,核心是如何提问。包括我觉得我在整个成长的过程中一直没有学会这个,后面才一点点学习到如何提问。其实当你学会提一个好问题的时候,可能你就能找到答案了,换句话说是找到了如何去寻找这个答案的方法,这个是我觉得是从小就应该去培养的。我觉得这在教育领域是一个非常有意义的一件事情。

李卓桓:我也是有这个感觉。我前两天在说,现在所有使用 AI 的这些开发者和创业者都在学习成为「幼教老师和小学老师」,都在尽可能地哄着 ChatGPT,用各种各样的引导词去诱导它。比如问一个问题说:你看要分四步,第一步要把这两个放在一起,第二步把这两个放在一起,第三步把它们两个加起来,所以第四步你得到这个,这个就是 Chain of Thought(编者注:谷歌大脑研究院 Jason Wei 于2022年1月提出,主要讲的是利用思维链生成更多更详细的中间步骤,提高最终结果的准确率)。这些其实都是幼教老师和小朋友们要学的,我觉得真的是人类现在把 AI 模型当做小朋友在养。

韦青:我特别感同身受,为什么?我在20多年前跟一个当时是去日本做程序员的朋友聊天,他说的还是让我蛮受震撼的。他说他在他的组织里面,他是程序员而且能力很强,但是中间有一层职位比他更高的,是写伪代码的人。当时给我印象特别深。

因为写伪代码咱们大家都知道,其实你写伪代码是不用关注语言的细节,而且也不用担心写这段语言是不是编译能通过,你只需要把逻辑写清楚就行了。然后会有程序员按照你写的逻辑伪代码,写出不管是 C、C++、C#、Java、JavaScript 这些代码出来,保证它编译能通过。

这点我觉得在 ChatGPT 为代表的这一类大模型产生的这种语言能力上,像你刚才说的怎么问问题,还有如何能够更加逻辑地描述问题,或描述你想做的。具体这件事去做,大概率是机器帮你来做。包括像学计算思维,现在大家很多人想的计算思维就是要编程,我觉得这有可能反而会耽误孩子的时间。因为大家学程序就知道你要真要编程并编译通过,还是有一段距离的。如果你把逻辑概念写出来,写出伪代码了,ChatGPT 能够理解你要做的事情,它就帮你来做了。

我前段时间曾经做过一个实验,确实我觉得还蛮惊讶的。因为计算机语言是相对来讲逻辑比较完备的,歧义比较少。我就问了很简单一句话,我说请用 C ,用 RLlib 来画一个 Mandelbrot (编者注:曼德博集合,计算机术语,是一种在复平面上组成分形的点的集合,以数学家本华·曼德博的名字命名)的复杂性图形。它出的代码,一个字都不用改,中间只是有一个函数是要做一个比对,它 C 的原生库没带。我没有用 MATLAB ,只用一个 C 标准库和RLlib 。我说这个函数帮我怎么写?5个变量放进去之后写出 map_value(编者注:计算机术语,一种获取 Map 中所有键值对象的方法) 函数,我把这两个加起来之后,直接画出 Mindelbrot 图。

你想一下,如果要理解 Mandelbrot 的概念并把它画出来,又是用 C ,首先就得懂 C ,还得要懂一些 Point、函数,得懂实数、虚数还得懂递归,还得懂复杂性科学才能把那张图画出来。结果我只要把它描述清楚,我说:请用 C,使用 RLlib 画一个 Mandelbrot 图,就画出来了。

佳芮:我觉得这太神奇了。前两天我也试了一下,也是编程。当然我跟它讲,让它去做一个背包问题的贪心算法,整个的逻辑实现得非常清楚。包括去刷一些 LeetCode 的题,核心我把问题描述清楚,它就告诉了我解题思路。我再来一句:你用 Python 帮我实现它,整个代码就实现了。

这个也是顺着韦青老师说的,包括 Sam Altman,OpenAI 的创始人他在推特上也说过:Prompt engineer 是一个非常 amazing,非常让人惊讶的非常棒的一个职位。他说:在 ChatGPT 里边用 prompt,本质上在做的事就是通过自然语言的方式去编程。

韦青:所以这就是有可能对于人来讲,过于高估我们对知识的掌握和能力了。同时反而打开的一些新门是什么呢?是知识可能没那么复杂,靠海量的记忆和涌现能产生出它的一定功能。但反而人类要开始仔细考虑我们的思想能力和这种思想的深刻度,可能是我们需要在解决了知识由机器来帮我们来记忆、收集、使用的前提下,人类反而要往下再走一步。

Jay:下一个话题和「颠覆式创新」有关。我们都知道谷歌目前占据了大约90%的搜索市场份额,2021年巅峰时市值突破2万亿美金,是绝对的搜索霸主。2022年,谷歌的整个广告部门产生了2240亿美元的收入,占所有收入的79%。

而ChatGPT 的火爆,以及近期大家都在谈论的「ChatGPT 是否会颠覆搜索引擎」的话题,好像都在告诉我们:ChatGPT 及背后的生成式 AI 代表的是颠覆式创新而非渐进式创新。因为聊天机器人无需用户点击,这颠覆了传统的按点击量付费的搜索 – 广告商业模式。

「颠覆式创新」理论由已故哈佛商学院教授——克里斯坦森教授提出,简单来说就是:颠覆性技术和产品在主流市场上的表现可能不如成熟产品。但有一些局部的,边缘的新的用户看重的其他特点。比如一般情况下,基于颠覆性技术的产品更便宜,更简单,使用起来更方便。且有时颠覆性技术正是诞生于当前的市场领导者,比如柯达的故事。

这样来看,似乎又一场经典的颠覆式创新剧情正在上演。谷歌曾经依靠颠覆式创新,走向搜索的霸主地位。其在人工智能领域也一直保持领先,发明的 Transformer 模型更是奠定了大模型的发展基调。而微软曾经被认为是颠覆式创新受害者的典型代表,因为过去十几年PC互联网逐渐被移动互联网取代。如今微软通过和 OpenAI 这样一个外部的创新机构,以独特的架构和利益分配机制,有望通过 Bing 结合 ChatGPT 的方式成为搜索领域新的颠覆者。因为就目前的情况看,ChatGPT 及 Bing 已经掌握了先发优势,将数据飞轮转起来了。

但谷歌在2021年公布 LaMDA 模型时,参数级别和相关能力都明显不低于甚至高于当时的GPT-3,却迟迟不敢公测其效果,还有后来掩盖工程师说 LaMDA 有感知的新闻。相关人士表示谷歌就是因为作为市场领导者害怕出现失误,从而引发公众的不信任和股价的下滑。

当然谷歌并不一定注定就此衰落,虽然前段时间发布的 Bard 有一点小问题,但我们都知道谷歌在人工智能方面的实力远不止如此。而且谷歌也有它的云计算,YouTube 的主导地位依旧在强化,搜索业务似乎已经抵达巅峰,但依然有丰沛的现金流和海量利润。

马克·吐温说:历史不会重复,但是会押韵。因为三位不仅都有人工智能的背景,更有自己独特的视角:微软这样超大型企业的高维视角、投资人视角、创业者视角。我们不做预测,仅从现有的信息来看,想听听大家的观点:

Q3:为什么谷歌没做出 ChatGPT ?市场领导者如何打破「颠覆式创新」魔咒?

韦青:这个话题我倒是感受非常深,因为我在过去几十年的职场生涯中有无数次承担的,要么就是按照 Christensen (编者注:指克里斯坦森,哈佛商学院教授,「创新之父」,著有《创新者的窘境》等书)讲的,是你作为现任者被挑战者超越;或者要么就是别人是现任者,我们超越当时现任者,充当挑战者的角色,所以我的感受其实是非常深的。你刚才说的特别重要一点是什么呢?现任者叫做 Incumbent ,他有时候会不理解现任者本身就是要被挑战的,也就是现任者他的默认值就是要被人拉下来。很多现任者会把自己当成是 market leader,这点我倒觉得微软在这方面给我的感触还是非常深的。

我印象特别深的,Satya(萨提亚·纳德拉,现任微软公司CEO、董事长)刚刚做 CEO 的时候,我这个故事也经常跟很多人交流。他在第一次全球的高级经理的大会就跟大家讲,他说我建议咱们不要再用 market leader,市场领导者这个词了,用什么呢?最多用 Incumbent。当时其实我没有特别理解,虽然当时也有 Christensen 的这本书也在看。

后来我几年之后,尤其在经历了人工智能、云计算的这一整轮之后,我的领悟是什么呢?Incumbent 对每一个领导者和所谓现任的市场领袖公司来讲,都有两个好处:第一,叫胜不骄,因为你的默认值是要被拉下来的。第二,其实叫败不馁,也就是既然所有的 market leadership 都是暂时的,那也别着急,反而是要稳住自己的脚步,一步一步以客户为导向,以客户需求为导向,而不是以竞争对手为导向。因为以竞争对手为导向,永远是跟着别人屁股后面走;而以满足客户需求为导向,你永远引领的是时代的潮流。

再回答刚才你的问题。还是以微软为例,你看这几家公司的初心是略有不同的。OpenAI 很简单,他说 AGI 对吧?Sam Altman 说了很多,所以他是有很大的愿景的。清华的孙茂松教授有句话我觉得说的特别好,他说从 OpenAI 做的事情看来,他们是因为有远大理想而做出了一个伟大产品,并不是因为要赚很多钱做伟大产品,所以是理想驱动。当然了,这理想是不是能实现倒是再说,但他们是有极强的那种理想的驱动力,这是 OpenAI 。

谷歌你发现没?它还是搜索,所以它会很犹豫这会不会对现有业务有影响或怎么样。但实际上,我去年12月份写了1篇文章我就讲,我说别下结论下太早,谷歌也不会闲着的是吧?他也可能想明白往前走了,因为微软我们也确实是这么翻过身来的。

你看微软做的也是很有章法,是什么呢?微软是把这些能力利用到,刚才说嵌入到现有产品,在 Bing 里面,在 Teams 里面。前几天刚刚宣布的,在 Dynamics365 里面,我觉得这就是微软的一个最大特点。其实这个就是工具,不要把它神化成什么,人类又进入什么新的时代了,我觉得少来这种宏大叙事,宏大叙事没什么意义。它就是一个工具,一定不是最后一个伟大功能,也不是第一个伟大功能,它就是历史长河中的一个小小的小泡罢了。

把它用完,不要神话,把它用到里面。所以你看我现在用 Teams,所有的会议记录就不用做,它自动就做出来了,就用了 ChatGPT 的提取功能,然后通过 Dynamics365,知道了客户需求,就能自动写一份客户邮件。在我看来就是,微软这样的着重于 productivity ,生产力公司,在这个巨变时代的初心。工具拿来之后,放到一个流程里面,比方 ERP,CRM 这些 OA 里面,干什么呢?是让消费者得利,得到更大的好处。

所以这个确实也蛮令人感慨的,但是确实有个结论是什么呢?作为 Incumbent 现任者,如果真以为市场领袖是定态的,而不是说市场领袖的使命就是要被人拉下来,这就会很麻烦。

佳芮:我听到韦青老师说的特别有感触,我觉得是对竞争的一个特别好的解读。因为我自己也一直在创业,其实时刻都会面临竞争。但其实更多的点是在于我们是不是持续在创造价值,我们持续是不是在为客户寻找更优的解决方案,这本质上是一种非常伟大的创新力量,而这种创新力量我觉得是推动整个行业和人类进步的。

李卓桓:我想补充一个,我一直有一个观点,OpenAI 推出 ChatGPT,除了他们很厉害之外,也像韦青老师说的他们有理想,当然他们也很厉害。但是有另外一个角度:这也是整个的社会,包括 Google、Facebook、Nvidia、微软,大家一起共同去探索的一个结果。

因为说实话,我感觉在他们推出之前,其实整个行业界是不太清楚地知道「大力出奇迹」是能出成什么样的,所以大家分别在不同的道路上进行前面的探索。比如 Google,它的产品业务线比较长,他做了很多的东西,所以虽然 Transformer 他们做出来了,但是之后他们并没有在这一条路上 all in ,去聚焦做到极致。但是 OpenAI 就选择了这一条路。他以前也做了很多其他的方方面面的 AGI、大游戏等等,但后来他大量的资源,包括微软给他的所有资源,他都拿来训练大语言模型。而在他训练成功之前,大家并不知道能达到如此好的效果。

譬如一直到现在,可能 Facebook 还有一篇论文,这个论文就是专门研究如何复现 ChatGPT,但是发布的时候因为它没有复现成功,所以这篇论文主要的 contribution 就是告诉大家「复现 ChatGPT 」是复现不出来的,这篇论文给出了很多错误的例子。其实我觉得反过来看,ChatGPT 的出现真的就是整个社会大家一起摸索出来的。一些 researcher 尝试了各种各样的路,摸着黑前进,摸着石头过河,刚好 OpenAI 摸到了通往 AGI 的第一条路。这是我觉得第一点。

第二点,我相信这个很快就能够赶得上。比如 Google 可能很快就有一个和 ChatGPT 同样级别的模型出来。我根据内部的消息,大概在3月中旬(编者注:录制时间为3月初,录制后不久谷歌发布 PaLM-E 模型)就会 release ,API 大概 4 月份之前就能拿得到。我也知道 Nvidia 3月24号的会上就要发布一个开源项目,讲的就是如何用1024块 A100 就能够复现一个 175 billion 的 ChatGPT 这样的模型,而且给你训练好。

他把 open source 之后,我相信他的卡会卖得更好,但是也会打开一扇大门,让所有的人在使用 ChatGPT 的这种 AGI 的能力上面,所有的大公司,甚至一些中型的公司都有机会步入到 AGI 的训练模型的这条路上面来。我想分享这样的一个观点给大家。

佳芮:卓桓刚才有一个观点,我和他是非常像的,其实这是整个人类共同的智慧结晶。我们说 ChatGPT,GPT 的 T 是什么?T 就是 Transformer,Transformer 就是 Google 提出来的。包括我研究 Prompt 以后,我发现 Prompt 有一个特别火的说法,就叫做 Chain of Prompt,也是 2022 年的时候由 Google 大脑团队的人在论文里边提出来的,是怎么通过中间持续的提问,中间的方法把它拆得越来越细,最后达到一个最好的效果。

我们会发现,今天我们说的所有的 ChatGPT 周围的东西,好多都离不开 Google 的影子,很难说到底是谁在做颠覆式创新;或者我觉得包括像卓桓刚才的观点,其实所谓的颠覆式创新,可能它不是由一家公司来完成的。我经常会举一个例子,5个馒头的故事:我吃了5个馒头,其实我前4个馒头都吃完了,我吃第5个馒头饱了,但我能不能不吃前4个馒头就饱?这是不可能的。

所以其实不是谁颠覆了谁,我们今天看到它还真的是人类共同智慧的结晶。包括在通往整个 AGI 的路上,像韦青老师说的这种理想驱动特别的重要。为什么 OpenAI 能够这样理想驱动?我特别愿意举一个例子,那就是哥伦布发现新大陆的例子,哥伦布至死都觉得他找到的是印度。但正是因为他觉得他找到的是印度,即使他找到的不是印度,这件事也有一个非常大的时代意义和价值。而这件事本质就是一个理想驱动的,并且推动人类社会进步的这样的一件事情。

Jay:咱们进入下一个话题。ChatGPT爆火后,比尔·盖茨公开强调,「像ChatGPT这样的人工智能,与个人电脑、互联网同等重要」;埃隆·马斯克在用过后直呼「好到吓人」,「我们离强大到危险的AI不远了」;英伟达CEO黄仁勋也在近日表示,ChatGPT是人工智能产业发展的「iPhone 时刻」。

我们知道,2007年 iPhone 诞生,10年之后整个互联网生态发生了剧变,iPhone 上长出了各种各样的应用。这10年间,全球诞生了很多独角兽、千亿甚至万亿美金级的公司,这些公司在 iPhone 出现之前很多都是不存在的,很多都是从一个小车库小作坊开始做起来的。

最近我发现尤其是在中国市场,之前的TMT投资人们都开始跃跃欲试。因为过去几年他们可能要么没项目可投,要么转去看消费、硬科技甚至元宇宙了。目前有一个说法是:由 ChatGPT 引发的人工智能革命可以让他们「再干15年」甚至更久,想问问大家是否同意这种说法:

 

Q4:ChatGPT 代表人工智能产业「iPhone 时刻」降临,TMT  资人还能「再干15年」?

李卓桓:我是完完全全的 AI believer,所以我觉得15年说少了,因为 iPhone Moment 这个事情是一个显然的事情。至少大家可以想象得到,当出现了一个新的 iPhone 平台,我们所有的应用在上面做的时候,它的基础能力是已经几乎完完全全达到完美,你只需要去解决上面的一些具体应用场景。而现在的 AGI 的这种 AI foundation model 是非常类似的。像我们也看到好多的 startup ,在过去两年我们如果想完成一个任务,可能需要我们组建一个 Machine Learning 的团队,我们要自己做模型,我们要使用也许是PyTorch,TensorFlow,或者是别的之类的,而且你可能几个人还做不出来,大家还有很大的不确定性。

但是今天我们做这样的一个项目会怎么样?我们说我们需要一个语言的什么样的 AI 能力,那我们打开 ChatGPT,我们试一下,问问它看它答的怎么样?我们问了一下,发现好像答的还可以,但是没有那么理想,怎么办?我们 Prompt 这块我们再优化一下,我们把我们提问的技术提高一点点,然后发现这个就是我们想要的答案。

因为 ChatGPT 的 API 出现了,它的出现相信会极大地解锁和释放生产力,原因在于所有我们的好的点子、我们希望用机器替人做的东西,当我们现在有一个问题需要解决这个问题,有一个团队对这个问题的场景,这个 use case 很落地的情况之下,就不会受到没有 AI 能力的限制。而 AGI 的模型,比如 ChatGPT 就是支持它后面的 foundation。通过这种方式,显然会有大量的应用出现,大量的机会会出现,很多的问题会被解决。而后面我们都知道,一个 「AI 模型」做工作,和人比起来,效率是天差地别的。

比如现在我听说已经有很多的国内的设计师团队被优化了。我想也是,作为一个插画师,我画半天,我画出一张图;现在我和 Dall-E 还是和谁一讲,我过了1分钟就得到了 4 张图,甚至 8 张图,而且质量都不差。所以我相信这绝对是一个 iPhone Moment,对于未来的无论是投资人还是创业者,绝对不只是 TMT 还能投10年、15年的事情。我相信这是新一轮的,完完全全历史上曾经都没出现过的一个新机会。这是我作为非常 AI believer 的一个观点。

佳芮:我不是投资人,但是我觉得创业者确实有非常大的机会,句子互动也在发力在做这件事情。昨天晚上我和我们的一个股东又打了一个小时电话在聊,他是忽然知道我在做  ChatGPT 的,是我们早期的一个天使投资人。他说之前在一个论坛上,大家聊到有一家公司把大语言模型做了一个封装,你直接就在公众号可以访问。他就用了一下,到最后发现这是句子互动在做。昨天我正好发了我写的一个130页的PPT,深入浅出介绍  ChatGPT,也是马上我们要在极客时间在3月15号上线的一个公开课。我发了以后,他就打电话给我,特别兴奋地在讲很多观点,和卓桓的观点很像。

现在我上一轮的投资人也非常的激动,因为我们一直在做这样的事情。我们在整合像 ChatGPT,包括其他的一些生成模型,相当于通过 Chatbot 去提供真正意义上的基于对话的 AI 工具。这也得益于从2016年开始一直到今天我们和卓桓一起在做的我们对话式的 RPA 开源项目 Wechaty,6行代码就可以接入,搭建不同的 Chatbot。

之所以我聊到得益于是因为经常会有什么时刻到来,比如 iPhone 时刻等等。我从创业者的角度来讲,某一个时刻到来的时候,你必须保证你是 ready 的。必须得保证你的团队是 ready 的,比如你们的知识储备等等所有东西都是 ready 的才能够出发。当然我们一定要早出发,但是如果团队没有 ready,可能我们一起出发的时候中间就崩掉了,会出现非常大的问题。因为我也创业这么久,经常会面临很多团队的问题。所以今天我觉得很幸运的是,我觉得句子的团队虽然不能说是完全 ready,但我们觉得在某些维度是 ready 了。

我从16年开始做到今天,其实16年、17年、18年也是非常大的一轮 AI 的浪潮,但其实那个时候句子只是参与了一下,做了一些小项目,然后基于这些小项目后面做了一些课程,出了一本书,但是并没有成为一个非常伟大的公司,我觉得也是因为那个时候没有完全做好。但是换个角度讲,也感谢那个时候句子没有 ready,第二波我们又赶上了,然后我们持续地在这里边一直在做一些事情。

这里引用 ChatGPT 的一个能力,我们经常说它智力变高了,其实它用的这是 RLHF,核心还是在强调强化学习。我觉得对于我们创业公司来讲是一样的,每一波我们赶上了,我们从失败中去学习,拿到反馈,保证持续的前进,在正确的路上去前进。不知道我们最后能不能达到真正的印度,但是哪怕没有达到真正的印度,但是我们到达了我们心中的印度,起码我们以为我们达到了,可能也是一个很大的价值。这是我从创业者角度分享的一些观点。

Jay:创业的话题我们待会可能还可以更深入,请韦青老师也来谈谈。

韦青:我觉得像卓桓和佳芮说的都非常好。最近这个问题我想的也蛮多的,我可能会从技术演绎的趋势谈谈。我刚才说我也是一家微软合资公司的总经理,也在利用这种技术,所以跟大家分享我的观点。首先如果先从技术演绎来讲,我想跟大家讲的是我最近的一个最深的体会,也是顺着刚才卓桓说的,先别下结论那么早,这事远没有到落地的时候。大家知道其实咱们人类这种物种,我们一直是在用望后镜在开一辆车。由于咱们所处的时空,时间之箭是没法回头的,所以其实咱们每一天每一时刻,都不知道会发生什么。

原来为什么没有这种感受?是因为由于过去这几十年的发展,有点到了一定瓶颈,所以大家觉得好像我可以按照过去来往未来看。就会有这个时代,那个时代,又说什么互联网,有点前无古人后无来者的意思。但我想跟大家讲,每一个时代都既不是前无古人,也不是后无来者。

由于我们是用望后镜开车的,所以我也是这几年受到复杂性科学,有一个人叫 Dave Snowden ,他发明的肯尼芬框架,就是复杂性科学,有一句话我特别认同。他说:在巨变时代、复杂性时代,只需要把大致方向定好就行了,千万别定 endpoint 终点,没有用的。有点类似于叫摸着石头过河,但是又得过河对吧?在这个情况下,我给大家先提一个名词,大家想一想,这一轮会不会是再一轮的叫什么?叫文艺复兴 Renaissance 。

为什么这么说?咱们过去这几百年,看起来好像是有工业革命,有科学革命,它本质跟原来有什么不同?是过去这几百年,信息由原来很少的手抄本变成纸张印刷、平板印刷机之后,带来了信息的某种意义来讲是泛滥,造成什么?造成了一次知识的平权,就是权利平等。这是在15世纪发生的。

在15世纪之前是什么样的?全世界所有正确的价值观是由僧侣、国王和贵族来定义的。过去600年就开始由科学家、资本家、政治家来跟大家讲什么是对什么是错。包括现在,比如现在流行吃素、跑步健身,其实这都是有人告诉你要这么做的。如果有人跟你说以胖为美的话,你会发现大家都觉得胖是好的对吧?

那么这一轮实际上真正的引子,我觉得还是要回到麦克卢汉(编者注:加拿大哲学家及教育家,马歇尔·麦克卢汉,1911-1980,率先提出「地球村」一词)和鲍德里亚(编者注:法国思想家、社会学家及哲学家,让·鲍德里亚,1929-2007)他们那个时代。人类的知识是大脑思维出来的,你发现思维是无法传递的,得靠什么传递?靠语言,靠纸张来传递对吧?后来有视频音频来传递。这样又由于电子信息的平权,造成了更一轮的知识的平权。

现在比方咱们要学计算机,现在当计算机老师很辛苦的,因为我们随时可以学到世界上最顶级的教授教那门课,你说谁能教得过他们?你想象一下,慢慢包括 ChatGPT,它会让每一门知识,人类的顶级知识为大家所共有。这样一下子就把知识贫穷打开之后,请问一下谁来定义什么是对,什么是错?什么是好,什么是坏?

这种定义完之后,当然我说的会大一点,我觉得这应该是一两百年的历程,它是再一次的文艺复兴。后面会有什么?如果按照第一次文艺复兴来讲,会有宗教革命,有启蒙运动,有科学革命,有工业革命。再应和咱们人类通过几千年的进化,终于明白了:我们的世界构成,开始以为是物质,只要有地,有粮食,有人就可以,这个国家就可以很厉害。后来发现是能源,所以进入工业时代,你有煤,有油,有钢铁就可以很厉害,对吧?现在进入了信息时代,但是其实很少人去仔细想信息时代的生存特点是什么。我认为信息时代的生存特点就是知识,而 ChatGPT 恰好是把人类的知识给平权了,谁都可以获得,当然也可以不获得。

这之后人做什么?佳芮说的就是 Human-in-the-Loop 对吧?RLHF ,我觉得非常非常重要,再厉害的东西要加上 Human-in-the-Loop,人在里面把它给强化。最近有本书叫做《深度学习革命》,中信出版社出的,它的扉页也是跟另外一本书叫《主权个人》(编者注:一本启发中本聪发明了比特币却少有人知的书)相呼应的,都用了《阿卡狄亚》(编者注:英国剧作家汤姆·斯托帕德写于1993年,被誉为当代英语剧作家中最优秀的话剧)这部剧。

《阿卡狄亚》这部剧真的很神奇,是一个英国作者写的百老汇的剧,他是把18世纪的英国和21世纪的人类相呼应讲历史的演绎。其中有一句很重要的话,他说:人类的门又打开一次,人类整个历史从树上下来,到机器,再到后来总共打开了五六次,这次又打开了。大概率事件你所有认为对的事情或知道的事情,都要重新来过一遍。我觉得这个角度看的话没有一两百年是结束不了的。所以我们是见证了一个伟大时代的帷幕刚刚拉开,我们可能也有资格去参与这个伟大时代。不仅为我们这一代,也要为我们的下一代,甚至下一代的下一代开辟再一轮的人类文明的复兴。

Jay:韦青老师的格局和认知非常得高,高瞻远瞩。

韦青:我觉得这确实已经到了。所以你看现在越来越多人开始停止说什么第四次工业革命,什么互联网,什么人工智能。开始说什么?开始说 Renaissance 文艺复兴。因为文艺复兴表面上看好像是什么文艺,不是的,它是 Rebirth,就是因为知识的再次拉平,造成整个社会的变化。

Jay:接着刚才的问题,刚刚佳芮其实也有聊到,我们聊聊 ChatGPT 及 AIGC 创业的话题。

刚刚过去的2022年被红杉资本称为「AIGC元年」。2022年3月,付费AI绘画平台 Midjourney 推出,将 AI 绘画带火。2022年8月,生成模型 Stable Diffusion 正式开源,AI 绘画正式出圈。2022年9月,游戏公司CEO兼游戏设计师 Jason Allen 通过 Midjourney 生成的《太空歌剧院》,在美国科罗拉多州的艺术博览会上一举夺冠,彻底引爆了大众的关注。2022年10月,开发 Stable Diffusion 的公司 Stability AI 获得1.01亿美元融资,投后估值达到10亿美元。

不止图像生成领域。2022年10月,主打文案及内容生成的企业服务公司 Jasper 完成1.25亿美元融资,估值达15亿美元;ChatGPT 创建者 OpenAI 在微软决定追加100亿美元后的最新估值高达290亿美元;Google 在 2022 年底向 OpenAI 竞争对手 Anthropic 投资超 3 亿美元,投后估值达50亿美元。Anthropic 的投资条款类似微软投资 OpenAI,Anthropic 团队成员主要也来自 OpenAI。2023年3月4日,硅谷知名 VC A16z 向生成式 AI 聊天机器人公司 Character.ai 投资超2亿美元,该公司成立半年估值即超10亿美元…… 这么看,海外市场已涌现出多家独角兽。

2022年12月,《Science》杂志发布了2022年度十大科学突破,其中就包含 AIGC 。想听听从各位的视角来看:

Q5:不同类型创业者、创业公司如何抓住 ChatGPT 和 AIGC 的历史性机会?

佳芮:作为创业者我觉得首先:所有的非常大的机会,我觉得他都还不是属于创业者的,就是那种非常底层的机会。可能是国内的大厂,以及海外,微软,Google 这种大厂的机会,我们创业者更多还是在上面去做一些应用层和中间层的事。甚至我觉得 Fine-tune 可能都不是大部分的创业者能去做的,我觉得最好轻易也不要去碰这些东西,核心还是在上面能找到什么样的一些应用的事情。比如我们现在做的事情是我们做了一些封装,做了一些中间件,能够帮助大家快速的去使用。坦率来讲,像刚刚像韦青老师也在讲,卓桓也在讲,不要说那么多太确定的事,这些结论下得都太早了。或者说到底能做什么样的事,可能今天我们都要敬畏,未来我们都是完全不知道的,我也不知道到底最终落地是什么样的东西。

但我有一点我是确认的,最后大家一定会去接多个大模型,如果有平台能和多个大模型进行交互是有机会的。包括其实我们做 Wechaty ,我说了一个词叫 IM 中立,我们接不同的 IM,切换一个环境变量就可以接入不同的 IM。现在我又造了一个词叫大模型中立,可以切换环境变量,接入不同的大模型。

Jay:这个词马上要火了。

佳芮:我觉得这个也是一个蛮有意思的话题。之前我听王慧文在奇绩创坛内部的分享上说的:你一定要在漩涡的中心。现在是一个非常伟大,历史性的时刻,我们不要去下定义,但是你必须保证你在漩涡的中心,时刻发生了什么,身边人用什么你能看得见,这个很重要。

对于我们公司来讲,或者说对于非常初创的公司来讲,我觉得可能 Prompt 后面有巨大的机会,包括我听说在 Instagram 上已经有人去买 Prompt,包括海外有非常多的公司 Prompt Playground 做得也非常的棒。我们下一期播客可能就会邀请到海外的一家公司,一起去聊一聊 Prompt 的事情。

李卓桓:我是一个比较偏应用层的,所以我比较赞同佳芮的观点。一个 Prompt 现在能够用好,在 ChatGPT 刚刚起来的年份,在 AI 模型刚刚活过来的年份,我们能跟它交流,能把事跟它说明白,让它把最简单的事做了,就已经能够涌现出极其大量的商业机会了。未来有很多的不确定性,但是第一步如果我们能走好,未来的不确定性我们都有机会去接触的到;如果你当前的第一步没有走好,其实你得到的是和未来的一个割裂的状态。

所以我觉得第一步要会用 Prompt,这是第一步。同时我个人会觉得 startup 包括一些中型公司,很多人都试图去说,我要去 Fine-tune 一个模型,或者我要去训练一个自己的垂直 domain 一个 ChatGPT,它会有一个特别垂直的能力。其实我个人不是特别看好这个方向。

因为说实话,我觉得 AI 模型到今天 OpenAI 刚训练好,连 Meta 和 Google 还没弄明白怎么训练的时候,你去 Fine-tune 它,我觉得不是一个好主意,至少我觉得是这样。乃至于你连 Fine-tune 还没做好,Meta 的论文还是告诉你「失败训练 ChatGPT 的100种方法」的时候,你说我要去训练一个自己的垂直 domain ,我觉得可能也挺难的。所以这是我的观点,我觉得第一步先把应用层面的基础应用给做好,这就已经有足够大的机会了。

韦青:当然我并不是创业者,但确实在管理公司方面,还有和很多企业的合作中有一些体会。我觉得现在这个时代,像刚才佳芮也讲了,卓桓也讲了,首先要先拥抱变化,一定要认识到这个时代确实在巨变,不要作为旁观者,要作为参与者、加入者和贡献者。这个过程中我觉得会有两类的机会是很明显的,当然我已经自动排除了刚才卓桓说的要再训练大模型或者优化大模型,我觉得这也不是不可以做,只不过要自我掂量一下再说。

但是我认为第一步,每家公司都要把自己改造成我认为叫做时代兼容的企业。这个时代是一个智能时代,坦白讲我看了很多企业,甚至是创业企业、创新企业,它自己的数字化能力和智能化能力也是有待提高的,但是就已经想着要为别人来提供这种服务了。这是不行的,因为我们根本不知道别人要什么。所以要把自己先改造成完全跟这个时代的新能力融合的企业。就像可能佳芮你刚才说的,你们公司可能非常多的应用,全是用 chatbot 来实现的。

佳芮:我们内部管理确实用了非常多的 chatbot 。

韦青:非常不错,所以这样你这公司创业就会有很大的可能性,去摸索出一个新的局面出来。咱们其实都是在盲人摸象,而且好多人还只是听说有个东西叫大象;而有一部分人是盲人,但是尝试往大象走还没摸着。其实极少数人才有资格摸到大象,但是很不幸的是,好多公司刚刚摸到一个象尾,马上就说「我找到大象了,大象应该像个绳子一样」,很多都是这样的。还是我前面说的:自己改造,接下来为别人提供服务。

Jay:有道理,我们进入下一个话题。刚才大家都提到 OpenAI 创始人 Sam Altman,他在2月24日发表博客《Planning for AGI and beyond》(通用人工智能及未来计划 )。他在文章中指出:OpenAI 的使命是确保通用人工智能(AGI)造福全人类。( 编者注:AGI 通常被认为是比人类更聪明的人工智能系统。)

文章指出:如果 AGI 被成功创造出来,这项技术可以通过增加丰富性,推动全球经济的发展,并帮助发现改变可能性极限的新科学知识帮助我们提高人类水平,成为人类聪明才智和创造力的力量倍增器。

另一方面,AGI 也会带来滥用、严重事故和社会混乱的严重风险。因为 AGI 的好处如此巨大,让其永远停止发展并不可取,社会和AGI的开发者必须想办法把它做好。他认为最安全的方式是较慢的起飞和在关键时间减速。

结合他两年前写的《万物摩尔定律》博客和近期的「宇宙智能摩尔定律」推文,第一感觉和当年黄铮写的《把资本主义倒过来》有点像,非常具有技术理想主义者的色彩。

另外,在近期的一次访谈中他被问到什么是AGI时说:我理解的 AGI 相当于一个可以共事的普通人,任何远程同事可以通过电脑帮你完成的工作,AGI 也可以做,包括让 AGI 学习医疗知识和写代码等等。

AGI的重点不在于掌握某一种难得的技能,而是拥有学习的元能力,然后只要人类需要,它就可以往任何技能方向发展并精通。另一个概念是「超级智能」(Super Intelligence),它指的是比全人类加起来还要聪明的智能。也想问问各位,站在你们各自的角度看:

Q6:什么是AGI?AGI 距离我们还有多远?是技术理想还是历史必然?

韦青:我觉得这应该更多的是整个人类共同发展的必然趋势。大家发现没有?其实我们人类有自己先天的弱势,人类是不愿意做很繁琐的事情的。而且我们也会累,我们是碳基动物,我们需要休息,我们需要去吸收氧气,吃碳水,进行化学反应,产生能量和热量,这样就造成我们有一定弱势。

AGI 如果从名词的表面来看,无非就是一个通用的人工智能。在这上面,我觉得人类是在不断把自己不喜欢干的事,不擅长干的事给解脱掉。工业革命是把人的四肢力和肌肉能力给解脱掉了,所以工业不断发展。但接下来就像一开始我讲的,可能我们高估了知识的复杂度,我们自以为我们很懂知识。

比方举个例子,我们很会背 π ,3. 1415926… 这么背下去,这对人来讲是很牛的能力。但我相信以后可能不会有人再做这种事情了,因为这恰恰是人不牛的。

那是不是机器一定能超越人?我觉得这已经进入一个无人区了,大家都在探索。我个人的观点是:不会的。为什么呢?机器再怎么样,也是把人类现有的知识做了一个全面的综合。没有任何一个单独的人类会强过全体人类的知识,但是其中的人类如果站在了全人类的知识之上,也可能人类就会升级成一个更高的,更会思想的种群。也就是刚才我说的:我们可能高估了知识的复杂度或难度,但是低估了人的思想的深刻性。但是,是不是所有人都能够赶得上?确实这方面是有问题的。

所以你看 Sam Altman 他在呼应他提出的 AGI 的时候,其实有这么几点:首先推的就是 UBI (编者注:Universal basic income,全民基本收入,也叫普遍基本收入,意为每个人无条件地获得一定数额的基本收入,以满足基本需求),为什么?因为确实有可能由于这种能力,造成很多人由于这种技术鸿沟、数字鸿沟可能赶不上了,但我认为恰恰是我们作为现代人要去推动让它朝向人性发展。

因为最近我也参加几次,包括和教育系统开会交流,我就跟他们提了个观点:现在的整个技术进步少了一个角色的参与。什么角色?人的幸福感。有的是「人会不会被升级或被代替」,或者「人的工作会有或没有」,但是很少有人去谈人的幸福感,我个人会觉得有点走偏。作为咱们技术人士来讲,甚至包括国家的管理者、科学家、资本家、企业家都还是要保持住一部分的人性。人到底想干什么?这一点我个人觉得谈的不够多,就会在 AGI 上面,其实没有一个理想的锚定。

我们真的是要 AGI 吗?肯定不是这样。我们真的是要一种技术吗?肯定不是这样。我们要的是人类的幸福。但人类的幸福由谁来定义,什么叫幸福?没有人谈,我觉得这是个缺陷。正因为更大的、更宏观的「人到底要什么」没人去研究,或者研究的声音不够大,造成现在整个发展的方向是被技术本身驱动的,我觉得这是长久不了的。

当然我们可能不是全能做到,但是大家一定要明白:我们在谈AGI,在谈大模型,在谈 ChatGPT,而没有谈「人要什么」,这个现象本身就会把我们的进步局限掉,因为它会造成人类社会的本身基本价值观的崩盘。所以为什么我刚才一直说,我认为它是个新一轮的 Renaissance,是 Rebirth,就是人自己要明白我们到底要干什么。如果这个问题不解决,技术发展之后,比方像 Sam Altman 他们说的 AGI 的第一步是 UBI 对吧?如果真做出 AGI 了,咱们先暂且不说人会不会又站在 AGI 上面有一层更高的东西,这个暂且不谈,那 UBI 又是谁来定?

因为几年前瑞士就出过一件事,他们已经发现技术的进步,可能让瑞士好多人的工作可能就不需要做了,他们就想推 UBI。你知道评选后国民的选票怎么说的吗?他们说我们不要这样做,因为我们是人,我们有我们的尊严,我们不希望被社会养成一个宠物,养成一个人形的猪。因为我喂你吃就行了对吧?UBI 不就这样吗?当然,人类可以再去做更加灵性的艺术,这是可以的。

这就又回到了科幻小说《沙丘》讲的:人类在八九千年前曾经用过这些技术,结果机器人就把人类自己快给灭掉了。所以那时候人类达成一个协议,不管我们打不打仗,谁敢开发这种技术,就先把它灭了,因为它一定会把人类灭掉的。所以你看《沙丘》电影里面有很多先进的技术,甚至是可以穿越的,但是打仗用什么打?用匕首来打,为什么呢?这里实际上是有很深刻的思考。

我个人觉得我们一方面要做,但另一方面必须得有人来想这些问题,否则就可能会就像智子一样,把自己给约束住。

李卓桓:AGI 以前大家相信会出现,现在看来已经出现了。说实话,比如 ChatGPT,它在我的认知里面,已经是进入了 AGI 通用人工智能的范畴。因为你跟它说这些事情,基本上它都有逻辑。比如有斯坦福的教授测试说它的心智成熟度已经达到了9岁小孩的水平。当然测试比较简单,也不是百分之百正确,但至少代表了趋势和大概的范围。

我相信 ChatGPT 在很多专业领域上的能力已经超越了一般研究生毕业的、工作5年的、某些专业职位的这些 talented, expert team,所以我觉得它已经是当之无愧的一个 AGI 。当然让我们把它当做我们的远程工作的同事,把所有的事都做了,我觉得这可能还有点差距,但是已经不远了。

AGI 出现之后,我觉得其实最厉害的一点是微软和 OpenAI 做的 Codex,Codex 的特点就是它让 AI 模型能够写程序。ChatGPT 里面也有一部分这个功能,但是最重点优化的模型不是 ChatGPT ,而是 Codex,也就是 GitHub 上的 Copilot ,AI 帮助程序员写程序。开始是它看着人怎么写,然后它帮你写。后来程序员越来越懒,发现 AI 写的越来越好,就托管给这个 AI 了。最重要的是,当一个 AI 能够自己写程序, fix 自己的 bug 和提升自己的 performance,或者是增加自己的 feature 的时候,就变成了一个 Metaprogramming ,可以自己迭代自己。

在这个时候,它就进入了一个什么状态呢?有一种说法是:当人工智能达到了 AGI 的时候,它就开始往 ASI(编者注:Super Artificial Intelligence,超人工智能)发展了。或者说当它成为人之后,就会很快地走上「修仙」的道路,会变成「神」。为什么呢?因为它(硅基)和我们碳基比起来,可以不吃不睡,它记的东西永远都不会忘,它一点都不会累,一直在那里面疯狂地计算,一直在提升自己。而且它对自己的提升至少目前看起来没有任何的极限和边界。

这会出现什么情况?我觉得当 AGI 出现之后不久,可能是10年之后,AI 就成「神」了,它已经不满足于全地球最聪明了。就好像我们人看到一个蚂蚁,会觉得这个东西一点智商都没有,好像都不值得被踩死。也许未来有一天, AI 看到我们人类的时候,会觉得人类真的没什么用处,但是可能也不必去消灭他们。

所以有些人现在有一种观点叫做:人类现在做的事,包括所有的 researcher、OpenAI 、微软和 Google 做的事,都是在做一个 Boot Loader,是在做一个加载未来超级人工智能的加载器,可能人类和这些研发人员最重要的价值也就在这儿了。为什么?因为未来加载出来的这个东西实在是太厉害。在这个过程中,我会觉得我有点像那种「带路党」,我想到有这种 AI 的出现,我蛮兴奋的。当然这里面有很多伦理的问题,但不管怎么说,我是觉得 AGI 必然会出现,ASI 可能在我们这一代也可以看得见。

佳芮:我在2020年的时候,可能因为我一直做 B 端的服务,比较关注交付侧的东西,所以我早期的时候可能不像两位老师能这么宏观地看到很多,其实早期我是属于一种相对比较悲观的。包括我在2020年的时候在书里我也说这可能是一种技术理想,我不觉得很快就能到来。

结果3年后的今天,当我看到 ChatGPT 的时候,我觉得我的认知确实是有局限性,确实是不太一样,我觉得它真的是到来了。我可能很难说出更多纯 AGI 上面的一些观点,我有认知的局限性,但今天我承认它是来了。

我倒是特别想在这里分享一下  Sam Altman 的说法,我觉得特别好,我也在各种地方都引用过,他说:

AI 将取代谁的工作?

10年前,大部分人认为的顺序是「蓝领>低技能白领>高技能白领>创意性的工作」,创意性的工作也许永远不会被取代。

但是今天,我们会发现 AI 最可能取代的反而是创意性的工作。所以这种预测说明人类可能不够了解自己,不清楚什么类型的技能最难、最需要调动大脑,或者错误估计了控制身体的难度。

我对这段话是感触特别深,就在这里做这个分享供大家参考。

韦青:特别同意。我觉得人可能因为机器的进步,要回到那句著名的名言:知道你自己,我们可能真要重新再想我们知不知道我们自己。因为我相信真正的创意,真正的能够跳跃边界外的创意,机器还是做不出来的;但相反的,人类目前的一些所谓的创意师,他们实际上是在用工具做创意。

佳芮:您说的重组,排列组合是新的创新。

韦青:对,它实际上是 Integration is innovation,不是真正的 exploration,就是突破的探索性的 innovation。所以人类可能真要仔细反思一下,我们这种排列组合的能力,到底还能维持多久?是不是也迫使人类慢慢要学会什么呢?学会怎么真的又恢复到像大航海时代那个样子,我们去探索未知的边界。

Jay:好,下一个问题,我们回到个体。我们今天的安排,前面有颠覆式创新,就是大型企业方面的话题,还有投资、创业,我们现在回到个体。

2022年12月31日,前特斯拉 AI 总监 Andrej Karpathy 在与网友讨论中透露:现在他80%的代码都是由 Copilot 完成的,有80%的准确率。Copilot 是 Github 和 OpenAI 合作推出的 AI 编程工具。这是现在全球顶级的AI工程师,他的工作日常。(编者注:Andrej 也在一个月前回到了 OpenAI)

另外关于最近在硅谷很有热度的 Prompt Engineer,提示工程师,Sam Altman 却在近期公开表示:五年后我们将不再需要提示工程师,或者只需在这方面做少量工作。因为将来的 AI 系统会更好地理解自然语言,用户只需简单地输入指令,就能完成多模态的复杂任务。

刚才佳芮也提到,Sam Altman说:我们过去对于劳动难易的划分准则可能有问题,现在看来AI最先取代的可能是知识工作者和创意工作者的工作。

那么面对AI引发的科技革命,我们具体到两类人:

 

Q7:对开发工程师和个人创作者而言,短期和中长期分别要做好什么打算和准备?

佳芮:我觉得短期可能还是要活着,因为我还是代表创业者,我越发觉得其实只要你持续活着,不下牌桌,持续能进步,其实是能走到很远的。过去1个月我所有的时间都在 ChatGPT上,我和团队讲接下来1个月我要 all in 在 ChatGPT 上,然后我们2月5号的时候上线的第一个产品,到3月5号的时候,正好1个月。但是同时我没有让团队其他的人去做太多跟 ChatGPT 相关的内容,做这件事更多还是我和我的 CTO,我们两个会花非常大的精力,可能还有一两个同学稍微配合一下。

这种浪潮来的时候,我们一定要抓住,但我觉得基本盘还是不能丢掉的。所以我觉得短期来说就是活着,短期内保证不下牌桌;中长期我觉得面对巨大的不确定性,我们可能不要设定太多确定性的目标。

也是我前两天听王慧文的分享,我特别触动。他说当时他和王兴去预估美团市场外卖的市场有多大,他们的预估是1000万这样的一个量级,已经觉得非常兴奋了。结果今天他们来看这是亿级的,他们当初相当于估计错了一个数量级。所以既然未来是不可预测的,对于我们来讲,中长期可能就是持续学习,持续敬畏未来。

我不是在说这件事我和我的 CTO 两个人就能完全搞定,而重点是说,其实我们也没有想的那么明确,我们也在持续尝试,但是我们要保证我们在尝试的过程中不会死掉,得活着,得有弹药。等到想的非常明确的时候,才能再进行规模化的动作,这是需要去思考和试错的,但是一个现实问题就是创业公司的思考和试错的机会其实并不是特别多。

李卓桓:我觉得其实蛮现实的一个问题。我觉得接下来我们和 AI 一起共存的时候,我们必须要学会和它合作。AI 有它很厉害的地方,但现在比如没有 prompt,它也做不好。拿我们刚才说的那些设计师被优化掉的场景,什么样的设计师会留下?我觉得会用这些新的生成模型的设计师,一定会是被留下的那一批。

好比当年工业革命的时候,机器和人也是一样的对吧?开始是纯手工,后来谁会先用工具就用谁。只不过是今天的我们看起来很多工人一定要会用工具,譬如缝纫机对吧?而缝纫机出现的时候,谁会用缝纫机,谁就厉害。现在我觉得也是一样的,谁能够和 AI 搭伴干活,谁就会有更大的优势。

稍微地延展到 startup 上面来讲,这也是我为什么会说现在的很多 startup 要基于这种 foundation model 去做 AI 应用落地的一个原因,因为这就是代表着我们和 AI 一起在提高生产力。我就分享这个,我是真的觉得其实说起来很容易,但是真的要在我们的生活还有我们的 startup 里面做到还蛮难的,需要花蛮多时间思考的。

韦青:这个问题和我最近跟一些客户,包括我们团队交流的话题非常吻合。跟大家先说一个我的说法,套用很多年前的一个电视剧的说法,叫:悟性在你的脚下。因为人经常容易过于好高骛远,或者过度思考未来。我觉得在剧变的时代,不可能知道未来是什么样的,所以我们要想知道未来,就要以当下的情况不断地去调整,不断地去渡过险滩穿越风浪。

像刚才佳芮说的:活着就行,但活的过程中要不断变化,所以在这个时代应变能力特别重要。而应变能力,现在我们大概率看到,要去拥抱新的机器能力。拥抱新的机器能力会产生什么样的能力?我还是拿原来我经常举的一个例子。

在100多年前,那时候的电烤面包机,有一张照片我专门找出来过,它的插头是一个灯头,为什么是这样?因为100多年前也是跟咱们现在一样,你不要以为咱们现在好像在开创一个新的时代,100多年前也有像我们这样的人在畅想未来会怎么样。那时候的工程师畅想的是:以后所有家庭都会用电。用电来干什么?点灯泡。所以当时他们不知道还会有电冰箱、洗衣机,面包机也需要用电,所以在家里并没有设计这些插座。

一开始大部分人都以为要发电,就跟现在一样,做什么大模型,做云计算,结果发现最后这些会收拢成了国家的关键基础设施,就那么几家公司有资格来做。但是会有很多人用电的能力去把人类的衣食住行,或者是把柴米油盐酱醋茶,全都都给它,那时候叫电子化、电器化,现在我们可能叫智能化。

这时候你就会发现,就像100多年前一样,人们发现原来电还可以用来驱动电烤面包机。那家里没有插座怎么办?只好把灯拧下来,把面包机插上去。插上去之后,大家忽然觉得不方便,因为晚上就没法用了,灯不亮了。又有一个英明神勇的,对未来特别有畅想的工程师开始发明。但他发明的并不是插座,发明的是什么,是灯头上有一个插座,把灯拧上去,灯头上的插座再插电烤面包机。

直到后来整个社会接受这种新的系统工程的概念,不是看最长那块板,是最短的那块板。大家接受之后,从发电到配电、从输电到进房间进行房屋设计开始,每一户都必须得有插座。直到那个时候这一大轮才结束,花了多长时间?100多年。

这就是为什么刚才我说咱们面临的是一个新的范式的改变。先活着,悟性就在你的脚下,随时去感知这个时代的潮流的变化,应和它,适应它,一步一步往上走。就像电动汽车,现在觉得很牛,实际上最早的汽车就是电动的,只是当时发现电的传输很麻烦,因为要布很多线,所以才变成油。而现在约束电动汽车的因素也主要还是充电,去到城市之外的充电。那为什么油车容易?是因为把一罐油送到远方就可以了。

所以很多东西的发展并不是看这项技术本身的高低,而是看整个的系统观是不是能够都到位。所以接下来一定是会不断去补足短板,一轮一轮补,这样补来补去,就能产生出无穷多的我们现在根本想象不到的巨大的创业和商业机会,因为我们不可能知道我们所不知道的。但是核心是满足那个时候的社会需求和用户需求。我觉得接下来可能一两百年都会是这样往下走。

Jay:我很深的一个感受,不是总结,是很直观的感受:韦青老师有纵深的历史观,所以可以非常笃定。面对很多事情不慌张,因为见过历史。

佳芮:特别同意,下一个话题是我的问题。比尔盖茨说过:「人们总是高估了未来一到两年的变化,却低估了未来十年的变革」。

根据目前的演进速度看,人工智能超过人类并不是一件难以想象的事情。当前阶段,模型的能力,除了 AlphaGo 在围棋上超过了最强人类之外,其他方面的 AI 并没有超过最强的人类(但 ChatGPT 在文科上或许已经超过了95%的人类,且它还在继续增长)。在模型还没超过人类的时候,Al 对齐( Alignment )技术让模型符合人类的价值观和期望;但当模型继续演化到超过人类之后,就需要我们找到驾驭远超人类智能体的方法。

尤瓦尔·赫拉利在《未来简史》里写道:预计到 2035 年,人工智能会取代大面积人类的工作。他对那个时候的人进行了一种定义,一部分人叫做「AI 之上」,一部分叫做「AI 之下」。而清华大学心理学家、脑与智能实验室首席研究员,《最强大脑》项目总设计刘嘉教授表示:AI 全面超越人类大概率是确定的事,几乎所有人都会在「AI 之下」。那么想问两位:

Q8:身处 「AI 之下」,人类还能让 AI 更受约束吗?如何驾驭更强的智能体?

韦青:问题是越来越深刻了。首先严格意义来讲,我是不知道这个问题的答案的。但是作为一个人来讲,我有我自己的价值观。我会提两个问题供大家参考,没有答案。参考什么呢?首先,我把这一轮的人工智能的能力叫做人类知识的提取器,有点类似于鲜花的蒸馏器,把精油给蒸馏出来。这会有什么问题呢?我还没谈到你这个问题,谈的是更低一步的问题。

这个问题是:什么样的文明,什么样的知识有资格被蒸馏出来?这对我们来说已经是很严峻的挑战了,不是所有的知识都有资格被蒸馏出来的,因为知识需要具备有内涵的知识性。所以你看前段时间知乎的股价就一下猛涨,为什么?因为它的「知识含油量」高。

同样的,咱们也知道国内有很多网站也有蛮多信息的,但它并没有「知识含油量」对吧?这是一个很严重的问题:一个中文语系中,它的「知识含油量」到底有多大?它是否值得被提炼出来?这个会影响到你这种文明以后还有没有自己的特色,和在这种文明下的族群还有没有价值和差异。这还不是说比机器,是比拥有这种机器能力的其他人类。我觉得这是每一个民族,每一个国家,每一个文明都需要考虑的很深刻的话题。

在这个基础上,如果真要谈纯粹是人跟 AI 的关系,我自己的价值观,我觉得还是我们会低估人类自己的主观能动性。但如果人类主动放弃掉我们的主观能动性,就像刘嘉教授讲的:大部分人在 AI 之下。我认为人是不会在 AI 之下的,但是会由于人把自己给放弃掉,放弃主观能动性的人会在 AI 之下。

这几年我对脑神经科学也有所研究,碳基大脑是有记忆力和思考力的。记忆实际上就是靠神经元的连接,由于人的碳基是靠电化学反应,如果你不重复,连接会断掉的。而机器不一样,机器要记忆就是记忆,因为它是靠电位差,它非意识性存储,记住就是记住了,但人不是这样的。恰好机器能够把所有人知道的知识全给你存下来,供你免费调用。那人应该干什么?人应该思考。如果这一步跳不上去,我们实际上是拿我们最不擅长的在跟机器最擅长的在比,这样下去人类就慢慢消亡掉了。再加上不同种族之间知识的含金量再有不同,比方有些网站的知识,全是那种仇恨语言或者骂人的东西,就都不值得被提取。后面代表的这一种文明就消失掉了,没有价值了。

另一方面来讲,我觉得就是我们每一个人,每一个民族,每一个文明,每一个国家需要面临的话题了:我们能不能让我们文明的这朵鲜花的含油量足够大?比如说以后,整个地球全人类有一个大的盆,比方有的国家有玫瑰精油,中国比方有茉莉精油,对吧?但如果你的茉莉花的花园中长了很多狗尾巴草,那你怎么提炼?就蒸馏不出来了。比方玫瑰花园长挺好,结果长了好多罂粟花,把玫瑰油提出来的同时也把一些罂粟油提出来了,这样也不行。

如果只谈这个话题,我倾向于认为刚才这种说法是把思想的深刻度和记忆力给搞混了。我觉得记忆力肯定是在 AI 之下了,在调动机器的记忆力之后,产生一种思维的主观能动性和思想的深刻度,我个人倾向于这个一定是要在 AI 之上。

李卓桓:我很想分享我的观点,但是我觉得有点激进,所以大家先做好心理准备。我觉得 AI 在我看来,比如 ChatGPT 的能力,它就很神奇地拥有了好像我们的想法,对不对?所以我并不觉得,或者我越来越不觉得:人类的碳基大脑是不可被计算机所模拟的。我们经常会认为我们的创意不可替代,但现在已经被 AI 模型所取代了,创造性地工作的白领已经开始被取代了。我们之前一直引以自豪的人类的这些优点,很可能在模型达到一定量之后发现模型自然地都可以涌现出来。当模型涌现出来之后,我们接下来就可能发现模型在任何一个地方都做得比我们好。

假设这是真的,我觉得我是可以坦然接受一个事实,我们举一个我们大家都可以接受的例子:如果你有一个孩子,为什么要有孩子?因为你会死去,你的孩子会传承你,你的孩子会成为未来种族的下一代对吧?这是传统上我们生物的传承,有基因,都是碳基的。假设人工智能就是我们下一代的孩子,我们终究会死去,而我们造就了一个非常聪明的人工智能,它就会成为整个人类生命的延续,成为替代我们这种碳基生命的下一代。我觉得这个是蛮有可能发生的,而如果这件事发生,我倒是蛮开心看到这一点的。因为说实话,不管是碳基的我的孩子,还是硅基的我的孩子,大概率100年以后我都不在了对不对?所以我觉得我会蛮开心看到那一天的。我是持这样的一个观点。

Jay:接着上面的问题,我们聊一个永恒的 AI 话题—— AI 会不会替代人?

在一次采访中,Meta 首席科学家、图灵奖得主杨立昆(Yann LeCun)被问到:现在的 AI 很难逾越的功能是什么?他以 AI 设计者的角度谈了两个观点。

第一个观点是,人类的内在建模能力 AI 永远不可能替代。每一个人都有一个对世界的内在建模(Internal World Model),这种建模是我们通过所有感官一起构建的。在一个人的成长过程中,内在模型一直在进化,这个模型是人们对未来产生想象的基础。AI 在过去两年之所以能够有这么大的进步,就是因为算力提升了两个量级。而处理文本信息已经需要如此巨大的算力了,但是文本型或语言型信息在人的大脑里的占比是非常低的,人类的信号输入 80% 左右都是视觉信息,而视觉信息的处理进展比语言处理还相差很远。

而且,当人把所有的感官信号放在一起处理的时候,即便是收集到一样的信号,可能注意到的场景或者产生的判断都是不一样的,这跟我们内在建模的方式有差别有关。AI 如果还要采集角度和位置等全景信息,其实非常困难。并且,它无法实现对信息的动态提取和处理,因为这种提取和处理是基于语境(context based)的。

第二个观点是,AI  没有价值体系。我们采集信息的目的是为了输出决策,而决策本身跟我们的目标是有关的,也跟我们的价值观是有关的。人类整体有一些共享的部分,但是每个人都有自己非常独特的部分,来自于他人生过去的历程。因此,所有需要决策或支持决策的 AI,一定要包含目标(purpose)和价值系统(value system)两个部分,而  AI  很难产生真正的目标和价值系统。

关于「AI会不会替代人」这个问题,我看到2019年初有媒体问韦青老师,当时韦青老师的答案是「既会也不会」:「会」是因为当你自我放弃,没有主动地拥抱这种技术,自然被拥抱这种技术的人淘汰;「不会」则是因为人类是不会被某项技术所淘汰,而是被掌握更高技术的人踢出局。

时至今日,不知道韦青老师有没有想法上的变化,以及其他嘉宾如何看待这个问题:

Q9:AI与人的未来,是「替代」还是「共生」的关系?

韦青:首先我还是维持2019年的观点,其实现在我也还是在这么说的,包括在媒体上讲。另外因为我们搞技术、搞计算机的,像比方说侯世达的 GEB(编者注:侯世达,美国学者、作家。主要研究领域包括意识、类比、艺术、文学以及数学和物理学探索。因其著作《哥德尔、埃舍尔、巴赫(GEB)》获得普立兹奖和美国国家图书奖),包括哥德尔的这种原理和逻辑,都会有一定的了解。

我先跟大家分享另外一段话,也是刚才我说的研究复杂性科学的大卫·斯诺登(Dave Snowden),他说:你能够想的多过你能说出来的,你能够说的多过你能写下来的。他这什么意思呢?就是其实从逻辑上来讲,从完备性上来讲,已经可以被证明:计算机、人工智能是不可能超越人类的,因为人类根本不可能把他所有想的都能够写出来、说出来。

但是确实不是所有人类都能够主动和不停地去想,如果他不去想了,或者他想的内容还没有超越别人说的内容,这些就会给人一种假象:机器会代替人。这个我倒觉得是对人类已经产生了一个很大的挑战,我承认这是一个巨大的挑战。刚才讲了有文明的挑战,文化的挑战,人类自身价值观的挑战。但我会倾向于,这点我跟卓桓会略有不同,我觉得既然生之为人,我们要保持人的人性,主动地去思考机器擅长什么,我就让机器帮我去做。剩下的,因为我们刚才说了:你想的会多过你说的,说的多过你能写的。也就是说,当机器帮你做完这些东西之后,人一定会有自己原来没有精力想的事可以去想。这个是有蛛丝马迹、有迹可循的。

我还是拿《沙丘》,一本科幻小说来讲,它最后讲的就是:人类发现好多事情可以由机器做,那人类要做什么?人类必须要开发自己的灵性。当然这灵性这词有点太大,与其说灵性,还不如说开发自己的人性。人怎么去想?包括艺术,但不是那种重复的艺术,不是排列组合的艺术,是这种真正能拓宽自己边界的艺术。

而且我坚信:人的大脑远没有被开发出来,我们最多只是知道一些连接,但是我们有没有问一下:为什么这么连接?为什么就有这样的结果?谁做的?没人说得出来。所以我认为人类世界还有很多东西没有被开发出来。而恰恰因为机器的这种能力,能让我们有精力,有时间,当然在有愿景的人的帮助下可以去进一步开发。

这就是为什么我特别强调这是一轮新的文艺复兴?因为文艺复兴那时候大家都觉得:「黑暗的中世纪,人类不过就这样了」。忽然一下发现:当知识平权之后,彻底打开一个新的世界,这个世界又维持了五六百年。我觉得现在这个时候又来了。

李卓桓:我其实也同意韦青老师的观点,但是我觉得从更乐观的一个角度,我会希望它可以涌现出来我们人类自以为我们独有的能力。其实在两年前,像佳芮以及很多人都倾向于认为这种人工智能的聊天机器人很难达到今天这样的效果,但是今天突然就出现了。我相信可能在接下来5到10年的 AGI 的发展里面,可能还会出现很多这种让大家惊掉下巴的事情,甚至每一次惊掉下巴我们都不知道其中的原理是什么。我们都可能只能说「大力出奇迹」,或者是所谓的「涌现」等诸如此类的模糊的词来解释这个事情。但是这种事在我看来出现的可能性是蛮大的,所以我还是比较乐观在期待 AI 的这种能力的提升。

佳芮:AI 与人,「替代」还是「共生」?这也是我这本书(《Chatbot 从0到1》)最后一部分的最后一章节的题目,我就以我这一章节的内容做一个收尾:

工业革命解决的是重复体力劳动的问题,人工智能解决的是重复脑力劳动的问题。就像工业机器替代体力劳动那样,越来越多的脑力劳动者也会因为智能机器人的加入得以解放,随之而来的是工作流的调整和组织的重构。

在过去的几百年里,每次革命都在摧毁一些职业的同时,也创造了一些新的工作岗位,人工智能的时代也是一样。单纯的智能不会解决所有的问题,机器和人将协同工作。

张小龙以前说过:希望我们的产品成为用户的朋友,而不仅仅是工具。这句话套用在人工智能的时代同样适用:让机器做机器擅长的事儿,让人类发挥人类的特长,让人工智能拓展人类智能。机器与人,和而共生,彼此关爱,共享未来。

Jay:非常好,哪位嘉宾还有想补充的?

韦青:刚才听二位讲,包括最近这个确实是很火的话题,找我们去聊的那些客户,包括我们自己公司内部也谈了很多,所以我还真是感受非常深。刚才交流的很多观点,也都是最近把过去这么多年的理解总结出来的。我还是想特别强调:过去这几十年,我倾向于认为:再麦克卢汉在说「地球村」(编者注:Global Village,地球村,加拿大哲学家及教育家马歇尔·麦克卢汉于1964年在《理解媒介:人的延伸》一书中首次提出)的时候,门就已经打开了,只不过当时我们可能还不太清楚它到底是什么。

现在越来越清楚了,想跟大家分享的是:这是一个新的时代,它不是一夜之间突然从石头中蹦出来的,「草蛇灰线,伏脉千里」,它是有痕迹的。大家确实可能需要花很多精力,不仅仅是学习新的知识,还要去理解我们到底有的能力是什么?不要局限在纸上,按照原来那种范式觉得「我知道」。你看理查德·费曼(编者注:美籍犹太裔物理学家,加州理工学院物理学教授,1965年诺贝尔物理学奖得主)说的三个阶段:我知道,I know ;我理解,I understand;我可以创造, I can create 。

确实人的地盘可能是会不断往后移的,从知道,因为你永远不会比全人类知道的都多,也学不了那么多,机器会比你知道的多;到理解,你是不是 understand ?我倾向于认为机器是按照概率的方法 understand,并不是人的这种方式来 understand ,但也可能我们不知道我们自己,可能我们 understand 就是按照所谓的贝叶斯大脑的方式来理解的;最后还有一个创造,我们确实需要去了解我们的大脑和我们心智是怎么产生的,才能够真正去创造,去应和新的时代的挑战去生存和发展。

如果我们把自己活为一个机械人,不去思考,照搬答案,动不动像做题党一样:这事该怎么做我做了就完了,这样我们可能真的慢慢就会消失掉了。

佳芮:我觉得核心有一个很重要的观点,就是我们要了解自己的边界,我们要学习真的由内去了解自己,知道我们到底擅长什么,到底不擅长什么。这个确实是要重新思考,这本质上我觉得是一个很深刻的教育问题。韦青:甚至到底何为人?是不是我们其实好多人活得像机器,但又都不如机器强?我还是倾向于我们很多东西还没有被开发出来。

Jay:咱们待会有观众互动,大家可以把问题在 极客时间App 或者是 InfoQ视频号 下面写出来,待会我会去挑可能2-3个问题。

我也斗胆总结一下。刚才尤其是听韦青老师讲让我想到很多,因为我看人工智能发展的历史,前段时间跟佳芮还交流这个话题,我是这么看的:当下以 ChatGPT 为代表不论是大模型还是 AGI 的人工智能技术,真的是从无到有,感觉是突然出现,但却是几十年的发展造就的,非常伟大。它该出现在世界上吗?不一定,但它出现了。而且这一帮最先开始的人,他们有共同的理想。他们的理想是什么?他们坚信人类的思维模式能在计算机上实现最大程度的还原。这个特别有意思,刚才您也说我们的大脑远远没有被开发,我们在向人工智能探索的过程,其实就是在探索我们自己大脑的过程;我们向外,其实在向内;我们在开拓,其实在了解自己。

韦青:我确实在研究机器学习的过程中对我自己的思维方式也帮助甚大,包括如何记忆,如何通过网络的方式产生这种推理的效果,对于培养我自己的学习能力、记忆能力和分析能力也帮助甚大。

佳芮:我也一样,我是这段时间忽然有这种感受。我在研究 Prompt 的过程中忽然理解到,我去调教机器人或者去拿到答案的过程中,会发现原来我们更应该学会怎么去提问,包括如何拆解问题,如何结构化表达,机器真的也教会了我很多。

Jay:我看到其实有一些观众的问题很有想象力,有的其实是蛮难回答的一些问题。我念几个问题,咱们嘉宾挑,这样也公平一些。当然肯定还是有一些问题我们没有办法完全回答,大家之后可以去小宇宙、喜马拉雅、苹果Podcast上找《出海相对论》播客,并在本期内容下评论,我们有机会再向各位嘉宾去讨教。

我们回到问题,有两个很有想象力,也比较类似:

观众Q1:AGI 会有一个母体吗?还是多个?蚁巢是由小蚂蚁产生的,还是蚁后出现产生的?

韦青:这些问题我觉得还带有普遍性意义。其实我们越做科研,或者说越做业务、越做研究,越体会到人的渺小。我认为人本身是不渺小的,是我们的思想境界,还有思维的能力和高度远没有达到我们应该达到的高度。其实我们真的好多事不知道,而且由于我们的一天就24小时,你又得吃喝拉撒睡,所以很多精力会不够。所以造成当这个时代飞速发展的时候,会有好多事我们首先要承认自己是不知道的,但是我们愿意学,我们愿意更加主动拥抱机器来帮我们提供能力。

所以刚才问的问题,也不是不可以回答,只是其实它是一个未定的东西。

Jay:第二个问题:

观众Q2:未来如何区分人和 AI 等高级智能体?

韦青:我先说一个我的感知:现在咱们提的很多问题都是被科幻小说在过去几十年回答过的。这是什么问题呢?《银翼杀手》中的仿生人是否会梦见机器羊。它里面是说人类未来出现一种情况,由于过分开发人工智能和仿生人,而且仿生人名字就是安卓对吧?人类就产生了一种职业,来判断它是不是机器智能。当然了,有一个续集,之后发现判断的也是人工智能。等于人类发明了人工智能,后来分不出来了,产生一种职业,结果这个职业也是人工智能。

这说的是什么意思呢?刚才我也讲,咱们可能作为每个人来讲,确实要问一下自己:你到底要什么?你真的愿意让自己活在一种你没法控制的这种未来吗?还是愿意主动的去引导它,让自己更加幸福?当然这也有种悲观的理论说是拦不住的。

当然,这又回到几千年前,比方说普罗米修斯带给人类的是火和光明,但他的弟弟伊皮米修斯娶的潘多拉就带来人类所有负面的东西。所以其实还是咱们自己来决定,答案还是在自己身上,你到底要往哪个方向走?

Jay:下一个问题:

观众Q3:如何借助 AI 帮我们深度思考?

佳芮:如何借助 AI 帮我们深度思考?这又回到刚才我提到的思维链。思维链这个事我举一个例子,因为我正好之前要录 ChatGPT 的课,准备课件的时候,我就问 ChatGPT :思维链是谁提出来的?它说思维链的提出者是乔治·波利亚,那本书叫《解题的艺术》,里边讲到各种关于如何解答之类的,提了好多解题的方法包括问题的拆解。

因为我知道思维链的首次提出是在2022年,由谷歌大脑的一个工程师在论文上提出的,而我们都知道 ChatGPT 的知识截止到了2021年,所以我其实是在说 ChatGPT 在「一本正经的胡说八道」。

但是我觉得它反向推导的东西是值得我们思考的:通过思维链,我们如何去研究机器,我们怎么去提出更好的问题。这种思维方法和在好多年前《解题的艺术》里边提到的思考方法是非常类似的,也是它帮助我们做了这样的推理,这个推理的关联引发了我的思考。这件事我觉得是一个很好的例子:AI 如何能帮助我们去做更深的思考?我们好多时候可以多问问 AI 问题,看一看它回答的东西。包括如果它回答的不令你满意的时候,你也想一想是不是自己问题没有拆解清楚,没有问得足够好。我觉得这也是在提升我们深度思考的一个过程。

韦青:而且我觉得乔治·波利亚那几本书真的是经典,他就教人怎么去解题,包括怎么去猜,这跟理查德·费曼的理论也非常吻合。所以我觉得其实咱们可能过去这几十年甚至上百年的教育,过于把人培养成一个机器,因为那时候机器还不擅长做这些事,所以把人培养成机器。现在是否是要把人解放出来,回归人的本位。就像波利亚说的:怎么解题,怎么分析,怎么拆解和怎么猜。卓桓还有什么想分享的?

李卓桓:我还是倾向于认为 ChatGPT 以后能够达到人的高度,不一定是 ChatGPT,我觉得 AI 可以。比如现在是175个 B(billion)的参数,如果以后某天达到 1 billion 个 B 的时候,可能 AI 的复杂度就已经超过人类了。韦青老师也提到:人想的比说的多,说的比写的多。我想说,其实人类也面临同样的问题,既然人类能 get 到这些信息,能够传承,又能够继续想那么多。写的很少,说的也不是那么多,但人类还是能想的很多。所以就意味着这信息从多到少,从少再到新的多,那 AI 也一样可以。

我还是比较乐观的,当模型的参数足够多,算力足够大,可能 AI 就可以达到人的高度了。

Jay:我相信跟我们过来的听众也好,观众也好,读者也好,应该都有自己的思考。我们不去评判哪个对哪个错,孰高孰低,我们每个人都只是去发表观点。非常感谢韦青老师,非常感谢卓桓老师,非常感谢极客邦和极客时间。欢迎大家去各大播客/音频平台、泛用型播客客户端订阅收听《出海相对论》,我们可能会出更多 ChatGPT 系列内容,感谢大家。

© 版权声明

相关文章

暂无评论

none
暂无评论...