跨越ChatGPT:大模型和AI的未来

0

朱 民

两会期间有两个很高频的词——“创新、科技”,在这两个热词的背后,可以观察到一个世界级的科技创新高潮正在到来。这次科技创新高潮有几个特征,第一是以人工智能为基础的巨大突破——ChatGPT。第二,因为人工智能的突破,改变科学研究的基本方法,称之为科学研究的范式改变了,不再是科学家依据实验室的观察写成数学模型,而是利用大模型来计算出数据。由此出现了第三个特别重要的特征,是企业家走在了科学研究和创新的前沿。企业家和科学家共同成为未来的科学研究大潮的主力,这是一个根本的变化。

本文主要的观点是,ChatGPT 的核心是背后的大模型,ChatGPT 只是其中的一个应用, 尽管它打开了一个面向消费者的通道,有很好的商业场景,但其核心突破在大模型,这是AI 产业未来突破性发展的关键环节。

今天是一个经济学家跨界的时代。ChatGPT,网上都在讲它确实厉害,很惊艳, 前景非常好,大家都在讲怎么追随它、怎么做自己的ChatGPT,各个网站现在讨论很多。我们的看法是,ChatGPT 很有意思,很有未来, 但它的基础是大模型,是GPT。而人工智能发展的核心正是GPT,是大模型,不是ChatGPT, 厘清这一概念,我们才能把所有的工作重点、赶超重点、研究重点放到大模型和GPT 上来, 而不是放在ChatGPT 上。当然,我们应该承认, 我们在大模型上落后,但是怎么发挥我们的优势,这是人工智能在中国未来科技创新以及未来经济金融发展中特别重要的一战,也是科技走到今天一个重大的转折点。所以,我们要跨越ChatGPT,看到大模型和AI2.0 以及它的未来。

ChatGPT 横空出世,有点像2016 年阿尔法围棋(AlphaGo)战胜了世界冠军李世乭一样,引起所有舆论的关注。它的应用场景确实很丰富,比如在财富管理中心,以往需要客户填表进行风险测试,今后可以利用ChatGPT 明确客户偏好需求,剩下的就是机器和机器交换, 构建财富管理的产品矩阵,做好风险管理,做优整个后台,让投资的精准度大大提高,产品也能大大丰富。因此,ChatGPT 是一个很有意思的产品。

比如走向医院,给你看病的第一个医生是ChatGPT,它可以把你的基本问题全部搞清楚,剩下的就是机器和机器的沟通和交流,给你做基本解答,再加上人的辅助,继而做出最终的解答。在这个过程中把数据全部留下来,这是了不得的事情。ChatGPT 基本上是一个语言大模型,它是WebGPT 的基础,最早是教上网查询的机器,但它主要应用于生成AI,可以不断推演、不断反馈,使得它的反馈学习加强,训练加强以后,能够把语言模型的输出和用户的意图连起来,反馈和强制训练强化一下,就爆发了。它的核心是Transformer, Transformer 之后的ChatGPT1/2/3,它的核心还是在Transformer 的集成。它的好处很多,能记住大量的信息,搜索效率也很高,做文献索引的能力已不亚于助理。

ChatGPT 能够保持对话和对话的一致性, 但它也能承认错误,与此同时,它支持多种任务,支持艺术创造、修改故事。它可以做翻译, 翻译得文字非常优美;它可以编码,可以写办公邮件……它的用途很广,因此特别火爆。它参加考试,可以考到中级以上的水平,这很不容易。当然它也有局限性,主要是输入知识的局限性,它的时间点基本停留在2021 年以前, 如果我们用最新的知识来测试它,它就有点跟不上。

从大的应用来看,ChatGPT 是从2020 年5 月的GPT3 开始,一直到DALLE 生成,再到ChatGPT,是从大模型发展过程中长出来的一个东西。国内也一直在做大模型,但我们在某些方面是落后的,落后美国两年左右;我们的数字生态也不够,所以不能从大模型短期内就衍生出ChatGPT 应用。

归根结底要回到大模型。现在是ChatGPT 大热的时候,在更深的层面上考虑问题,我们要看的是大模型的发展,这是影响今天、影响未来、影响中国、影响世界的最根本的科技发展。

大模型还是从GPT3 开始,1150 亿个变量, 一路走过来,我们有盘古,也有百度,清华大学最近也推出一个GLM。现在,GPT3 已经走到了GPT4,所以大模型的发展和应用进展神速。在大模型层面上走得最快的是深层次人工智能,能从文字转到图形、文字转到编程、文字转到影像录像,然后走向3D。现在生成AI, 可以做蛋白质的三维结构分析。深层AI 在整个大模型基础上向前发展,这是未来一个特别重要的方面。

与此同时,从文字到图像生成的模式,从GPT3 开始,到DALLE,再到DALLE2 是一个突破点,从文字到图像的过程发展得很快。再看对蛋白质的分析,我们可以对190 万个蛋白质用人工做三维的结构图,大概占已知蛋白质的1/100。不能小看这个数,这是在一个很短的时间内完成的任务。再仔细想人是什么?人是蛋白质组成的,如果我们能把蛋白质全部数字化,即便不把蛋白质合成一个人,但可以合成新的物种,那么蛋白质的应用现在也取得了巨大的进步。

这背后一个核心的变化是人工智能从1.0 走向2.0。1.0 是以编程为中心,2.0 是以数据为中心,这是一个特别大的区别。1.0 阶段聚焦的是算法、模型、程序,是软件工程师在主导;2.0 阶段是数据,数据越多越精越好,机器自己通过数据学习反馈优化不断生成、迭代, 这几乎就是一个无限的过程,而且脱开了人脑, 这是大模型和AI2.0 最大的潜力和最大的远景。我们已经看到了人工智能可以离开人,从已有的智能走向一种新的智能,而这个智能还没有被人普遍意识到。现在,因果人工智能发展更快,这些都为神经AI 发展提供了强劲的动力。

在这种情况下,产生另一个更大的变化, 就是人工智能“脱虚向实”。“虚”就是人工智能以前是服务于虚拟世界的,如搜索、资讯、信息等等;有了大模型以后,特别是生成人工智能以后,人工智能逐渐走向物理世界,通常是从文字到图像,再到音频、视频,到三维、到蛋白……第一个突破是蛋白,第二个突破是材料,这以后会走得更快,这是因为在大模型的推动下,科学研究的方式发生了根本变化, 我们称之为科学研究的“第四范式”。

牛顿和爱因斯坦时期,科学研究的简单方式是通过观察把数学模型化,这是最简单的第一方式;第二方式是用模型推演,第三方式是用计算机仿真,但这不是很成功。进入近代以后,我们发现最大的问题是你观察到的东西没办法写成数学方程式,因为维度太高,这在科学研究上有一个概念叫维度的诅咒,特别是从量子物理学的角度没法计算。大模型出现以后, 现在可以做1024 到2048 个维度,这已经不完全是个空间概念。方程可以做到两千亿个变量, 这个世界上还有什么方程是不可解的?这从根本上改变了科学研究的方式。以前是慢慢做、细细做,现在是用数据大规模做,这个世界真的变了。

这就是为什么最近在有些领域突破得特别快,比如生化、医药、材料等领域的研发, 都是因为人工智能助力的原因。根本的科学研究方式变了,以前科学研究是从最早的原理一步一步往前走,现在科学是从数据逆向倒推,整个思维方式从根本上变了。大模型现在帮助科学家把人工智能引入物理学,特别是数学和材料学,现在是用一个数学家和机器合作来探索新的材料,也取得了一些很有意思的进展。因为数学家的核心是把所有的一切数学化,能够用公式表达的才有应用, 不能用公式表达的就不能作为产品,就不能生产。在制药领域,最近的生物药研究时间缩短了一半,成本下降了一半,就是因为大模型的帮助。

在材料研发领域,德州仪器用大模型做耐高温耐氧化的高熵合金。材料科学将来也会走得很快,新的材料会不断涌现,会有无限的想象空间。大模型的算力如此之大,算法效率如此之高,第一次让我们可以把物理世界和信息世界、虚拟世界连起来,物理世界的数字在虚拟世界经过大模型计算再回到物理世界去操纵物理世界,这就是这个世界变化的轨迹。现在用大模型最多的是什么?战争。战争的电子演习,已经做到很大规模并实现经济化。而由人工智能主导运营的数字化过程,因为数字的产生和迭代效率特别高,这个过程也在不断加速自动化,并且在提升自动化的效率。

人工智能帮助管理物理世界最为典型的案例,是最近美国公布在核聚变领域取得的突破性发展。人类目前核聚变所产出的电,小于投入的电。我在普林斯顿读书的时候,那里的一套核聚变装置是上世纪80 年代美国和苏联合建的,这个装置做一次试验,我们所处的小镇就没有电了。这样的试验,做了几十年都没有进展。这是核聚变需要突破的一个核心功能, 即在托卡马克(一种可以容纳核聚变反应的容器)中,用磁场线圈限制等离子体粒子,以使等离子体达到聚变所需的条件。控制和约束这种等离子体的方法,就是核聚变迈向成功的关键,也将是人类社会未来清洁能源的源泉。可自主控制等离子体的AI,一旦学会如何控制和改变虚拟反应堆内等离子体的形状,它就能自动控制托卡马克中的磁体而无需任何额外的微调,其结果就是核聚变技术取得重大的突破。美国的目标是通过核聚变,让每度电的成本降至一美分。如果达到这个标准,那么今天所有的能源世界将彻底改观。

这种对物理世界的管理和深化,影响是巨大的。大模型为科技跃升带来了巨大的想象空间,特别在推动科学实验方面,比如生命科学、药物研发、材料科学、能源科学、电子工程和计算机科学等领域。大模型现在已经变成工程学,变成一个辅助工具,变成我们今天所有一切超高级、超高速、超效率的辅助工具,世界在这个基点上变了。

我们必须承认人工智能走得很快。中国在2021 年人工智能的论文总量第一次超过了美国,而在两年前,中国的人工智能专利就已超过美国。当前,第一是我们要围绕赶超的过程,围绕A I2.0 的进展现状,重新制定自己的人工智能发展战略;第二特别重要, 就是发挥我们的数据优势,推动人工智能大发展快发展。

预计三年以后,中国的数据会超过美国, 成为世界上最大的数据国。因为物联网的布局和运用,中国数据的质量会很好,所以让数据流动起来变成资源、资产和财富,让数据变成生产力,才是我们迎接科学革命、迎接大模型的最根本的一条。只有在数据生产力的基础上, 我们才能把大模型的应用和商业化、企业化的发展结合起来,才能让我们走上赶超之路。

(作者系国际货币基金组织原副总裁,现任清华大学国家金融研究院院长)

 

评论被关闭。