十问ChatGPT:一个新时代正拉开序幕

0

王 强

摘 要:ChatGPT 推出以来,受到全球产业界和公众侧的高度关注。关于其背后的技术原理及成功因素的探究,将启发更多人工智能新技术和新应用的发展。OpenAI 在技术上的长期投入、在愿景和文化价值观上的坚持,让ChatGPT 成为一款最快用户破亿的应用程序。ChatGPT 的发展,不仅给搜索引擎带来了创新的方向,也在教育、医疗、广告营销、电子商务、市场和战略咨询、企业服务、编写代码等各行业拥有巨大的潜力,不仅是人类的专业助手,也会成为未来人机交互的新入口,从而成为改变生产力曲线的关键变量。

关键词:ChatGPT ;人工智能; 大模型

随着人工智能大模型、量子计算、类脑智能、云原生、数字引擎、音视频等技术的深入发展,新技术、新模式和新业态持续涌现。2022 年11 月30 日,ChatGPT 横空出世,在全球范围内形成热烈讨论,成为现象级事件。

一、ChatGPT 现在有多火?

根据 Similarweb 的数据,今年1 月,平均每天约有 1300 万独立访客使用 ChatGPT,是去年 12 月份的两倍多,累计用户超1 亿,创下了互联网最快破亿应用的记录,超过了之前TikTok 9 个月破亿的速度。

广大用户千奇百怪的问题引发了社交媒体的大量传播,与此同时,ChatGPT 在各领域的“秀肌肉”,也进一步强化了其知名度。美国宾夕法尼亚大学发现,ChatGPT 能够通过该校工商管理硕士MBA 课程的期末考试。《自然》杂志1 月24 日宣布,将人工智能工具列为作者的论文,不能在杂志上发表。《自然》称,作者身份意味着对作品负有责任,而人工智能工具无法承担这样的责任。据传,ChatGPT 还成功通过了谷歌的编程面试,拿到了年薪18.3 万美元的L3 工程师offer。

二、ChatGPT 背后的核心技术是什么?

ChatGPT 是生成式AI 的一种形式,Gartner 将其列为《2022 年度重要战略技术趋势》的第一位。Gartner 预测,到2025 年,生成式AI 将占到所有生成数据的10%,但目前这一比例还不足1%(如图1 所示)。

ChatGPT 背后的支撑是人工智能大模型, 针对这一技术点,腾讯研究院于去年发布的《2022 十大数字科技前沿应用趋势》报告中曾做过详细的阐述:当前的人工智能大多是针对特定的场景应用进行训练,生成的模型难以迁移到其他应用,属于小模型的范畴。整个过程不仅需要大量的手工调参, 还需要给机器喂养海量的标注数据,这拉低了人工智能的研发效率, 且成本较高。大模型通常是在无标注的大数据集上,采用自监督学习的方法进行训练。之后, 在其他场景的应用中,开发者只需要对模型进行微调,或采用少量数据进行二次训练,就可以满足新应用场景的需要。这意味着,对大模型的改进可以让所有的下游小模型受益,大幅提升人工智能的适用场景和研发效率,因此大模型成为业界重点投入的方向,OpenAI、谷歌、脸书、微软,以及国内的百度、阿里、腾讯、华为和智源研究院等纷纷推出超大模型。特别是OpenAI GPT 3 大模型在翻译、问答、内容生成等领域的不俗表现,让业界看到了达成通用人工智能的希望。当前ChatGPT 的版本为GPT 3.5, 是在GPT3 之上的调优,能力进一步增强。

ChatGPT 使用的核心技术之一是Transformer。从其全称上也能看得出来, Chat Generative Pre-trained Transformer。Transformer 技术是近几年人工智能技术最大的亮点之一,是谷歌于2017 年提出的一种采用注意力机制的深度学习模型,可以按输入数据各部分重要性的不同,而分配不同的权重。Transformer 在精度和性能上都要优于之前流行的CNN(卷积神经网络)、RNN(循环神经网络)等模型, 大幅提升了模型训练的效果,让人工智能得以在更大模型、更多数据、更强算力的基础上进一步增强能力。此外,还具有很强的跨模态能力,不仅在NLP(自然语言理解)领域表现优异,在语音、图像方面也显示出了优异的性能。

三、ChatGPT 为什么能成功?

ChatGPT 是非常成功的一次从技术研发到工程化、再到点燃大众热情的经典案例。

(一)技术创新

OpenAI 在持续的研究中,不断探索引入新的技术路线。这次引入的强化学习方法, 很好地提升了模型的效果。OpenAI 在模型训练中,引入了人类专家。专家一方面帮助ChatGPT 撰写更符合人类习惯的回答,另一方面,也对生成的结果进行排名,通过这样的奖励机制,实现模型的微调优化(如图2 所示)。

(二)组织文化

OpenAI 自成立之初, 就致力于打造通用AI 的能力,并坚定地持续投入, 这是ChatGPT 成功的一大关键因素。在这样的愿景下,吸引了一大批高水平的人才,在没有任何商业KPI 的情况下心无旁骛地开展研发工作,最终取得了重大的突破。

(三)反馈机制

通过用户的使用,OpenAI 可以获得用户对于模型优劣和使用体验的反馈,从而形成模型使用到体验反馈的闭环,使模型得以进一步优化。此外,OpenAI 还组织专门的反馈竞赛, 鼓励用户针对回答中的风险危害、新颖的回答建议等给予反馈,参赛者有机会赢取500 美元的 API 积分,并可兑换相应奖品。

(四)项目策划

一个影响力出圈的技术,与其项目策划密不可分。ChatGPT 的问答和多轮对话形式,很好地激发了大众的热情和创造力,公众基于各自感兴趣的话题自由发挥,或幽默搞笑、或严肃认真,在朋友圈和媒体上屡屡刷屏。此前推出的GPT3,同样在写新闻、作诗、翻译、编代码等能力方面,广受社会热议和讨论。这种与公众良好互动的项目设计策略,很值得我们学习,包括之前AlphaGo 的围棋大战、Deepmind 破解蛋白质折叠结构难题等,都是很好的议题任务设置。

四、ChatGPT 免费吗?未来能赚钱吗?

当前,普通用户使用ChatGPT 是免费的。

据《财富》报道,2022 年,OpenAI 公司的收入预计不足3000 万美元,净亏损5.45 亿美元。而随着ChatGPT 的火爆,可能进一步增加其亏损,因为用户每一次调用,就会让OpenAI 付出更多的计算资源和带宽成本。

当然,OpenAI 也开始了商业化的尝试, 宣布自2023 年 2 月开始推出付费试点订阅计划ChatGPT Plus,定价每月20 美元。付费版功能包括高峰时段免排队、快速响应以及优先获得新功能和改进等。

OpenAI 预测,随着ChatGPT 成为吸引客户的重要工具,其收入将会快速增长,预计在2023 年达到2 亿美元,2024 年超过10 亿美元。

此外,据报道,微软正在洽谈向 OpenAI 投资约 100 亿美元,使其估值达到290 亿美元。2019 年,微软曾向 OpenAI 投资 10 亿美元,为其提供了大量的资金支持和Azure 云算力支持。

五、ChatGPT 会替代搜索引擎吗?

短期来说,不会。长期来看,有可能通过融合形成新型的搜索引擎。

目前,ChatGPT 回复的答案质量参差不齐,可以给出很多问题的简要答案,甚至能写一篇符合初级规划师水平的产业规划报告,但也不可避免地经常出现“一本正经胡说八道” 的情况,意味着其置信度还需进一步提升。而且ChatGPT 目前的知识库主要还是2021 年9 月前的数据,缺乏新数据,这大大限制了其提供新信息的能力。而同时,OpenAI 还推出了WebGPT,可以在网络上查找信息并提供信息来源,这将很大程度上补充ChatGPT 的实时信息源,从而进一步优化答案。

在搜索引擎的逻辑下,选择权在用户,搜索引擎一般会给出众多相关结果,根据用户的点击反馈来持续优化搜索结果。近年来, 搜索引擎也一直在做结果唯一化的尝试,比如直接在搜索框中提供唯一的答案选择,但目前可提供唯一结果的比较有限,且无法开展多轮对话。

ChatGPT 的推出,给搜索引擎厂商带来了很大的震动,也启发了其打造搜索新体验的方向。谷歌两位创始人多次召开讨论会,以应对 ChatGPT 可能带来的颠覆搜索引擎业务的潜力。谷歌CEO Pichai 表示,将在近期推出类似ChatGPT 的基于人工智能的大型语言模型,一款由 LaMDA 提供支持的对话AI 服务 Bard,让用户以“搜索伴侣”的形式使用。微软已经在 Bing 搜索引擎中添加了 ChatGPT 功能,并开展了小流量测试。百度也计划在3 月推出新功能,在搜索引擎中加入类似ChatGPT 的对话式机器人“文心一言”。

六、还有哪些类似ChatGPT 的模型和应用?

ChatGPT 是典型的AIGC 大模型,目前国内外在文本、代码、图像、视频、3D 等领域都涌现出相应的生成模型。

当前,ChatGPT 一个有力的竞争者是Claude,由Anthropic 近期推出的生成式AI 模型。Anthropic 由几位前 OpenAI 的研究员在2021 年创立,包括OpenAI 前研究副总裁Dario Amodei、GPT-3 论文一作Tom Brown 等人。据《金融时报》报道,2022 年底,谷歌向这家初创公司投资了约 3 亿美元。相比ChatGPT, Anthropic 在其网站上更强调构建“可靠、可解释和可操纵的人工智能系统”。

腾讯“混元”A I 大模型,集C V(计算机视觉)、N L P(自然语言理解)、多模态理解能力于一体,先后在M S R – V T T、M S V D 等五大权威数据集榜单中登顶,实现跨模态领域的大满贯。2022 年5 月,腾讯“混元”AI 大模型在C L U E(中文语言理解评测集合) 总排行榜、阅读理解、大规模知识图谱三个榜单同时登顶,一举打破三项纪录。12 月, 混元推出国内首个低成本、可落地的NLP 万亿大模型,并再次登顶自然语言理解任务榜单C L U E。混元用千亿模型热启动,最快仅用256 卡在一天内即可完成万亿参数大模型HunYuan-NLP 1T 的训练,整体训练成本仅为直接冷启动训练万亿模型的1/8(如图3 所示)。

七、ChatGPT 等大模型,会让我们实现通用人工智能吗?

自从包含1750 亿参数的GPT3 在2020 年6 月推出以来,业界对于达成通用人工智能的探讨又进一步热烈起来。正如微软CEO 纳德拉近日在接受《华尔街日报》访谈时表示, GPT 的发展不是线性的,而是指数级变化的,所以相比较GPT3,当前的GPT3.5 已经展现出更强的能力。业界普遍预测,GPT4 将在今年推出,并具备更强大的通用能力。

但同时,我们也需要有清晰的辨识,AI 并非万能。即无论AI 如何强大,其解决的问题也只是人类面临所有问题的很小一部分。因为现实世界中有海量的问题并非数学问题,也就不可能通过计算来求解。目前人工智能已经找到解决方案的问题,也只是可计算问题的一小部分(如图4 所示)。

八、ChatGPT 可能产生哪些社会或伦理问题?

C h a t G P T 同样面临人工智能长期以来面临的挑战,如歧视等伦理问题,被滥用于诈骗、欺诈、政治造谣、伪造身份等安全问题,以及知识产权问题。最近,OpenAI 表示, 正考虑在ChatGPT 中添加模型水印,即监测模型可以识别的特殊标记,以降低模型滥用的问题。此外,针对大众普遍担心的失业问题,C h a t G P T 在 L i n k e d I n 上分享了一篇帖子写道:“AI 不会取代你。一个使用 AI 的人将取代你。”

九、ChatGPT 的未来将带来哪些变革和新机会?

ChatGPT 会成为未来人机交互的一个新入口,很可能改变现有APP 的交互方式,以更自然的对话方式,让用户来使用软件和调用技能。例如,未来在文档编辑软件中,人们可以通过描述需求,让软件直接生成文字内容或图形, 甚至直接进行修图等工作。在编程方面,ChatGPT 这种即时编程的方式,将改变传统的工作方式和应用交互规则, 推动产业进入软件3.0 的新阶段。

除此之外,ChatGPT 未来还可以有多样化的应用前景:

一是当下火热的数字人, 需要类似ChatGPT 这样的模型提供对话能力,使其具备有趣的灵魂,更好地陪伴和服务于人。同时, 该能力也可以嵌入机器人身体内,让未来的人形机器人更聪明、更拟人化。

二是大量的开发者可以利用ChatGPT 这样的底层平台,在大模型基础上根据不同行业和场景进行模型调优,从而创造出各类满足用户需求的丰富应用,从而形成对话式AI 的生态。例如,国外火爆的J a s p e r,通过在G P T3 模型上的微调,帮助用户撰写营销文案,甚至有人在上面完成了一部12 万字的小说,IBM、Airbnb、Autodesk 等大企业都是其企业用户。普通用户可以免费试用1 万个单词的版本,之后可以用29 美元订购2 万个单词,或用59 美元订购生成5 万个单词的权限。

三是在教育、医疗、广告营销、电子商务、市场和战略咨询、企业服务、编写代码等专业服务领域,成为更为专业的人类助手。不仅可以生成内容,还可以调用各种专业能力,甚至替代部分初级的专业工作。企业服务方面,微软推出了由 ChatGPT 提供技术支持的高级 Teams 产品, ChatGPT 可以自动帮助参会者生成会议记录,即使没有参加会议,智能回顾功能也能帮助用户生成会议记录和要点。ChatGPT 还可以给用户提供个性化的时间线标记,以快速查看分享和讨论的内容,该服务将于 6 月开始每月收费 7 美元,并于 7 月增加到 10 美元。代码编写方面,近期特斯拉前任AI 总监Andrej Karpathy 透露,现在他80% 的代码都是由AI 生成的(GitHub Copilot),而且有80% 的准确率。

四是与其他模态AI 工具的组合式创新。ChatGPT 同文生图、文字生成视频甚至未来直接生成3D 模型的工具集成,可以带来UGC 内容的极大丰富,成为内容工业化的核心引擎。

未来,ChatGPT 与更多的AI、云计算等信息技术的集成创新,将创造改变生产力曲线的工具,成为经济发展新动力。

十、对我们有哪些启示?

一是推动更高质量数据的汇聚。在大模型的推动下,数据- 算法和算力的正循环模型能力进一步增强,如果给机器更高质量的数据,特别是带有行业Know-how(经验和常识)的数据,将大幅增强人工智能对各行业的理解,从而发挥更强的智能+ 价值,推动行业数字化升级。

二是做时间的朋友。真正的理论突破和工程化的进步,是需要耐得住寂寞坐“冷板凳” 的。如果对于AI 的投入,是希望短期内获得巨大的收益,反而会欲速则不达。ChatGPT 再次引爆的生成式AI 领域,又一次让资本、技术、人才大量聚集,有了创新的基础条件,那么决策者需要的就是更多的耐心了。

三是设置有挑战性的目标。正如当年阿波罗计划汇聚了美国乃至全球的顶尖科学家, 后续产生了众多影响世界的科技突破,AI 的研究也需要设计一系列有挑战性的目标,来牵引全社会的聪明才智和各类要素资源,在突破核心目标的同时,形成更多的科技成果外溢。

四是秉持科技向善的初心。当AI 的能力进一步彰显,其两面性也会越来越多地暴露, 因此,对AI 应用相关法律法规的完善、伦理规范的建立,也将更加迫切。

参考文献:

1.Sequoia,《Generative AI: A Creative New World》2022.09

2. 腾讯研究院《 2022 十大数字科技前沿应 用趋势》2022.01

3. 凯德·梅茨《深度学习革命》中信出版集团 2023.01

4. 腾讯研究院《AIGC 发展趋势报告2023 :迎接人工智能的下一个时代》 2023.01

(作者系腾讯研究院资深专家,前沿科技研究中心主任)

 

评论被关闭。