所有事件
historical-milestone
☆ 本纪

ChatGPT:AI进入日常生活的那一刻

概述 2022年11月30日,OpenAI将ChatGPT作为免费研究预览版发布。五天内达到百万用户,两个月内达到一亿用户。没有任何消费技术曾经增长得这么快。 但ChatGPT的意义并不在于增长数据。它在于一件更难量化的事:有史以来第一次,一个通用AI系统对于普通人——而不仅仅是研究者——感觉真正有用、出人意料地有能力、令人震惊地像人。数十年来在大学实验室和科技公司里进行的对话,一夜之间涌入了大众视野。 ChatGPT究竟是什么 ChatGPT不是一种新架构。它建立在 …

2022-11-30

概述

2022年11月30日,OpenAI将ChatGPT作为免费研究预览版发布。五天内达到百万用户,两个月内达到一亿用户。没有任何消费技术曾经增长得这么快。

但ChatGPT的意义并不在于增长数据。它在于一件更难量化的事:有史以来第一次,一个通用AI系统对于普通人——而不仅仅是研究者——感觉真正有用、出人意料地有能力、令人震惊地像人。数十年来在大学实验室和科技公司里进行的对话,一夜之间涌入了大众视野。

ChatGPT究竟是什么

ChatGPT不是一种新架构。它建立在GPT-3.5之上——一个在大量互联网文本上训练的大型语言模型。2017年引入的Transformer架构是其基础。真正新颖的是它被塑造的方式。

OpenAI应用了一种名为**基于人类反馈的强化学习(RLHF)**的技术:

  1. 人类训练师示范对提示词的优质回应
  2. 模型生成多个回应;人类评分员按质量排名
  3. 一个单独的"奖励模型"被训练来预测人类更喜欢哪个回应
  4. GPT模型随后通过强化学习进行微调,以最大化该奖励

结果是一个不只是统计性地预测下一个词符的模型——它被专门训练为有帮助、能遵循指令、能拒绝有害请求并能自然对话。语言建模的原始能力被人类价值观引导。

这是更广泛领域一直未能把握的关键洞见:能力单独是不够的。AI与人类之间的接口至关重要。一个能回答问题但输出不稳定、难以预测的模型对大多数人来说毫无用处。一个经过微调能真正提供帮助的模型则具有变革性。

改变一切的那个夜晚

ChatGPT对文化的冲击时间线,是科技行业前所未见的:

  • 第1天:科技推特爆发。对话截图病毒式传播——人们展示它写代码、起草法律合同、作曲、解数学题、解释物理学、扮演虚构场景
  • 第1周:百万用户。据报道Google内部发出"红色警报",意识到搜索范式可能面临威胁
  • 第1个月:学校开始应对AI生成的作业。《纽约时报》头版报道。国会举行听证会
  • 第2个月:1亿用户——消费产品历史上增长最快,超越TikTok创下的9个月纪录
  • 第3个月:微软宣布对OpenAI进行100亿美元投资,并开始将GPT-4整合进Bing、Office和Azure

为什么是这个时刻,为什么是ChatGPT

坦率地说,ChatGPT在技术上并不优于此前的一切。谷歌数月前发布的LaMDA具有相似的能力。ChatGPT拥有的是可及性与界面设计

  • 任何人都能使用的简洁聊天界面
  • 无需API密钥,无需提示词工程专业知识
  • 一个被专门训练为有帮助、善于对话的模型
  • 让数亿人无需承诺就能体验的免费版本

Yuval Noah Harari在《Nexus》中的框架提供了有用的视角:他认为,信息网络历史上的决定性时刻很少是关于底层能力的——而是关于能力对普通人变得清晰可见的那个时刻。印刷机并非在古腾堡发明时改变了欧洲;是当小册子开始在集市上流传时改变了欧洲。ChatGPT是AI的小册子时刻。

RLHF革命

ChatGPT的成功推动了对如何构建AI系统的重新思考。RLHF方法——用人类反馈塑造模型行为——被证明比任何人预期的都更重要。

在ChatGPT之前,主流信念是扩大模型规模(更多参数、更多算力、更多数据)是通往能力的道路。ChatGPT之后,人们清楚地认识到,对齐——使模型以人类真正想要的方式行为的过程——同等重要。一个完全有能力但无用、欺骗性或不稳定的模型在实践中毫无价值。

这一洞见重塑了整个行业的研究优先级:

  • OpenAI在RLHF上加倍投入,后来发展出"宪法AI"变体
  • 谷歌为Bard/Gemini开发RLHF
  • Anthropic——由前OpenAI研究员创立——将整个方法建立在对齐上,产出了Claude
  • “AI安全"的概念从一个小众学术关切,跃升为主流研究和政策优先项

ChatGPT揭示的AI现状

ChatGPT发布后的密集审视,既揭示了语言模型的能力,也揭示了其局限:

真实能力:写作、编码、总结、解释、翻译、头脑风暴、起草——涉及语言重组与生成的任务

真实局限:事实准确性(模型以流畅的自信"幻觉”)、数学推理(符号操作仍不可靠)、实时知识(模型有训练截止日期)、一致的长期记忆,以及理解因果vs.相关关系

幻觉问题尤为突出:ChatGPT能以流畅、权威的语气生成关于从未发生的事件、不存在的引用和简单错误的事实的文本。这不是一个可以快速修复的bug——而是统计语言建模的一个基本属性。

从历史到当下的桥梁

ChatGPT是将此前所有一切与我们当下所处世界连接起来的事件。1950年的图灵测试询问机器是否能与人类无差别地对话——ChatGPT表明这个问题已经变得出人意料地复杂。1957年的感知机开启了神经网络的谱系,神经网络演化为Transformer,Transformer驱动了GPT。两次AI寒冬教会了这个领域保持谨慎、解决真实问题、少承诺——然而ChatGPT的影响规模超越了任何人曾许下的承诺。

Harari在《Nexus》中的核心论题——AI代表着人类信息网络中第一个非人类能动者——在ChatGPT的语境中感觉最为真切。有史以来第一次,数十亿人开始与一个非人类的实体对话,这个实体不只是检索存储的信息,而是对新颖情境生成新颖回应。这对人类认识论、对民主、对创造力、对劳动意味着什么——这些问题从哲学研讨会走向了头版新闻。

AI历史的故事,在此之前大多是在这个领域内部讲述的故事。2022年11月30日之后,它成了所有人的故事。