ChatGPT：AI进入日常生活的那一刻

概述

2022年11月30日，OpenAI将ChatGPT作为免费研究预览版发布。五天内达到百万用户，两个月内达到一亿用户。没有任何消费技术曾经增长得这么快。

但ChatGPT的意义并不在于增长数据。它在于一件更难量化的事：有史以来第一次，一个通用AI系统对于普通人——而不仅仅是研究者——感觉真正有用、出人意料地有能力、令人震惊地像人。数十年来在大学实验室和科技公司里进行的对话，一夜之间涌入了大众视野。

ChatGPT究竟是什么

ChatGPT不是一种新架构。它建立在GPT-3.5之上——一个在大量互联网文本上训练的大型语言模型。2017年引入的Transformer架构是其基础。真正新颖的是它被塑造的方式。

OpenAI应用了一种名为**基于人类反馈的强化学习（RLHF）**的技术：

人类训练师示范对提示词的优质回应
模型生成多个回应；人类评分员按质量排名
一个单独的"奖励模型"被训练来预测人类更喜欢哪个回应
GPT模型随后通过强化学习进行微调，以最大化该奖励

结果是一个不只是统计性地预测下一个词符的模型——它被专门训练为有帮助、能遵循指令、能拒绝有害请求并能自然对话。语言建模的原始能力被人类价值观引导。

这是更广泛领域一直未能把握的关键洞见：能力单独是不够的。AI与人类之间的接口至关重要。一个能回答问题但输出不稳定、难以预测的模型对大多数人来说毫无用处。一个经过微调能真正提供帮助的模型则具有变革性。

改变一切的那个夜晚

ChatGPT对文化的冲击时间线，是科技行业前所未见的：

第1天：科技推特爆发。对话截图病毒式传播——人们展示它写代码、起草法律合同、作曲、解数学题、解释物理学、扮演虚构场景
第1周：百万用户。据报道Google内部发出"红色警报"，意识到搜索范式可能面临威胁
第1个月：学校开始应对AI生成的作业。《纽约时报》头版报道。国会举行听证会
第2个月：1亿用户——消费产品历史上增长最快，超越TikTok创下的9个月纪录
第3个月：微软宣布对OpenAI进行100亿美元投资，并开始将GPT-4整合进Bing、Office和Azure

为什么是这个时刻，为什么是ChatGPT

坦率地说，ChatGPT在技术上并不优于此前的一切。谷歌数月前发布的LaMDA具有相似的能力。ChatGPT拥有的是可及性与界面设计：

任何人都能使用的简洁聊天界面
无需API密钥，无需提示词工程专业知识
一个被专门训练为有帮助、善于对话的模型
让数亿人无需承诺就能体验的免费版本

Yuval Noah Harari在《Nexus》中的框架提供了有用的视角：他认为，信息网络历史上的决定性时刻很少是关于底层能力的——而是关于能力对普通人变得清晰可见的那个时刻。印刷机并非在古腾堡发明时改变了欧洲；是当小册子开始在集市上流传时改变了欧洲。ChatGPT是AI的小册子时刻。

RLHF革命

ChatGPT的成功推动了对如何构建AI系统的重新思考。RLHF方法——用人类反馈塑造模型行为——被证明比任何人预期的都更重要。

在ChatGPT之前，主流信念是扩大模型规模（更多参数、更多算力、更多数据）是通往能力的道路。ChatGPT之后，人们清楚地认识到，对齐——使模型以人类真正想要的方式行为的过程——同等重要。一个完全有能力但无用、欺骗性或不稳定的模型在实践中毫无价值。

这一洞见重塑了整个行业的研究优先级：

OpenAI在RLHF上加倍投入，后来发展出"宪法AI"变体
谷歌为Bard/Gemini开发RLHF
Anthropic——由前OpenAI研究员创立——将整个方法建立在对齐上，产出了Claude
“AI安全"的概念从一个小众学术关切，跃升为主流研究和政策优先项

ChatGPT揭示的AI现状

ChatGPT发布后的密集审视，既揭示了语言模型的能力，也揭示了其局限：

真实能力：写作、编码、总结、解释、翻译、头脑风暴、起草——涉及语言重组与生成的任务

真实局限：事实准确性（模型以流畅的自信"幻觉”）、数学推理（符号操作仍不可靠）、实时知识（模型有训练截止日期）、一致的长期记忆，以及理解因果vs.相关关系

幻觉问题尤为突出：ChatGPT能以流畅、权威的语气生成关于从未发生的事件、不存在的引用和简单错误的事实的文本。这不是一个可以快速修复的bug——而是统计语言建模的一个基本属性。

从历史到当下的桥梁

ChatGPT是将此前所有一切与我们当下所处世界连接起来的事件。1950年的图灵测试询问机器是否能与人类无差别地对话——ChatGPT表明这个问题已经变得出人意料地复杂。1957年的感知机开启了神经网络的谱系，神经网络演化为Transformer，Transformer驱动了GPT。两次AI寒冬教会了这个领域保持谨慎、解决真实问题、少承诺——然而ChatGPT的影响规模超越了任何人曾许下的承诺。

Harari在《Nexus》中的核心论题——AI代表着人类信息网络中第一个非人类能动者——在ChatGPT的语境中感觉最为真切。有史以来第一次，数十亿人开始与一个非人类的实体对话，这个实体不只是检索存储的信息，而是对新颖情境生成新颖回应。这对人类认识论、对民主、对创造力、对劳动意味着什么——这些问题从哲学研讨会走向了头版新闻。

AI历史的故事，在此之前大多是在这个领域内部讲述的故事。2022年11月30日之后，它成了所有人的故事。