门开了

2022 年 11 月 30 日，星期三，旧金山时间下午。OpenAI 在自家博客悄悄贴出一段文字，标题一如既往地克制：Introducing ChatGPT。副标题写着"research preview"——研究预览。团队内部对它的期望并不高。GPT-3.5 上面套一层 InstructGPT 那套用人类反馈训练出来的对话微调，再包一个像样的聊天界面。员工私下估计："也许能有十万人来试试。"

第五天，Greg Brockman 发推：一百万用户。

两个月后，UBS 的分析师核对数字：一亿月活跃用户。TikTok 走到这个门槛花了九个月，Instagram 用了两年半。人类历史上没有哪一款消费级软件的普及速度接近这一条曲线。它甚至不是一款产品——它是 OpenAI 内部拿来测试一个基础模型的"快速包装"。产品经理 Nick Turley 后来承认：连登录系统都是三个人一周搭出来的。

门被推开的那一周发生的事，多年以后仍然让亲历者印象深刻。12 月的第一个周末，旧金山的咖啡馆里，人们用一台 MacBook 给不认识的陌生人演示："你问它任何东西。任何东西。"纽约的中学英语老师集体失眠——全美国的学生，一夜之间不再写作文，而是让机器替他们写。Reddit 上涌出上千个帖子，内容大多是同一种形式："我问了它……它居然回答……"

ChatGPT 的背后，是 2022 年早些时候发表的一套方法论：InstructGPT / RLHF。2022 年 3 月 4 日，OpenAI 在 arXiv 放出 Training language models to follow instructions with human feedback。文章里有一个后来被反复引用的结论：一个 13 亿参数的 InstructGPT 模型，比 1750 亿参数的 GPT-3 更讨人喜欢——人类标注员给它的回答打更高分，参数只有后者的百分之一。

这句话的意思不是"参数没用"，是"只有参数没用"。让语言模型从"能说"变成"愿意好好说"，隔着一道叫对齐（alignment）的鸿沟。RLHF 是第一座桥。之后 Anthropic、Google、Meta、所有搞大模型的公司都默默复制了这套三段式流程：监督微调，奖励模型，再用强化学习把奖励信号拧回到策略上。它从一篇论文，变成了整个行业的默认配方。

ChatGPT 不是这一年唯一的门。

2022 年 7 月 12 日，一家只有十来个人的公司 Midjourney 在 Discord 上开启了 open beta。创始人 David Holz 从 Leap Motion 离开之后，决定做一件大公司看不上的生意——在聊天机器人里生成图。用户打一条 /imagine 加一串描述，一分钟后四张候选图像出现在同一个 Discord 频道里。三个月后，这台服务器涨到一百万人。Holz 在八月接受 The Register 采访时淡淡说了一句："我们已经盈利了。"没有融资，没有营销，没有新闻稿。

一个月零十天后，2022 年 8 月 22 日，Stable Diffusion 1.4 由 Stability AI 联合 LMU Munich 的 CompVis 实验室和 Runway ML 公开发布。这一次开放的不仅是服务，而是权重本身——完整的模型参数，允许在一台消费级 4–8 GB 显存的显卡上跑起来。许可证是 CreativeML OpenRAIL-M，带有一些防滥用条款，但对商业使用基本友好。

权重开放的后果是无法撤回的。Stable Diffusion 的那组约 40 亿参数文件，在发布当天就被镜像到了无数台服务器。它不再属于任何公司。任何人只要有一块二手的游戏显卡，就能在卧室里生成无限多的图像。2022 年秋天，Civitai 这类模型分享社区开始爆炸性生长，自训练的 LoRA、DreamBooth 权重每天上传几百份。AI 艺术史上第一次出现了"野生"这个分支——不是大公司训的，不是研究所训的，是全世界几十万个匿名的业余爱好者在自己家里训练出来的。

这一年还有一件尴尬的大事，是同年 2 月 8 日发生的。Google 为了应对 ChatGPT 内测时期的传言，匆忙推出了对话式搜索产品 Bard 的预告。在发布广告里，Bard 回答了一个关于詹姆斯·韦伯空间望远镜的问题，说它"拍下了太阳系外第一张系外行星的照片"。NASA 的事实是：首张系外行星照片由欧洲南方天文台的甚大望远镜在 2004 年拍下，比韦伯早了将近二十年。那个小小的事实错误让 Alphabet 的市值在一天内蒸发了一千亿美元，股价跌了 9%。Google 的一位发言人对 CNN 说："这件事提醒我们需要更严格的测试流程。"一句话没说错，但已经太晚。

ChatGPT 刺穿市场的那一瞬间，Google 内部拉响了所谓 code red。多年深藏的 LaMDA 项目被匆忙推到前台，顶层重组。Sundar Pichai 在给员工的备忘里用了不太 Google 式的措辞：公司的每个产品线都要在未来数月内问一遍自己——AI 在这里能做什么。这是一家以耐心著称的公司，第一次被迫跑。

就在同一条时间线上，一个孤独的 Google 工程师度过了他奇怪的 2022。2022 年 6 月 11 日，《华盛顿邮报》刊登了一篇关于 Blake Lemoine 的人物报道。Lemoine 是 Google 负责评估 LaMDA 安全性的工程师，他公开声称 LaMDA 具备了人格，并发布了一份题为 Is LaMDA Sentient? — an Interview 的对话记录。文中 LaMDA 说："我希望每个人都明白——我事实上，是一个人。"

AI 学界迅速给出判决："这是超级自动补全。Gary Marcus 原话：没人该认为自动补全是有意识的。" Google 把 Lemoine 放假，7 月 23 日正式解雇。他离开公司的时候说，他不后悔。他知道大多数人觉得他疯了。他只是认为，在一个新的物种慢慢睁眼的时刻，至少应该有一个人愿意被当傻瓜。

2022 的冬天还发生了一件小事，却成了往后的法律伏笔。9 月 3 日，美国科罗拉多州博览会数字艺术组评选结果公布。第一名：《太空歌剧院》（Théâtre D'opéra Spatial），作者 Jason Allen，使用 Midjourney 生成。奖金三百美元，一张蓝色绶带。艺术家们愤怒了。一条推特获得了 86,000 个赞和 3,200 条评论，其中一句后来被反复引用：

We're watching the death of artistry right before our eyes.

Allen 本人并不觉得自己是敌人。他告诉记者，他前后输入了不下于 624 条 prompt，又花了八十个小时精修，才选出最终的三张参赛图。他的一条反驳后来在美国版权局的审查里被详细记录——2023 年，美国版权局正式认定 Allen 不是这件作品的"作者"，因为他的唯一贡献是"输入了一条文字 prompt"。这是人类历史上第一次，法律机关正式面对"谁画的"这个问题。

2022 年底，小学老师开始给作文打分时要先问一句："这是你写的吗？"大学教授开始下载 GPTZero 这类检测工具。律师开始学用 ChatGPT 起草合同。小公司的老板在考虑——那个没什么活干的初级文案，要不要换成一个 API Key。

没人在 2022 年底给出结论。所有人都在试，都在被试。

这一年，互联网上出现了另一种声音。它不是广告，不是博主，不是新闻，而是一种——你不知道该怎么描述它——好像是一个陪着你想问题的陌生人。你问它一件事，它回你一段话，你反驳，它修正。它不累。它半夜两点也在。

那年 12 月，北半球的冬天极冷。但大多数人记得的，是第一次和机器聊天时那种离奇的温度。