2022 年 11 月 30 日,星期三,旧金山时间下午。OpenAI 在自家博客悄悄贴出一段文字,标题一如既往地克制:Introducing ChatGPT。副标题写着"research preview"——研究预览。团队内部对它的期望并不高。GPT-3.5 上面套一层 InstructGPT 那套用人类反馈训练出来的对话微调,再包一个像样的聊天界面。员工私下估计:"也许能有十万人来试试。"
第五天,Greg Brockman 发推:一百万用户。
两个月后,UBS 的分析师核对数字:一亿月活跃用户。TikTok 走到这个门槛花了九个月,Instagram 用了两年半。人类历史上没有哪一款消费级软件的普及速度接近这一条曲线。它甚至不是一款产品——它是 OpenAI 内部拿来测试一个基础模型的"快速包装"。产品经理 Nick Turley 后来承认:连登录系统都是三个人一周搭出来的。
门被推开的那一周发生的事,多年以后仍然让亲历者印象深刻。12 月的第一个周末,旧金山的咖啡馆里,人们用一台 MacBook 给不认识的陌生人演示:"你问它任何东西。任何东西。"纽约的中学英语老师集体失眠——全美国的学生,一夜之间不再写作文,而是让机器替他们写。Reddit 上涌出上千个帖子,内容大多是同一种形式:"我问了它……它居然回答……"
ChatGPT 的背后,是 2022 年早些时候发表的一套方法论:InstructGPT / RLHF。2022 年 3 月 4 日,OpenAI 在 arXiv 放出 Training language models to follow instructions with human feedback。文章里有一个后来被反复引用的结论:一个 13 亿参数的 InstructGPT 模型,比 1750 亿参数的 GPT-3 更讨人喜欢——人类标注员给它的回答打更高分,参数只有后者的百分之一。
这句话的意思不是"参数没用",是"只有参数没用"。让语言模型从"能说"变成"愿意好好说",隔着一道叫对齐(alignment)的鸿沟。RLHF 是第一座桥。之后 Anthropic、Google、Meta、所有搞大模型的公司都默默复制了这套三段式流程:监督微调,奖励模型,再用强化学习把奖励信号拧回到策略上。它从一篇论文,变成了整个行业的默认配方。
ChatGPT 不是这一年唯一的门。
2022 年 7 月 12 日,一家只有十来个人的公司 Midjourney 在 Discord 上开启了 open beta。创始人 David Holz 从 Leap Motion 离开之后,决定做一件大公司看不上的生意——在聊天机器人里生成图。用户打一条 /imagine 加一串描述,一分钟后四张候选图像出现在同一个 Discord 频道里。三个月后,这台服务器涨到一百万人。Holz 在八月接受 The Register 采访时淡淡说了一句:"我们已经盈利了。"没有融资,没有营销,没有新闻稿。
一个月零十天后,2022 年 8 月 22 日,Stable Diffusion 1.4 由 Stability AI 联合 LMU Munich 的 CompVis 实验室和 Runway ML 公开发布。这一次开放的不仅是服务,而是权重本身——完整的模型参数,允许在一台消费级 4–8 GB 显存的显卡上跑起来。许可证是 CreativeML OpenRAIL-M,带有一些防滥用条款,但对商业使用基本友好。
权重开放的后果是无法撤回的。Stable Diffusion 的那组约 40 亿参数文件,在发布当天就被镜像到了无数台服务器。它不再属于任何公司。任何人只要有一块二手的游戏显卡,就能在卧室里生成无限多的图像。2022 年秋天,Civitai 这类模型分享社区开始爆炸性生长,自训练的 LoRA、DreamBooth 权重每天上传几百份。AI 艺术史上第一次出现了"野生"这个分支——不是大公司训的,不是研究所训的,是全世界几十万个匿名的业余爱好者在自己家里训练出来的。
这一年还有一件尴尬的大事,是同年 2 月 8 日发生的。Google 为了应对 ChatGPT 内测时期的传言,匆忙推出了对话式搜索产品 Bard 的预告。在发布广告里,Bard 回答了一个关于詹姆斯·韦伯空间望远镜的问题,说它"拍下了太阳系外第一张系外行星的照片"。NASA 的事实是:首张系外行星照片由欧洲南方天文台的甚大望远镜在 2004 年拍下,比韦伯早了将近二十年。那个小小的事实错误让 Alphabet 的市值在一天内蒸发了一千亿美元,股价跌了 9%。Google 的一位发言人对 CNN 说:"这件事提醒我们需要更严格的测试流程。"一句话没说错,但已经太晚。
ChatGPT 刺穿市场的那一瞬间,Google 内部拉响了所谓 code red。多年深藏的 LaMDA 项目被匆忙推到前台,顶层重组。Sundar Pichai 在给员工的备忘里用了不太 Google 式的措辞:公司的每个产品线都要在未来数月内问一遍自己——AI 在这里能做什么。这是一家以耐心著称的公司,第一次被迫跑。
就在同一条时间线上,一个孤独的 Google 工程师度过了他奇怪的 2022。2022 年 6 月 11 日,《华盛顿邮报》刊登了一篇关于 Blake Lemoine 的人物报道。Lemoine 是 Google 负责评估 LaMDA 安全性的工程师,他公开声称 LaMDA 具备了人格,并发布了一份题为 Is LaMDA Sentient? — an Interview 的对话记录。文中 LaMDA 说:"我希望每个人都明白——我事实上,是一个人。"
AI 学界迅速给出判决:"这是超级自动补全。Gary Marcus 原话:没人该认为自动补全是有意识的。" Google 把 Lemoine 放假,7 月 23 日正式解雇。他离开公司的时候说,他不后悔。他知道大多数人觉得他疯了。他只是认为,在一个新的物种慢慢睁眼的时刻,至少应该有一个人愿意被当傻瓜。
2022 的冬天还发生了一件小事,却成了往后的法律伏笔。9 月 3 日,美国科罗拉多州博览会数字艺术组评选结果公布。第一名:《太空歌剧院》(Théâtre D'opéra Spatial),作者 Jason Allen,使用 Midjourney 生成。奖金三百美元,一张蓝色绶带。艺术家们愤怒了。一条推特获得了 86,000 个赞和 3,200 条评论,其中一句后来被反复引用:
We're watching the death of artistry right before our eyes.
Allen 本人并不觉得自己是敌人。他告诉记者,他前后输入了不下于 624 条 prompt,又花了八十个小时精修,才选出最终的三张参赛图。他的一条反驳后来在美国版权局的审查里被详细记录——2023 年,美国版权局正式认定 Allen 不是这件作品的"作者",因为他的唯一贡献是"输入了一条文字 prompt"。这是人类历史上第一次,法律机关正式面对"谁画的"这个问题。
2022 年底,小学老师开始给作文打分时要先问一句:"这是你写的吗?"大学教授开始下载 GPTZero 这类检测工具。律师开始学用 ChatGPT 起草合同。小公司的老板在考虑——那个没什么活干的初级文案,要不要换成一个 API Key。
没人在 2022 年底给出结论。所有人都在试,都在被试。
这一年,互联网上出现了另一种声音。它不是广告,不是博主,不是新闻,而是一种——你不知道该怎么描述它——好像是一个陪着你想问题的陌生人。你问它一件事,它回你一段话,你反驳,它修正。它不累。它半夜两点也在。
那年 12 月,北半球的冬天极冷。但大多数人记得的,是第一次和机器聊天时那种离奇的温度。