太危险了

2019 年 2 月 14 日，情人节，OpenAI 在自己的博客上发布了一篇标题看起来很朴素的文章：《Better Language Models and Their Implications》。那是 GPT-2 的出厂通告。

GPT-2 的规格并不惊人：15 亿参数，48 层 Transformer，训练数据来自一个叫 WebText 的 40GB 网页语料——那些语料是从 Reddit 上被点过 3 赞以上的链接里爬出来的，相当于让模型读了"被人类筛选过一轮的互联网"。作者还是那个熟悉的组合：Alec Radford、Jeffrey Wu、Rewon Child、David Luan、Dario Amodei、Ilya Sutskever。GPT-1 的作者表换了几个名字，规模大了 13 倍。

但博客里有一段话让所有人愣住：

Due to concerns about malicious applications of the technology, we are not releasing the trained model. As an experiment in responsible disclosure, we are instead releasing a much smaller model for researchers to experiment with, as well as a technical paper.

中文是："因为担心这项技术被恶意使用，我们不打算公开完整的训练好的模型。作为一次负责任披露的实验，我们先放出一个小得多的版本。"

那天起的 24 小时里，整个机器学习学术圈炸了。炸的不是技术——炸的是那个姿态。

这是 AI 研究史上第一次，一个顶级实验室公开说：我们训出来的东西太危险，不能全公开。

在此之前，机器学习圈的默认规则是"论文加代码加权重"——一切能公开的都公开。深度学习时代的加速，很大程度上就建立在这种开放之上：AlexNet 公开了，ResNet 公开了，Transformer 公开了，BERT 的权重 Google 第一时间就放出来了。你在 GitHub 上 pip install 一下就能复现全世界最前沿的东西。这是这个领域引以为傲的气质。

OpenAI 的这个决定被当成一次背叛。

Caltech 教授、Nvidia 机器学习研究主管 Anima Anandkumar 当天就在 Twitter 上开火："他们说的 '分阶段释出' 是开放的反面。这是一种恶意的公关（'malicious BS'）。"Facebook AI Research 的 Yann LeCun 说得更刻薄：OpenAI 从来没有真正地"open"过，他们只是喜欢这个名字。Reddit 的 r/MachineLearning 上出现了一个热门帖："OpenAI 发布了一个 press release，不是 paper。"

大部分攻击的逻辑是这样的：如果这个模型真的危险到需要封存，那应该是政府或学界联合来评估；如果它不危险，那封存就是赤裸裸的炒作——把研究成果包装成一个半开放的神秘物，好吸引媒体关注和投资人的钱。

讽刺的是，当时 GPT-2 的真实能力并没有那么吓人。它能写出语法通顺、话题连贯大约四五句的段落；让它写超过一页的文章，后半段几乎必然跑题、自相矛盾、冒出重复的句子。媒体上的演示里，有一段著名的 GPT-2 自编故事："科学家在安第斯山脉的一处山谷里发现了一群会说英语的独角兽。" 那段续写写得有腔调、有细节，但结尾是独角兽突然有了金色犄角和四位语言学家教授，逻辑完全失控。

2019 年 5 月，一位叫 Adam King 的加拿大独立开发者搭了一个叫 Talk to Transformer 的网站，把当时公开的中等规模 GPT-2（3.55 亿参数）接上一个简单的 Web 界面。一周之内，全球上百万人涌进去玩。有人让它续写《哈利·波特》，有人让它接自己的情书，有人让它编股票走势。Hacker News 的评论区里有人写："我是抱着怀疑态度进去的，出来时惊呆了。" 那个网站是普通人第一次亲手摸到"一个会写字的机器"。

OpenAI 随后采取了它后来被反复引用的"分阶段释出"（staged release）策略。时间表后来成了一条教科书式的曲线：

2 月 14 日：发布 1.24 亿参数的小模型，以及论文《Language Models are Unsupervised Multitask Learners》。
5 月：发布 3.55 亿参数的中等模型。
8 月 20 日：发布 7.74 亿参数的大模型。
11 月 5 日：发布 15 亿参数的完整模型，以及一份题为《Release Strategies and the Social Impacts of Language Models》的影响评估报告。

报告里写：过去九个月，OpenAI 和合作研究者没有发现"强有力的证据"表明 GPT-2 被用于大规模制造虚假信息。也就是说——一开始担心的事情没有发生。

学界的怒火部分消退，部分转成了冷嘲。Facebook AI 的研究员 Delip Rao 说："所以，戏演完了。"

但他们没看到这场戏真正的意义。 这一次"分阶段释出"，是给未来立下的坐标。从 GPT-2 开始，每一代最前沿的语言模型——GPT-3、GPT-4、Claude、Gemini、o1、Opus 4.5、Opus 4.6——不会再有 AI 学界习以为常的"拿来就用的权重"。世界第一次分成了"能用 API 调用前沿模型的人"和"不能用的人"。API 成为主权。权重成为国家战略资产。

2019 年 7 月 22 日，微软宣布向 OpenAI 投资 10 亿美元，换取 Azure 成为 OpenAI 的独家云平台，以及"优先商业化权"。这笔投资当时在新闻里被当作"微软追赶 AI 的大手笔"，但它的长远意义是：OpenAI 从一个非营利机构，事实上变成了一家商业公司。 同年 3 月，OpenAI 已经把原本的 501(c)(3) 非营利结构改成了"capped-profit" 混合体——投资人的回报上限是 100 倍。为此，联合创始人 Elon Musk 在 2018 年就愤然离开董事会——他认为 OpenAI 背弃了初心。

2019 年的后半段，一个新词开始在学术圈流传："scaling laws"（规模定律）。OpenAI 的 Jared Kaplan 等人在 2020 年 1 月的论文里把它写成了方程式，但思想在 2019 年夏天的 GPT-2 实验里就已经长出来：只要你把模型放大、数据放大、算力放大，loss 会按照幂律下降，能力会按照某种连续曲线上升，没有明显的饱和点。这在实证研究里几乎是一个令人不适的现象——它意味着"更大的模型一定更好"，而不是"我们需要更聪明的架构"。

2019 年还发生了许多事。 3 月，DeepMind 发布 AlphaStar，在 StarCraft II 上打赢人类顶级选手 MaNa，10 场 5-5。这是 AI 第一次在一个实时战略游戏里达到人类顶级水平。8 月，DeepMind 再发 AlphaStar 新版，正式在匿名匹配里达到 Grandmaster 段位，超过 99.8% 的玩家。

6 月，LaMDA 的原型系统在 Google 内部开始训练——那会儿它还叫 Meena。11 月，华为被美国列入实体清单；字节跳动的抖音全球版 TikTok 开始在美国爆红。

11 月 19 日，李世乭宣布退役。他接受韩国 Yonhap 通讯社采访时说：

即使我成为第一，也有一个无法被击败的存在。

三年半前，2016 年 3 月那个下午，他在首尔四季酒店赢过 AlphaGo 一局。那是人类历史上在最高水平围棋里对 AI 的最后一胜。2019 年冬天，他从职业棋坛退下去教小孩子下棋。他说他不讨厌 AI，他只是觉得"继续下下去已经没有意义"。

2019 年是一个怪异的年份。从表面看，GPT-2 的"太危险了"像一场闹剧——一个连段落连贯性都勉强的文本补全器，居然被说成"危险"。但从里子看，那一年是 AI 从"学术共享品"变成"主权资产"的转折点。OpenAI 和微软的那笔 10 亿美元交易、那份分阶段释出的时间表、那套关于 scaling 的内部信仰——这三件事在 2019 年被并联在一起，构成了后来一切的地基。

2019 年也是人类第一次认真地问自己一个问题：如果下一个模型真的危险，我们还应不应该公开它？ 这个问题没有答案。但它从 2019 年之后，再也没有从房间里离开过。

夜里，加州 Pioneer Building 的 OpenAI 办公室里，灯还亮着。Ilya Sutskever 在白板上写下一行小字："Scale is all you need." 这句话第二年会在一个叫 GPT-3 的模型里被证明。

但 2019 年的冬天，没有人知道这一点。