← 硅火纪元 · 目录
上卷 · 真实史 · 第 4 章 / 35
2019
第 4 章 · 第一次,有人决定不发布一个 AI

太危险了

2019 年 2 月 14 日,情人节,OpenAI 在自己的博客上发布了一篇标题看起来很朴素的文章:《Better Language Models and Their Implications》。那是 GPT-2 的出厂通告。

GPT-2 的规格并不惊人:15 亿参数,48 层 Transformer,训练数据来自一个叫 WebText 的 40GB 网页语料——那些语料是从 Reddit 上被点过 3 赞以上的链接里爬出来的,相当于让模型读了"被人类筛选过一轮的互联网"。作者还是那个熟悉的组合:Alec Radford、Jeffrey Wu、Rewon Child、David Luan、Dario Amodei、Ilya Sutskever。GPT-1 的作者表换了几个名字,规模大了 13 倍。

但博客里有一段话让所有人愣住:

Due to concerns about malicious applications of the technology, we are not releasing the trained model. As an experiment in responsible disclosure, we are instead releasing a much smaller model for researchers to experiment with, as well as a technical paper.

中文是:"因为担心这项技术被恶意使用,我们不打算公开完整的训练好的模型。作为一次负责任披露的实验,我们先放出一个小得多的版本。"

那天起的 24 小时里,整个机器学习学术圈炸了。炸的不是技术——炸的是那个姿态。

这是 AI 研究史上第一次,一个顶级实验室公开说:我们训出来的东西太危险,不能全公开。

在此之前,机器学习圈的默认规则是"论文加代码加权重"——一切能公开的都公开。深度学习时代的加速,很大程度上就建立在这种开放之上:AlexNet 公开了,ResNet 公开了,Transformer 公开了,BERT 的权重 Google 第一时间就放出来了。你在 GitHub 上 pip install 一下就能复现全世界最前沿的东西。这是这个领域引以为傲的气质。

OpenAI 的这个决定被当成一次背叛。

Caltech 教授、Nvidia 机器学习研究主管 Anima Anandkumar 当天就在 Twitter 上开火:"他们说的 '分阶段释出' 是开放的反面。这是一种恶意的公关('malicious BS')。"Facebook AI Research 的 Yann LeCun 说得更刻薄:OpenAI 从来没有真正地"open"过,他们只是喜欢这个名字。Reddit 的 r/MachineLearning 上出现了一个热门帖:"OpenAI 发布了一个 press release,不是 paper。"

大部分攻击的逻辑是这样的:如果这个模型真的危险到需要封存,那应该是政府或学界联合来评估;如果它不危险,那封存就是赤裸裸的炒作——把研究成果包装成一个半开放的神秘物,好吸引媒体关注和投资人的钱。

讽刺的是,当时 GPT-2 的真实能力并没有那么吓人。它能写出语法通顺、话题连贯大约四五句的段落;让它写超过一页的文章,后半段几乎必然跑题、自相矛盾、冒出重复的句子。媒体上的演示里,有一段著名的 GPT-2 自编故事:"科学家在安第斯山脉的一处山谷里发现了一群会说英语的独角兽。" 那段续写写得有腔调、有细节,但结尾是独角兽突然有了金色犄角和四位语言学家教授,逻辑完全失控。

2019 年 5 月,一位叫 Adam King 的加拿大独立开发者搭了一个叫 Talk to Transformer 的网站,把当时公开的中等规模 GPT-2(3.55 亿参数)接上一个简单的 Web 界面。一周之内,全球上百万人涌进去玩。有人让它续写《哈利·波特》,有人让它接自己的情书,有人让它编股票走势。Hacker News 的评论区里有人写:"我是抱着怀疑态度进去的,出来时惊呆了。" 那个网站是普通人第一次亲手摸到"一个会写字的机器"。

OpenAI 随后采取了它后来被反复引用的"分阶段释出"(staged release)策略。时间表后来成了一条教科书式的曲线:

报告里写:过去九个月,OpenAI 和合作研究者没有发现"强有力的证据"表明 GPT-2 被用于大规模制造虚假信息。也就是说——一开始担心的事情没有发生。

学界的怒火部分消退,部分转成了冷嘲。Facebook AI 的研究员 Delip Rao 说:"所以,戏演完了。"

但他们没看到这场戏真正的意义。 这一次"分阶段释出",是给未来立下的坐标。从 GPT-2 开始,每一代最前沿的语言模型——GPT-3、GPT-4、Claude、Gemini、o1、Opus 4.5、Opus 4.6——不会再有 AI 学界习以为常的"拿来就用的权重"。世界第一次分成了"能用 API 调用前沿模型的人"和"不能用的人"。API 成为主权。权重成为国家战略资产。

2019 年 7 月 22 日,微软宣布向 OpenAI 投资 10 亿美元,换取 Azure 成为 OpenAI 的独家云平台,以及"优先商业化权"。这笔投资当时在新闻里被当作"微软追赶 AI 的大手笔",但它的长远意义是:OpenAI 从一个非营利机构,事实上变成了一家商业公司。 同年 3 月,OpenAI 已经把原本的 501(c)(3) 非营利结构改成了"capped-profit" 混合体——投资人的回报上限是 100 倍。为此,联合创始人 Elon Musk 在 2018 年就愤然离开董事会——他认为 OpenAI 背弃了初心。

2019 年的后半段,一个新词开始在学术圈流传:"scaling laws"(规模定律)。OpenAI 的 Jared Kaplan 等人在 2020 年 1 月的论文里把它写成了方程式,但思想在 2019 年夏天的 GPT-2 实验里就已经长出来:只要你把模型放大、数据放大、算力放大,loss 会按照幂律下降,能力会按照某种连续曲线上升,没有明显的饱和点。这在实证研究里几乎是一个令人不适的现象——它意味着"更大的模型一定更好",而不是"我们需要更聪明的架构"。

2019 年还发生了许多事。 3 月,DeepMind 发布 AlphaStar,在 StarCraft II 上打赢人类顶级选手 MaNa,10 场 5-5。这是 AI 第一次在一个实时战略游戏里达到人类顶级水平。8 月,DeepMind 再发 AlphaStar 新版,正式在匿名匹配里达到 Grandmaster 段位,超过 99.8% 的玩家。

6 月,LaMDA 的原型系统在 Google 内部开始训练——那会儿它还叫 Meena。11 月,华为被美国列入实体清单;字节跳动的抖音全球版 TikTok 开始在美国爆红。

11 月 19 日,李世乭宣布退役。他接受韩国 Yonhap 通讯社采访时说:

即使我成为第一,也有一个无法被击败的存在。

三年半前,2016 年 3 月那个下午,他在首尔四季酒店赢过 AlphaGo 一局。那是人类历史上在最高水平围棋里对 AI 的最后一胜。2019 年冬天,他从职业棋坛退下去教小孩子下棋。他说他不讨厌 AI,他只是觉得"继续下下去已经没有意义"。

2019 年是一个怪异的年份。从表面看,GPT-2 的"太危险了"像一场闹剧——一个连段落连贯性都勉强的文本补全器,居然被说成"危险"。但从里子看,那一年是 AI 从"学术共享品"变成"主权资产"的转折点。OpenAI 和微软的那笔 10 亿美元交易、那份分阶段释出的时间表、那套关于 scaling 的内部信仰——这三件事在 2019 年被并联在一起,构成了后来一切的地基。

2019 年也是人类第一次认真地问自己一个问题:如果下一个模型真的危险,我们还应不应该公开它? 这个问题没有答案。但它从 2019 年之后,再也没有从房间里离开过。

夜里,加州 Pioneer Building 的 OpenAI 办公室里,灯还亮着。Ilya Sutskever 在白板上写下一行小字:"Scale is all you need." 这句话第二年会在一个叫 GPT-3 的模型里被证明。

但 2019 年的冬天,没有人知道这一点。