2021 年 1 月 5 日,旧金山时间上午。OpenAI 在博客上贴出一组怪异的图像:一把形状像牛油果的扶手椅、一个穿着芭蕾舞裙的白萝卜、一排排被人类语言召唤出来的、之前从未被画过也从未被想过的东西。
博客标题朴素得像一则内部笔记:DALL·E: Creating images from text。文章告诉读者,这是一个 120 亿参数的 GPT-3 变体,训练它同时阅读文字和图像的 token,再让它接着"写"出像素。研究员 Aditya Ramesh 在受访时解释得更直白:他们给模型输入"an armchair in the shape of an avocado"这样故意刁钻的短语——模型从没在训练数据里看见过这样的椅子——然后看看会发生什么。
发生的事后来传遍了互联网:那把牛油果扶手椅,同时像椅子又像牛油果。它不是拼贴,不是检索,不是 Photoshop。它是被语言描述出来的物体。MIT Technology Review 在报道里用了一个小心翼翼的标题:"这把牛油果扶手椅也许是 AI 的未来"。编辑部显然也不太敢把话说满。
在此之前,AI 还活在学术圈和大公司的幻灯片里。2021 年 1 月的这一天,它第一次从专业论文里走出来,变成一个人人都能看见的玩具。DALL·E 本身没有立刻对公众开放,但那组被放上网的样本图——牛油果椅子、会计师打扮的狐狸、正在写代码的卷心菜——像野火一样在设计师的 Twitter 上烧起来。
它改变了那一年很多人晚上下班后在电脑前干的事。
六个月后,另一件事接着发生。2021 年 6 月 29 日,GitHub 与 OpenAI 合作推出了 GitHub Copilot 的技术预览版。它基于一个叫做 Codex 的模型——Codex 是 GPT-3 在公共代码上继续训练的产物,知道世上的开源 GitHub 仓库长什么样。装上 Copilot 的扩展以后,程序员在 VS Code 里敲下函数名和注释,编辑器里会浮出一段灰色的代码建议:按一下 Tab,整个函数就被补全。对 Python、JavaScript、TypeScript、Ruby 写得尤其顺手。
头几个礼拜,论坛上的反应两极。一派人震惊:"它写出来的东西,就是我下一秒要写的。"另一派人愤怒:Copilot 是用他们的开源代码训练的,却不还给他们署名,也不给他们许可证合规的保障。 开源圈子里一个广为流传的说法是,这是"一台洗白开源许可证的机器"。争议在第二年演变成美国加州的集体诉讼——那是后话,但质疑的种子,2021 年 6 月就已经埋下。
OpenAI 在 8 月 10 日单独发布了 Codex 的 API,允许开发者自己接入。自然语言到代码的转换,从此不再是论文里的 demo,而是一条可以按调用次数付费的生产线。
同一个月发生的另一件事,以更安静的方式改变了世界。
2021 年 7 月 15 日,DeepMind 在《Nature》上发表了 AlphaFold 2 的方法论论文,长达 60 页的补充材料和完整源代码一并开源。一周后,7 月 22 日,DeepMind 与欧洲生物信息所(EMBL-EBI)联合推出 AlphaFold 蛋白结构数据库——首批 35 万余个结构,覆盖人类整个蛋白组(约 2 万种)以及 20 种模式生物:大肠杆菌、果蝇、小鼠、斑马鱼、酿酒酵母、疟原虫、结核杆菌。
任何一位发展中国家高校的生化研究生,不用缴任何费用,也不用写任何邮件申请,打开浏览器就能下载到他想研究的蛋白质的三维结构。在此之前,解一个蛋白结构需要昂贵的晶体学设备和几年博士生的时间。在此之后,这件事变成了一个网页请求。
这一年的另一条伏笔不那么耀眼,但后来决定了行业的节奏。2021 年 5 月 31 日,北京智源人工智能研究院发布了 悟道 2.0,号称 1.75 万亿参数,比 GPT-3 大十倍;10 月,NVIDIA 与微软联合宣布 Megatron-Turing NLG 530B;12 月,DeepMind 的 Gopher(2800 亿参数)论文放出。规模竞赛已经开场。MIT Technology Review 在年底的盘点文章里,把 2021 定义为"巨型 AI 模型之年"——但它同时承认,没人知道这些 5000 亿、上万亿参数的数字到底意味着什么。
对普通人而言,宏观叙事是模糊的,微观感受是具体的。
旧金山一位前端工程师那年夏天在 Hacker News 上写过一段话,大致意思是:他原本每天要花一小时写 CSS,用了 Copilot 两周之后,那一小时变成了二十分钟。他不知道是该高兴还是害怕——节省下来的四十分钟,他的公司迟早会算清楚。另一位伦敦的插画师收到了第一份奇怪的需求:客户拿着一张 DALL·E 草稿来问她,能不能照着这个风格画出来,但是要更有"人味"一点。她接了,但回家之后写博客:"我第一次替一个没有手的对手打工。"
2021 年也是医药行业的记忆转折点。制药公司的 pipeline 里,AI 生成的候选分子数量第一次被列入年报。DeepMind 从 AlphaFold 里分拆出了 Isomorphic Labs,正式进入药物发现赛道。硅谷一些老派的生物学家私下抱怨:这行干了三十年,没想到最后打败自己的,是一组来自桌面游戏公司背景的计算机科学家。
这一年还发生了一些容易被忘记、但之后反复被引用的小事。Wu Dao 的开发者在台上演示它可以用传统汉语对出工整的对联。Clubhouse 的创业者在 Reddit 上抱怨 Codex 让他觉得自己只是"一个打字速度很慢的 Tab 按键"。一家以色列公司开始卖 AI 生成的 headshot,价格是真人摄影师的五分之一。LinkedIn 的招聘广告里,"prompt engineer" 这个词条第一次出现,但投递简历的人大多数都搞不清楚这是什么工作。
如果说 2020 年是 AI 悄悄换挡的一年——那一年 GPT-3 发布、AlphaFold 2 在 CASP14 拿下 92.4 分,但圈外几乎无人察觉——那么 2021 年,就是这个换挡之后,普通人第一次感受到速度的年头。画室、代码库、实验室,三扇门被同时推开。
这一年年底,有设计师在自己的博客里这样写:
我们曾经以为 AI 会先抢走工厂流水线的活。结果它先来敲了我们的门——插画师、程序员、文案、生化研究生。原来那条"人人都会被替代"的底线是反过来画的:先是需要想象力的工作,再轮到需要力气的工作。
没人在 2021 年能证明这段话的全部分量。但从那一年起,"AI 工种"这个词在猎头的数据库里第一次被认真填入。一个新的工种正在诞生:它不吃饭、不休息,在很多任务上已经比初级员工便宜。