2024-05-11 03:13

日本AI,失去的不止三十年

14.1万

文章来源:远川科技评论


文|沈丹阳

编|陈彬

图片来源:由无界AI生成
图片来源:由无界AI生成


2019年,有两件事一直困扰着孙正义:软银的投资失败,以及日本科技的落后。

面对媒体,孙正义痛心地说道,科技产业几乎从日本消失了,我们正在成为一个被遗忘的国家。即将到来的AI革命,是日本重回牌桌最后的机会[1]。

随着ChatGPT问世,孙正义的呼吁终于成为了共识。然而,正当日本举国动员,准备一脚油门闯入赛道时,却发现了一个尴尬的事实:

日本目前的AI研究,非常依赖隔壁邻居为首的老外。

对此,RIKEN革新智慧综合研究中心负责人杉山将,曾做过一笔统计。

RIKEN(理化学研究所)是日本唯一的国家级科研机构,顶级头脑聚集地。汤川秀树等日本诺奖得主,都曾在这儿搞过研究。然而,那些被AI顶会收录的RIKEN论文,近一半的作者都隶属于外国大学,其中约一半的人来自中国[2]。



本土无人可用,使得日本在生成式AI浪潮里,始终处于失语状态。

然而,如若回溯历史,会发现日本也曾是个“AI超级大国”。

上世纪八九十年代,日本一度是深度学习的中心。杨立昆、余凯、林元庆、贾扬清等载入科技史册的泰斗级人物,都曾在日本的AI实验室度过一段青葱岁月。

曾经攥着一手王炸的日本,为何会迈向老无所依的结局?


站在日本人的肩膀上


上世纪80年代,正在读大学的杨立昆,被一群“疯子”吸引了。

彼时,深度学习是个“已被证伪”的技术路线。然而,仍有一小撮人在死磕,这其中就包括了一批日本科学家。杨立昆发现,当时大部分的深度学习论文,都是日本研究人员用英文写的。

这其中,对他影响最大的,是一位名叫福岛邦彦的日本人。


福岛邦彦
福岛邦彦


1980年,福岛邦彦参照猫的视觉结构,设计了一个叫做“神经认知机(Neocognitron)”的多层网络模型。

在生物的初级视觉皮层中,存在多个神经元,每个神经元只“掌管”一小部分视野。随后,神经元收集到的信息会统一传输到视觉皮层,组合成完整的视觉图像。

受此启发,福岛邦彦给神经认知机设计了“感知光照“和“运动信息”两个神经元,分别用来“提取图形信息”和“组成图形信息”。然而,福岛邦彦的神经认知机,存在一个致命问题:太超前了。

当时,主流的神经网络只有1层,但神经认知机有足足5层。

面对多层设计带来的种种问题,福岛邦彦一时找不到解决办法,导致神经认知机只能处理一些极其简单的工作。



直到1986年,辛顿提出了“反向传播算法”,这个问题才有了标准答案。

但若向前追溯反向传播算法,会发现其源头仍是日本人。上世纪60年代,日本数学家甘利俊一提出的“随机梯度下降方法”,为其提供了技术灵感[6]。只不过囿于特定时代的局限,甘利俊一没有条件在计算机上进行模拟验证。

1988年,杨立昆将神经认知机与反向传播结合在一起,打造出了大名鼎鼎的卷积神经网络。直到今天,卷积神经网络仍是图像识别领域最重要的算法之一。

由此可见,这些定义一个时代的AI研究成果,都是站在日本科学家肩膀上实现的。


实验室里的中国人


同一时期,日本的产业界,拉开了更为激进的历史篇章。

彼时,日本步入极度繁荣的泡沫经济时代。大型企业纷纷为爱发电,自掏腰包搭建中央实验室,发力基础科学。这其中,要数NEC(日本电器股份有限公司)最为激进:它直接切入美国科技产业腹地,将实验室开到了普林斯顿和硅谷。

财大气粗的NEC Lab,很快聚集了一大批日后响当当的名字。

西安交大软件学院院长、国家特聘教授龚怡宏,是第一个加入硅谷NEC Lab的国人科学家。在他担任实验室主任时期,延揽了一众青年才俊。

其中既有触发科技巨头竞拍辛顿的余凯,也有林元庆、徐伟等活跃在中国AI产业一线的技术大牛。


余凯
余凯


彼时,中国的计算机产业刚刚起步,吸纳不了那么多人才。硅谷NEC Lab无缝承接了这个需求,并招揽了大批立志从事AI研究的国人科学家。

余凯接棒硅谷NEC Lab主任一职后,又招募来了黄畅。当时,黄畅底下有一个名叫贾扬清的实习生。在NEC Lab期间,贾扬清展露出了高超的数学和工程代码能力,曾让实验室众人坚信其日后必有所造诣。

这种薪火相传的孵化线,在林元庆接手硅谷NEC Lab后仍在继续。

他引进的实习生谢赛宁,后来与麻省理工教授何恺明共同提出了著名的ResNeXt模型。2022年,谢赛宁还和OpenAI研究员Bill Peebles合著了论文《Scalable diffusion models with transformers》。

以这篇论文为基础,OpenAI打造出了视频生成模型Sora。

另一间位于普林斯顿的NEC Lab,同样招揽了杨立昆,以及支持向量机发明者Vladimir Vapnik等泰斗级人物。

可以说,历史上没有任何一家机构,能如NEC Lab这般,拥有此等高手如林的班底。



余凯曾在媒体专访中如此形容NEC Lab巅峰时期的影响力:如果你在谷歌上搜索美国NEC Lab,页面会立刻弹出一句话,你要不要来谷歌工作[7]。

然而鼎盛时期风光无两的NEC Lab,却早已埋下了衰败的草蛇灰线。


五月花号迷航


2002年,杨立昆刚在普林斯顿进行了一年的研究工作,NEC就开始施压。

管理层毫不客气地告诉杨立昆,NEC对深度学习没有一丁点兴趣,并顺手解雇了当时的实验室主任。这段经历让杨立昆对产业界彻底失望,跑回纽约大学当起了老师。


杨立昆
杨立昆


NEC突然自毁长城,有两个不容忽视的现实原因:

一是人们对AI失去了信心。彼时,无论是芯片的算力,还是数据的丰富程度,都远不足以让深度学习发挥其潜力。与此同时,“第五代计算机”项目的失败,更是雪上加霜。

“第五代计算机”项目始于上世纪80年代,目标是打造AI驱动的超级计算机。

在日本的设想中,第五代计算机将具备回答问题、知识库管理、图像识别、代码生成等功能[8]。这个“领先时代40年”的科研项目,一度将美国吓得不轻,立马掏出补贴与日本竞争。



如此一拍脑袋的项目,结局可想而知。

1992年,五代机项目正式宣告破产。日本不仅白白浪费了数亿美金,还把其他跟风的国家给忽悠瘸了。一怒之下,人们将责任归咎于AI。日后很长时间里,AI研究如同过街老鼠,人人喊打。

其次,日本的中央实验室模式,此时也出了问题。

日本企业对于NEC Lab等中央实验室的定位,是纯粹的基础科研机构。这种模式没有与市场和产业接轨,只是盲目追求多拿几个诺贝尔奖。这让科学家们非常苦闷,内部时常调侃称“反正做的东西也用不到产品上”。

因此,当经济泡沫消失,日本进入失去的时代,毫无实际用处的中央实验室,理所当然地成了第一批“挨刀”的对象。

2009年-2020年间,NEC多次进行万人规模裁员,并大幅缩减研发经费。

在此阶段,中美科学家们纷纷选择自主创业,或另择良木而栖。

2012年,余凯受李彦宏邀请,领导百度的AI业务。在他的号召下,徐伟、黄畅等NEC Lab的同僚,也先后加入百度。后来,他们又跟着余凯一同创办了地平线。

日本花大力气点燃的AI火种,最终造就了今天中国AI的冲天火光。2018年NEC第四次大裁员后,其美国实验室的技术中坚力量,几乎已流失殆尽。


孤胆英雄


日本AI高歌猛进的步调,随着NEC美国实验室的落寞戛然而止。

全球人工智能的历史仍在继续,就好像五代机项目从未存在过一样;而曾经组建了全明星阵容的NEC Lab,也渐渐被淡忘。在失去的三十年里,日本几乎没有在深度学习领域,留下任何一笔痕迹。

不仅如此,深度学习还在日本留下了根深蒂固的偏见。

2016年谷歌的AlphaGo击败了李世石,登上了全球科技新闻的头版。这一年,中国诞生了528家AI企业,催生371起AI投融资。从科学家到VC,都热情地谈论着深度学习的潜力。然而,隔壁的日本,却是另一番风景。

同年,日本产经省也举办了一场全国人工智能大会。有学者准备就深度学习提出两个企划案,却被同席的学术圈研究者提醒,“如果名字里加上深度学习的话,估计就没有人来听了吧”。

这种裹足不前的态度,是日本如今无人可用的重要诱因。



唯一意识到问题的,正是软银集团的孙正义。

2017年,孙正义在推出全球最大私募股权科技投资基金(愿景基金)时,笃定地表示,该基金只会根据一项策略进行投资,就是AI。

接下来的几年时间里,软银在AI领域的投资不可谓不激进。

光是在季度和年度报告中,孙正义提到“AI”的频数就超过500次,并大手笔地为超过400家AI创业公司,注入1400多亿美元资金。他甚至还在2020年胸有成竹地表示,史无前例的投资狂潮,将使软银成为主导AI革命的投资公司。

然而,孤掌难鸣。更尴尬的是,软银还压错了宝。

据风投数据库PItchBook于2023年公开的数据,在26家估值超过10亿美元的AI创业公司里,软银只投中了一家。

此外,孙正义虽然斥40亿美元投资英伟达,却在其股价暴涨前悉数抛掉,与近10倍的涨幅收益失之交臂。如果不是押中了ARM,孙正义的AI投资或将颗粒无收。


孙正义
孙正义


在ChatGPT引爆生成式AI热潮的2023年,孙正义在股东大会上痛心疾首地表示,自2022年末以来他就一直在反省,“为自己犯了很多错误感到羞愧”,“哭了好几天都停不下来”[13]。


失去的时代


孙正义的眼泪,既是对软银频频押注失误的悔恨,更是对日本AI产业的恨铁不成钢。

2019年时,孙正义曾不加掩饰地公开批判:在当前最重要的科技革命上,日本已变成了一个“后进国”,而使其不断丧失竞争力的本质原因,是对进步的不贪婪[15]。

这番言论,掺杂了不少情绪因素。实际上,这些都不是日本AI老无所依的根本原因。

深度学习从来都不是一场孤立的革命。

2012年,深度学习能够爆发,其实有两个先决条件:一是算力进化,当时英伟达所开发的GPU,已经初步能支撑起深度学习所需的算力。二是互联网的全面铺开,弥补了数据不足的问题。

集成电路、互联网、云计算,随着这些前置产业陆续成熟,深度学习才得以登上历史舞台。然而,这些产业,日本几乎一个都没有。

当年,在斯坦福教书的吴恩达想要进行大型图像识别实验,尚且有谷歌倾尽整个数据中心的算力,来成就他的The Cat Neurons项目(即“谷歌猫”)。

然而福岛邦彦和甘利俊一却没有这么幸运。即便是如今的日本,也没有任何一家民间公司,拥有训练AI大模型所需的庞大算力。仅有政府主导的理化学研究所中,才能找到“富岳”这样的超级计算机。

日本AI的后继无人,从最开始就埋下了伏笔。

如今,以AI为横切面的日本科技产业,似乎正在印证孙正义五年前的预言:日本已经失去了过去,但可能正在失去未来。


参考资料:
[1] 孫正義氏、日本を憂う「このままでは忘れられた国に」,日経ビジネス
[2] 日本国产AI开发依赖外国人,日经中文网
[3] Why Japan is lagging behind in generative AI, CNBC
[4] 科学之路,杨立昆
[5] 智能时代的算法发展,张江科技评论
[6] 甘利俊一 | 信息几何法:理解深度神经网络学习机制的重要工具,AI科技评论
[7] 对话地平线创始人、CEO余凯:德国诗意一般的六年深深地滋养了我,车云
[8] 第五代:人工智能与日本计算机对世界的挑战,爱德华费吉鲍姆,帕梅拉麦考黛克
[9] 野心勃勃的日本第五代计算机,是如何一步步走向失败的,CSDN
[10] 中国人工智能简史,林军,岑峰
[11] 日本人工智能的现状与“深层学习”的课题, Nippon
[12] 日本人工智能的发展及现状,鼎联知识产权
[13] 孙正义投AI,投了个寂寞,华尔街见闻
[14] 孙正义:一场巨大革命即将到来,软银终将统治世界,华尔街见闻
[15] 孙正义批日本竞争力反思人工智能落后,亚洲周刊
[16] 硅谷NEC Lab往事:将中国企业拽进AI时代的人,雷锋网
[17] 日本电子产业兴衰录,西村吉雄

本文链接:https://www.aixinzhijie.com/article/6845742
转载请注明文章出处

评论
登录 账号发表你的看法,还没有账号?立即免费 注册
下载
分享
收藏
阅读
评论
点赞
上一篇
下一篇