从为了维持生计和学业当保洁员,到成为斯坦福教授和享誉 AI 领域的科学家,她是如何做到的? ImageNet 对深度学习的崛起意味着什么?她目前对 AI 发展的关注重心是什么?又如何看待 AI 学界人才等资源外流的现状?去年 8 月,在 Pieter Abbeel 主持的 The Robot Brains Podcast 节目中,李飞飞都一一作了解答。
以下是对话内容,OneFlow 社区做了不改变原意的编译。
1 从保洁员到从事 AI 相关研究
Pieter Abbeel :你的职业道路非常传奇,在成为斯坦福教授之前,你一开始是在干洗店工作。
Fei-Fei Li :是的,干洗店是我的“创业起点”。我们一家是典型的移民家庭,需要努力解决生计,遇到了很多困难,包括我父母不会说英语等等。19 岁,我入读普林斯顿大学后,当时觉得开一家干洗店是最好的选择,尤其它还是周末营生,我就有时间去帮忙,还可以分担店里的很多体力活,这就是我的起点。
Pieter Abbeel :如果回到那段干洗店岁月,你会想到未来会从事跟AI有关的工作吗?
Fei-Fei Li :当然不会。当时,我的生活有一个贯穿始终的主题,那就是打工。我的第一份工作是在一家中餐馆打下手,后来做过一段时间的家庭保洁,然后才是干洗店。但我并没有让这样的生活定义我自己,这些只是移民生活的一部分,是为了让我和家人在陌生社会站稳脚跟所必须经历的事情。
真正定义我的,是我对科学的热爱。我在普林斯顿主修物理,物理探究的是宇宙最本源的问题,非常具有想象力。那时,我随身都带着书,在中餐馆和干洗店工作的间隙就会读书。在 AI 出现在我的生命中之前,日子就是这样度过的。
Pieter Abbeel :那你后来是如何进入 AI 领域的?
Fei-Fei Li :一切可能是偶然,也可能是命中注定。我当时对物理很着迷,现在我仍觉得自己更像物理学家,而不是工程师。
我读过很多 20 世纪最伟大的物理学家的书,包括我最喜欢的爱因斯坦和薛定谔,还有我童年时期非常崇拜的 Roger Penrose ,他在 2020 年获得诺贝尔奖,当然还有霍金。
博士择校时的依据是,这所学校是否有助于我进行跨学科研究。我最终选择了加州理工学院,师从 Christof Koch 教授,他曾是一位物理学家,后来成为计算神经科学家。还有 Pietro Perona 教授,他曾是工程师,后来转而研究 AI 。在他们的指导下学习,既可以研究认知神经科学,又可以研究计算神经科学。
在 Pietro 教授的实验室里,我才真正了解到什么是 AI 和计算机视觉,以及机器学习作为一种数学工具能做什么。我非常痴迷于这些领域,并清楚地感到这就是我的毕生追求。
Fei-Fei Li :这得追溯到我在加州理工学院读博时期。我所在的 Pietro Perona 实验室是计算机视觉领域最早的实验室之一,致力于研究物体识别这一看似不可能实现的任务。那时,计算机视觉领域更多关注的是立体视觉和对极几何(Epipolar Geometry),而我们却想教会机器如何识别日常物品,这看起来有些疯狂。
促使 Pietro 教授和我研究物体识别其实也跟神经科学有关,21 世纪初期左右的认知神经科学和神经生理学的文献提到,人类大脑和人类思维在进化过程中发展出复杂的自适应能力,最终让人类能够高效而灵活地进行物体识别。
我认为,这样的神经科学理论就像北极星,指引着当时不到 10 个人的计算机视觉科学家,而 Pietro 教授就是其中的核心人物。
Pieter Abbeel :你后来还入选了美国国家医学院院士,你怎么看待 AI 在医疗行业的应用?
Fei-Fei Li :AlexNet 取得突破性成果,标志着深度学习自此崛起。当时,深度学习技术已经应用到自动驾驶汽车上。自动驾驶技术的核心是 AI 要正确把握汽车行驶时行人和路面的状况,然后通过数据分析作出更好的驾驶决策。
AI 在医疗行业上的应用也是同样的道理,AI 要能正确理解那些多人协同的工作流程,然后综合这些信息给出恰当的治疗方案。
我对医疗行业颇为了解,想为这个行业作出贡献。斯坦福医学院是全世界最好的医学院之一,所以我开始在这里宣传我的想法。但很多人都觉得我太疯狂了,只有 Arnold Milstein 教授支持我。他的整个职业生涯都在研究医疗流程,确保临床医生的诊疗决策与行动标准化,避免病人因医疗流程失误而受到伤害。他在斯坦福创立卓越临床研究中心(CERC),并担任该研究中心的负责人和医学教授。
Arnold 教授告诉我,美国每年都有超过 25 万病人因为医疗事故丧生,有 9 万病人因为在医院感染而死亡,其中大部分感染都是由于医护人员手部清洁不到位。这些数字触目惊心。目前我们的医护人员工作量太大了,他们亟需协助来避免工作流程失误,防止给病人带来额外风险。
2012 年,Arnold 教授和我一拍即合,开展了一项即便在今天看来也相当新颖的研究——利用传感器实现环境智能(ambient intelligence)。之所以用“传感器”而不是“摄像机”是因为考虑到隐私问题,我们必须采用像 IR 和 Depth 这样的技术,以及使用传感器来获取病人和医生的行为信息,并利用捕捉到的信息来为诊疗提供参考。
Pieter Abbeel :这也让我想起了你最近的重大项目,Stanford Human-Centered AI Institute (Stanford HAI),你们主要研究如何让 AI 走出实验室,应用到包括医疗在内的各个领域。当初为什么决定创立 Stanford HAI ?
Fei-Fei Li :在 2017 到 2018 年的学术休假期间,我出任 Google Cloud 的首席科学家,有幸见证了 AI 的前沿发展,看到了 AI 被应用在农业、医疗、金融等多个垂直领域。
这段经历也刷新了我的认知,当我结束学术休假回到斯坦福,我开始跟同事和领导交流:在 AI 时代,学术界能够发挥什么作用,能为人类的未来作出什么贡献?
斯坦福一直自豪于它是领袖和人才的摇篮,也是思想和学术的灯塔,那它能为 AI 做什么?我们的答案是,作为 AI 界的技术中心之一,斯坦福应该引领 AI 的发展方向和技术落地,这既是斯坦福的重任,也是它的机遇。
近年来,我也越发意识到,随着技术进步,我们必须完善相关政策。科技会推动社会发展,但同时也给社会带来侵犯隐私等负面影响,让人们担心 AI 会否取代人类的工作等等。
为了扬长避短,科技界需要和政界加强沟通。可能因为加州离华盛顿这个政治中心太远了,所以目前我们这种沟通还不够多。因此,Stanford HAI 承担了双重使命,既要研究 AI 技术和 AI 的跨领域创新,也要开展、参与政策研究和制定,成为政界和科技界之间的沟通桥梁。这就是 Stanford HAI 正在做的事情,旨在推动 AI 研究、AI 教育和相关政策的发展,从而改善人类生活。
我平常不是在做研究,就是在 Stanford HAI 工作。我相信全球很多研究机构和中心都和 Stanford HAI 一样,都认为 AI 不仅会成为新的科技浪潮,而且会深刻改变人类的生活、生产方式以及商业模式。AI 是大势所趋,它应用面广、影响力大,被称为第四次工业革命的驱动力。毫无疑问,它会给人类带来翻天覆地的变化。
Pieter Abbeel :在未来的 5~20年里,有没有什么技术会像 AI 在医学领域那样发挥起重大作用?
Fei-Fei Li :我对机器人也很感兴趣。20 年前,机器人和人工智能是完全不同的领域,它们使用的工具和研究的问题都相距甚远。但现在随着深度学习、机器学习、强化学习的出现以及计算机视觉和自然语言处理的成熟,机器人和AI可以产生更多交集,可以衍生 AI 机器人和机器人学习等交叉领域。