对谈Kevin Scott:从小镇做题家到微软CTO,人生无法复制
投资OpenAI两个原因;关于企业AI堆栈;AI的变与不变!
编者按:本文来自微信公众号 有新Newin(ID:NewinData),经授权转载
本期,为大家带来 Kevin Scott的专访,对话 Elad Gil 和 Sarah Guo。
本期内容分为以下话题:
追逐理想,人生无法复制
投资OpenAI,1+1>
Satya无悔投资理论,胜负与收获
开源 or 闭源,企业 AI 堆栈
AI的变与不变,愚蠢的增量
AI 时代,给人们的最好建议
AI 领域感兴趣的方向
AI的安全性;拥抱监管,建立信赖
追逐理想,人生无法复制
Sarah Guo
可以从你的故事开始吗?从弗吉尼亚农村社区,你的父母没有上过大学,到成为微软首席技术官,这是一个怎样的过程?
Kevin Scott
我认为这是一段非常不可能的旅程,绝对不是我能够想象的事情,部分原因是我非常幸运地天生具备了某种能力。当我成长的时候,也就是上世纪八十年代的十几岁时,个人计算机正在发展,而我碰巧对此着迷。尽管我们相对贫穷,但我设法筹集到足够的钱购买了一台个人电脑,可以一直进行调试和 Tinkering(通常是一种具有试错性质的活动,通过不断地调整和实验,以解决问题或实现目标),那是一台 Radio Shack(美国早期的一家电子零售商)售卖的彩色电脑,它有一些像鸡蛋一样的按键,可以连接到电视机上。
我将它连接到了一台13英寸的电视上,它还有一个磁带录音机,可以存储和加载程序;那是我痴迷的事物。从那时起,我一直对计算机痴迷不已,我只是试图找到每一步上的路径,能让我从事某些有趣的事情,让别人愿意让我去做。
再次强调,这其中有很多运气,从处于弗吉尼亚州中部农村到成为微软首席技术官,你无法计划出这样的道路,但是我认为拥有一个心中的高层次理想总是有所帮助的,你知道自己的目标是什么,这总是有益的。
Sarah Guo
除了对计算机着迷和想要从事计算机工作之外,你的理想是什么?
Kevin Scott
我十几岁的时候就有了第一个理想,我想成为一名计算机科学教授,我看了看计算机科学家在做什么,觉得这是我见过的最令人惊叹的东西。
我上了一所科技高中,在我所生活的地方,位置非常中心,每所高中都可以选派两名学生前去学习,所以我是我所在高中选派出去的两名学生之一。在那里,我的计算机科学教授是一个叫Tom Morgan的人,我觉得他为我打开了一个全新的世界,学习所有这些东西真的让我兴奋不已,我想成为像Morgan博士那样的人。
对我来说,很多事情都与生活中有影响力的榜样有关。所以,一旦我遇到Morgan博士,我就想,哦,我应该去做计算机科学教授,这就是我一直走的道路,直到我30岁的时候,我从事编译器优化和计算机体系结构、编程语言等方面的工作,对于实际的计算机科学教授而言,与我想要的东西相比,我变得非常失望,我只是想要有很大的影响力。
当时我做这些决定时的感觉是,作为计算机科学教授,你可以有很大的影响力。的确,你可以产生很大的影响力,但这并不是系统所认可的影响力。你实际上可以产生的影响力是激发学生去从事这些职业,并且他们会取得比你自己更大的成就。
对我来说,这是最大的影响力,但作为一名计算机科学教授,这是最不被重视的部分。那时我做出这些重大决定的时候,我就决定离开。当时,我并不知道接下来该做什么,这一直是我差不多15年的使命,我有点迷茫,我看到我的一些学术朋友都在一个叫做谷歌的初创公司工作,我不明白他们为什么要在谷歌工作,谷歌只是一个小盒子,你在里面键入关键词,它会给你提供10个链接。
Oris Holtslow是一个编译器专家,Jeff Dean也是一个编译器专家,Alan Yates也是一个编译器专家,所有这些人我都在会议上见过,读过他们的论文,于是我说,好吧,也许我应该递交我的简历,于是我递交了我的简历,并接到了一些面试邀请。
这是我经历过的最好的面试体验,因为他们邀请了那时公司里可能是所有编译器专家的人参加我的面试,我当时感到非常惊喜,我在那里度过了最美好的一天面试,我得到了这份工作的报价,我可以选择。他们刚刚在纽约开设了谷歌纽约办公室,这是山景城外的第一个办公室,他们说你可以来山景城,也可以去纽约办公室,成为其中的第十个人。
我和妻子比起在山景城生活更愿意在纽约生活。所以我们选择了纽约。在我到达那里之后,新的使命就出现了。我们当时正在招聘这些聪明的人,我们的招聘方式有点疯狂。
我们说,好吧,如果你聪明,就来这里工作吧,我们根本不知道你到底要做什么,你来了之后会自己找到位置。我们有这些非常优秀而聪明的人,他们会来,但他们选择从事一些毫无影响力的事情,尽管在智力上很有趣,但它们只是有些愚蠢,因为它们永远无法与推动公司发展的任何事物相连接,这正是我试图摆脱的问题,我想成为一名研究计算机科学家。
于是我找到了一个务实的事情去做,我们团队的整个项目赢得了谷歌创始人奖,这是解决一个非常不起眼但涉及到一堆非常高级计算机科学的问题,我认为这是谷歌做得非常好的事情之一,然后我说,好吧,我应该帮助更多的人找到自己的方向,然后我成为了一名经理,从那时起,一切都是关于,嘿,我想尽可能帮助更多的工程师,确保他们的工作与有趣和有意义的事物相吻合。
投资OpenAI,1+1>2
Elad Gil
很少有人讨论过早期谷歌,实际上有很多学术界人士在管理重要部门,我觉得直到最近 OpenAI才有更多的学术界人士,所以你觉得学术界重新兴起了,这种情况已经过去了十年或二十年了。
Kevin Scott
这个观察真的很好,当我坐在OpenAI时,它真的让我想起了谷歌早期的日子,规模也差不多。所以我有一段时间无法理解,然后我说,哇,这真的让我有种回到谷歌早期的怀旧感,从中可以得出的结论并不是说它们是相同的公司或者它们试图解决相同的问题,而是这个地方的能量以及他们选择雇佣谁,很像。
Elad Gil
这是我第一次看到弦理论学家再次被聘用到计算机科学职位上(弦理论,即String Theory,现代理论物理学中的一种物理理论,旨在描述宇宙中基本粒子的行为和相互作用,它提出了一个全新的观点镇做题家到微软CTO,人生无法复制,即将基本粒子不再看作是点状的,而是将它们看作是细小的、振动的弦,这些弦可以以不同的方式振动,从而产生不同的粒子性质和相互作用模式)。
Kevin Scott
你和我可能都和Jonathan Zunger一起工作过,他现在在微软工作,我记得Jonathan当时正在做这个大规模分布式文件系统的工作,他是研究弦理论的。
Sarah Guo
所以在过去的几十年里,你的使命的重要组成部分之一是帮助弦理论学家和其他工程师弄清楚如何在自己的组织中发挥作用,另一部分似乎是实际的技术方向,对于决定什么值得投资,你长期以来一直从事机器学习产品的开发,例如谷歌的广告拍卖、LinkedIn的推荐等,有没有一个时刻,你个人意识到或决定 AI 对微软来说应该是一个关键的技术赌注?
Kevin Scott
我在微软工作已经有六年多了,差不多六年半。很快就明显, AI 对公司的未来非常重要。我认为在我到达之前,微软已经意识到了这一点。然后问题就是如何将公司所有的精力聚焦在正确的事情上?
因为我们在 AI 方面投入了很多,也有很多 AI 的精力,当我到达时,这种投入非常分散,并不是缺乏智商,也不是缺乏资本支出和其他方面,只是将花生酱涂抹在一大堆东西上;然后真正推动我们的东西是,也许这有点技术性,但是在我到达之前,有一个很有趣的技术现象是迁移学习开始起作用了。
从我在谷歌的第一个项目中研究的统计机器学习的角度来看,你有特定领域的数据,你有特定的机器学习模型架构,以及一种特定的部署和测量方式,这一切都是你为一个用例、领域或应用程序准备的。但是现在,我们开始看到,你可以训练一个数据集,然后用于多个目的。
我们可以在Deepmind的一些令人兴奋的工作中看到这种现象,他们使用强化学习在一些游戏应用中实现了迁移,但真正令人兴奋的是,当它在语言领域开始起作用时,如Elmo、Bert、Roberta和Touring等,我们可以想象在这些基础上构建许多基于语言的应用,只要它继续变得越来越好,我们就能够看到更多的应用。
所以我们只是在寻找它会继续变得越来越好的证据。一旦我们找到了这个证据,我们就全力以赴,从与OpenAI的合作开始,有一段时间我甚至占用了整个公司的GPU预算,我说我们不再在这些资源上涂抹花生酱了,我们会专注于那些有强有力证据支持的路径,增加更多的资本规模将产生更好的效益。
Sarah Guo
我记得大概是五年前,我们在晚餐时讨论,现在GPU容量成为技术界的热门话题,今年会如何在GPU上投资,以及如何分配这些GPU呢?
Kevin Scott
这一直以来都很困难,而且现在也没有变得更容易。你问的问题是关于我们如何决定与OpenAI合作的,我们之所以选择合作有两个原因。
首先,随着迁移学习的实际应用,你可以想象构建一个平台来支持所有这些东西,这样你就可以构建单个组件,并将成本分摊到各种不同的应用上,由于我们拥有超大规模的云服务,我非常感兴趣的一件事情,而且不仅仅是感兴趣,对我而言几乎就像是一种存在感,那就是如何确保从计算基础设施、网络、软件框架等各个方面构建云服务时,能够真正为其他各方提供服务?
因此,我们觉得除了我们公司内部正在进行的高度雄心勃勃的事情之外,我们还需要一些高度雄心勃勃的合作伙伴,当我们四处寻找时,OpenAI显然是该领域雄心最大的合作伙伴。我认为他们的雄心依然令人叹为观止,以及他们试图实现的目标,这就是一个原因。
第二个原因是他们的愿景与我的愿景非常相似,即这些技术正在发展成为平台,并且我们能够因为对未来愿景的一致而合作,尽管有许多困难的事情,但是因为我们在未来愿景上非常一致,我们可以找到合作的方式,即使有压力也是为了实现共同的目标。
Satya无悔投资理论,胜负与收获
Elad Gil
我认为合作伙伴关系在某种程度上的惊人之处在于时机。因为如果我记得没错,微软在GPT-2发布之后或者就在GPT-2发布之际进行了第一次重大投资。而这还是在GPT-3出现之前。两者之间存在着巨大的差异。但是我认为在GPT-2时代,这种重要性还不是那么明显。
所以我有点好奇,是什么迹象使你们决定与OpenAI建立这种良好的合作关系,而不是自己内部孵化,我很好奇你们是如何决定在这个时刻与他们建立合作关系的,因为当时情况并不明显,并且你们还投入了大量的资金。
Kevin Scott
我不想修正历史,事实比实际情况更好。在微软内部,关于是否进行这项合作的智慧性,存在着不同的意见。
萨提亚(Satya)有一个理论,他谈到“无悔投资”,也就是说,有一些投资有多种赢的方式,即使你输了,你也能赢一点,所以这是一种无悔的投资,最坏的情况是,我们会在计算基础设施上花费大量资金,并且我们将了解如何以非常高的规模构建这些AI训练环境,而且你必须对AI世界有一种非常奇怪的看法,才会认为你需要先进的计算基础设施。
此外,还有多种方式,我们有一些自己收集的证据,OpenAI也提供了一些证据,不幸的是我不能谈论,但这些证据使我们有了相当合理的信心,即规模扩大确实有效。你可能已经看到了著名的OpenAI计算规模论文,在这篇论文中,他们以对数比例的方式绘制了他们使用的计算总量,该图表显示了从2012年开始使用GPU训练模型的方式,到2018年左右结束,每年的计算量都增加了10倍,用于训练最先进的模型。我对我们永远不会达到的程度充满了极高的信心,例如“好了,我们有足够的计算资源了”。
这是一个大胆的举动。我认为微软在过去几年中所做的一切都非常惊人,从战略上看,这些举措在当时可能看起来并不明显,但现在回过头来看,真的非常聪明。就像你刚刚宣布与英伟达合作,共同构建一个由Azure基础设施和英伟达GPU驱动的超级计算机。你可以告诉我们更多关于你们的超级计算工作以及与英伟达和OpenAI的合作的情况吗?
我们建造了我们称之为AI超级计算机的第一个系统,我认为我们是在2019年开始研发的,并在那一年年底部署了它,这是GPT-3训练所使用的计算环境,之后我们一直在构建越来越强大的一系列超级计算环境。由于资本密集型的性质,最大的环境通常只用于特定目的。
但是,我们的系统设计使我们能够构建更小型的环境,并且这些环境可以供许多人使用。因此,我们有大量的人在Azure计算基础设施上进行大规模的模型训练,包括公司内部的人员和合作伙伴。这在过去是不可能的,你可以说:“嘿,我想要一个这样大小、具有这种强大网络的计算网格,以完成我的任务。”
英伟达一直是我们的计算和网络合作伙伴,因为他们几年前收购了Mellanox,合作的关键在于,随着时间的推移,你会从这些系统中获得更好的性价比,我们与他们密切合作,确定未来几代GPU的硬件要求,因为我们对模型的发展方向和架构有一个相当清晰的认识;这种合作关系非常好,我们现在正在大规模部署一台名为Hopper的超级计算机,其中包括8位浮点算术等许多特性,这些特性我们早就计划好了。
开源 or 闭源,企业 AI 堆栈
Elad Gil
关于闭源和开源模型以及两者之间的混合模式,你是如何看待世界的转变的?毕竟,从Azure的角度来看,现在很多人正在其上运行开源模型。
Kevin Scott
我认为人们把这个问题框定为一种二元的东西,这是一个有趣的现象。我认为两者都会有很多。我们仍然没有理由相信你不会想要构建更大的模型。但是,根据我们自己的部署情况,如果你看一下像 BingChat、Microsoft 365 Copilot 或 Github Copilot 这样的东西,你会发现你最终会使用一系列模型来完成工作,这是为了性能和成本优化的原因,有时也是为了准确性和质量的原因。因此,总是有一些你正在做的混合事情,而不是非此即彼。
实际上,我对开源社区目前的发展非常兴奋。我最大的疑问是关于如何解决所有的安全和隐私问题。但是,如果你看一下开源社区的技术创新,真的令人激动。我们现在正在做一些很酷的事情。就像昨天我刚刚在玩 DataBricks的 12 亿参数的Dolly 2.0模型,它可以在一台单机上很好地运行,作为一个喜欢玩弄运行在单机上的东西的人,我觉得这真的很令人印象深刻。
Elad Gil
关于企业客户,如何看待提供核心产品以外的 AI 能力?是否会出现特定的企业 AI 堆栈?是否会有特定的工具出现?你提到了安全性、分析性、微调等等,可能提供的潜在功能非常多,我只是好奇你是如何思考的。
Kevin Scott
我不想把这变成奇怪的营销演讲,但我们有这样的观点,我们始于这样一个假设,即AI将成为一个平台,人们将通过构建辅助人们工作的工具来最有用地使用该平台;因此,它不完全是完全自主的场景,更多的是辅助技术。
我们建造的第一件事是Github Copilot ,它是一种编码工具。你可以用自然语言描述你希望代码执行的功能,它会生成代码,然后你作为开发者可以像接受来自一位编程伙伴的建议一样仔细审查和代码审查,并决定是否符合你的应用程序的要求。这就是 Github Copilot 的第一个版本,现在它有很多其他功能。
我们观察到这种合作伙伴关系实际上是相当通用的。我们之后构建了一系列合作伙伴关系,构建它们的方式几乎就像是OSI网络图中的一个堆栈;首先是一系列用户界面模式,现在有新兴的插件生态系统,用于扩展合作伙伴关系的能力,用于无法从模型本身获得的功能;然后是一整套协作机制,像Lang hain是一个流行的开源协调器之一,但也有其他一些开源协调器,我们开发了一个名为语义内核(semantic kernel)的开源协调器。
现在存在着一个令人着迷的世界,这在九个月前还不存在,它与提示构建和提示工程有关。因此,你有一整套工具和艺术形式,可以为模型设计一个元提示(meta prompt),它是一种针对特定应用上下文的固定指令,让模型能够适应该上下文。
你有像“检索增强生成”(retrieval-augmented generation)这样的新型软件开发模式。在这之前,我们已经在这方面进行了一些尝试,尽管没有一个明确的名称,它实际上是一种将来自应用程序的提示注入到模型中,以帮助模型更好地响应的方法;然后,你还有一整套安全装置,就像对下行的过滤一样,从提示经过整个堆栈一直到模型,以及对上行的过滤,因为它会使错误的响应通过。有时,在将响应传递回用户之前,你需要进行多次循环。
我们对整个堆栈的形式有一个观点,微软的工具将帮助人们构建这些东西,以及在企业环境中需要在安全性、数据隐私、数据流向和启用哪些插件方面进行特殊处理;我认为所有这些东西现在都在构建中,另外我要说的是,我们会构建其中一些东西,但社区也将构建大量的东西,因为从来没有一个平台或生态系统是由一个人构建所有有用的东西的,这纯粹是胡说,从来没有发生过;对我来说,看到现在正在发生的所有能量是一件非常令人兴奋的事情。
我刚刚在与微软研究部门的一次评审结束不久,看到微软研究部门,许多研究人员已经将他们的研究转向了与AI相关的领域,或与AI相关的事物;对我来说,这有点像2001年我在那里实习时的微软研究部门,那时有很多非常聪明的人们对未来的样子有了一瞥,其他人都没有,因为那是计算机通往普及的时刻。他们的研究都围绕着那个小小的一瞥展开,那个早期的预见。这感觉真的很神奇。
AI的变与不变,愚蠢的增量
Elad Gil
现在学术界正在进行实时的巨大重新调整,这是非常令人兴奋的。
Kevin Scott
就像我们从这个角度来看,对我来说最大的惊喜是,我根本没有意识到 GPT-4 和 ChatGPT 会引发这么大的影响,我们有点期待会发生很多这种事情。
ChatGPT 是一个10个月大的模型,然后加了一点RLHF。坦白说,它并不是一个漂亮的用户界面,它只是一种让一些东西出现在那里的方式,因为在GPT-4的大规模发布之前,你需要在一些事情上进行一些练习。而且没有人真正知道它会以这种方式迅速发展起来。
Elad Gil
它只有5个月的历史,这只是五个月前的事,这令人震惊,每个人都忘记了时间过得有多快。
Kevin Scott
这是开源社区和大型科技社区,我认为它们最好的一面是,每个人都在重新调整,适应这种我认为与过去几年发生的一些充满热情的事情不同的东西,我不认为这是一种时尚,这是真实的。
Sarah Guo
大约6个月前,我启动了我的新基金,重点是 AI ,几周后, ChatGPT 出现了。我想说,即使是那些非常有准备、希望跟上或成为这场巨大变革一部分的人,也感觉一直处于不稳定之中。但这是目前几十年来科技领域最有趣的时候。
Kevin Scott
这也是令人不安的时刻,很多事情都在变化。它们以一种你可能无法掌控的速度变化。所以对那些试图跟上正在发生的一切的人来说,这一定会让他们感到非常不安。在某些情况下,它们甚至迫使人们改变他们长期以来对事物的世界观。
我认为对于一些机器学习的人来说,这实际上比对一个正在寻找有趣事物去做的全新企业家来说更加困难,因为对于一个机器学习团队来说,他们的工作方式是非常不同的,甚至对于微软的一些人来说,他们已经有足够的时间来思考过渡问题,但仍然很难适应这种新的工作方式。
Sarah Guo
微软拥有令人难以置信的广泛产品组合,现在你负责解决所有基础架构问题,确定如何将所有这些能力整合到产品组合中;我经常与经营大公司或创办大公司的朋友交谈,他们也在努力解决这个问题。你是如何组织这方面的工作的?你有什么建议?
Kevin Scott
我认为你必须要记住,有些事情发生了变化,有些事情一点也没变。有一件让很多人搞混的事情是,模型不等于产品,基础架构也不等于产品。你需要非常快速地理解这种新型基础架构和新平台的能力,但这并不意味着你不需要努力去理解什么是一个使用它的好产品;我告诉很多人的一件事情是,最有趣的产品很可能是从不可能到困难的转变阶段。所以,那些以前根本无法做到的东西,现在变得困难了。因为从不可能到容易的事情可能并不那么有趣。
我的一个无关紧要的例子是,当15、16、17年前智能手机进入市场时,也就是2007年,我想,是iPhone发布的时候,差不多是15年前吧,然后一年后有了应用商店,所以最初的应用程序就是那些从不可能到容易的事情,我们几乎都忘记了它们。
我曾经在手机上安装过的一个应用程序,叫做woo按钮,按下它就会发出一声woo,就像Rick Flair那样,这些都不是商业模式,它们只是一些人在探索的东西,真正有趣的事情是那些已经变得困难的事情,人们在可能的情况下去构建,这些甚至不是平台的建造者们所想象的东西,我们甚至不再考虑最初在这些平台上推出的应用程序,就像平台刚开始推出时那些东西,那些东西现在已经不再有趣了。
你的智能手机远不止于一个短信应用、一个浏览器和一个邮件客户端,让它变得有趣的是TikTok、Instagram、WhatsApp和Doordash,这些都是人们在这些东西成为可能之后不得不构建的困难的事情。我认为这是你作为企业家或试图采纳这些技术的企业所需要记住的第一件事情。
不是说我该如何在我现有产品上添加一些LLM神奇,做一些愚蠢的增量事情,我甚至不应该称之为愚蠢,也许增量的事情还可以,但真正有趣的事情并不明显,而且非常非增量的,这对我们来说是个难题,因为我们有一群聪明的人,他们能看到所有可能的事情。
因此,挑战是引导他们朝着那些困难的、有意义的、有趣的、非明显的事情前进,而不是那些只会消耗大量GPU运算时间、阻止你做真正重要的事情的增量事情。
AI 时代给人们的最好建议
Elad Gil
我一直在思考一个问题,即在AI继续积累能力的情况下,你如何思考未来20年人类最佳的角色。尤其是我在考虑到我的孩子时,我在想,好吧,两年前,我本来会告诉我的孩子们去学习计算机科学,因为它是未来的语言。你认为在这个即将到来的变革中,对人们来说最好的建议是什么?哪些将是相对持久的事物?
Kevin Scott
我认为20年是一个很长的时间范围。如果我们对自己诚实一点,回顾20年前,想象一下你当时可能会做出的预测,你会到达今天吗?没有人会想到。但我认为有一些显而易见的事情。比如,我的女儿决定要成为一名外科医生。我认为外科医生是一个相当不错的职业。目前我们还没有机器人的指数级增长。我们拥有认知潜力。
因此,我认为整个世界充满了这样的工作岗位,你知道,在物理系统上产生影响,就像在现实世界中做某些事情一样。我们可能会需要比现在更多的这样的岗位,特别是在医学领域,比如护士、外科医生、物理治疗师、在养老院工作的人员,因为我们的人口正在迅速老龄化。因此,医疗系统的负担将会更重。我确实认为AI将会对生产力产生一些相当大的影响,但也许这种影响只是足够大,以为我们提供其他全新事物的空间。
因此,我认为在美国,我们对像我父亲从事的工作这样的工作分配的尊严和尊重远远不够。我在德国住了一段时间,德国在这方面有些不同。你可以成为一名机械师,这是一份非常好的职业,你的父母会为此感到自豪。
我认为所有这些职业,比如电工、机械师和太阳能安装技术员等等,我们都将需要,特别是因为我们的子女一生中我们将不得不重建整个电力发电和分配系统。我认为所有这些工作都非常重要。此外,我认为在创造性的工作方面,未来可能需要的更多,而不是更少,尽管我们用于进行创造性工作的工具,无论是编码还是制作播客等,将帮助我们做得更好。我之所以这样说,是因为人类非常擅长将人类置于他们的故事的中心。
现在,我们可以制作像《后翼弃兵》(The Queen's Gambit)这样Netflix的节目,但不是女王的智力,而是机器的智力,讲述一群计算机之间进行国际象棋比赛,因为它们都比最优秀的人类棋手更强,但没有人愿意看那个。
技术现在可能足够好了,你可以拥有超人类的F1赛车和可以做出人类无法做到的事情的F1赛车手。但没有人想看那个。甚至在计算机出现之前,如果叉车比人类更强壮,你可以举办一个强壮的人比赛,看看哪台叉车能举起最重的重量,但没人在意。人们关心的是人类。我们在说什么?我们关心什么?我们试图向其他人灌输什么?而这些都不会改变,没有任何改变。
有些人可能会说这还没有发生,是因为系统不希望发生。但我认为很大程度上是因为我们喜欢做事情。
AI 领域感兴趣的方向
Elad Gil
关于这一点,你对未来AI的哪些领域最感兴趣?或者其它你觉得乐观的事情?
Kevin Scott
我认为首先,我认为这可能是基于基础模型的部署的第一个伟大的一年,你将会看到许多公司的推出,许多人尝试各种想法。所有的大型科技公司都将有重要的产品正在开发。关于其他公司会做些什么,我有一些预测,但这将涉及到Microsoft整个产品组合。到今年年底,你与我们的软件互动的方式将与之前大不相同。
我认为这对每个人都是如此。它改变了大型科技公司之间的竞争性质。而且,它为小型科技公司提供了新的机会,可以来推动局势,并做一些有趣的事情。我和Sam Altman经常讨论的一件事是,我猜想今年将会有一家价值一万亿美元的公司成立。我们不知道是哪一家,但我们早就应该有了。
技术上,我认为你将会看到一些像 Red Pajama 这样的项目,还会有其他许多类似的项目,它们将在构建更具能力的开源模型方面取得很大进展,希望社区能够帮助构建一些安全解决方案,以便在部署这些模型时配套使用。
但从技术上来说,你会看到惊人的进步。然后,边界会不断扩大。OpenAI还没有广泛分发,但它最终会被广泛分发,我对遥远的未来有一些看法。
因此,你将会看到这些非常强大的多模型,就像GPT-4带来了许多新的令人兴奋的事情一样,具有视觉输入和对其进行推理的模型也将带来许多令人兴奋的新事物,但这还不够。
我认为今年的主题将是进步和活动,几乎无法追踪。我可能需要一个副驾驶员来关注所有这些事情,并确保我不会错过重要的事情。因为我觉得我现在就像投资者和密切关注这些事情的人们一样。
AI的安全性:拥抱监管,建立信赖
Sarah Guo
节目即将结束,还有其他什么想和大家分享么,Kevin?
Kevin Scott
我认为,随着事情的迅速发展,你真的需要科技界共同努力,在监管尚未出台之前,就某些明智的事情达成一致;这一切都很重要,不是什么都不做,而是我们都不应该在这一点上看待监管前景,说:“哦,天哪,这太痛苦了,我不想处理这个。”
事实上,有这样的渴望是一个非常好的信号,表明我们正在努力的事情实际上是重要的,因为没有人试图监管无谓的事情。
监管的目的是确保你可以为可能在社会中广泛普及的事物建立坚实可信赖的基础。例如,如果你把它看作是电力,你希望在允许技术发展和取得进展的同时,确保你的电力发电机是安全的,不允许人们随意走进来,把手放在电极上,让自己消失。你希望确保电力的分配是协调的,当它进入你的房子时,它不会烧毁你的房子,当你把电器插入墙上时,它们能够按预期工作。因此,我认为在某种程度上类似,不会有一种适合所有情况的方法。
我认为大多数人应该考虑的是部署问题,确保在部署技术时,满足要求并对期望有正确的认识是最重要的事情。然后,对于我们正在构建的这些庞大的基础模型,确保它们周围有一套安全措施。但我们构建这些东西的方式,它们并不会自己分发到世界上。在它们上面还有一整套东西,使它们安全。然后,根据每个应用、每个部署的情况,我们还会采取一整套措施来确保部署的安全。
因此,我认为每个人,包括所有的初创公司、开源社区的所有人,都应该思考这些问题,我在为确保我们为这些乐观的用途创造尽可能多的空间方面做了什么,我们在尽可能多地阻止那些有害的用途方面又做了什么。
Elad Gil
我对社区在早期阶段对AI安全性以及对待这个领域的方法的自我行动感到印象深刻。我知道OpenAI、Anthropic、Google、Microsoft等主要参与者在这个领域都非常周到,他们都希望确保事情做得正确对谈Kevin Scott:从小。
Kevin Scott
我的意思是,我们与这些公司激烈竞争,但我不担心你刚提到的这些公司会做一些不安全的事情。我将自己从微软的首席技术官的角色中抽离出来,只是作为这个世界的一位普通公民来思考,作为一位普通公民,我不担心我的竞争对手会做一些不安全的事情。
Reference: