计算时代的最新展望

这是我上个周末在南塔基特项目-在一个公园里举行的引人入胜的折衷活动在过去的十几年里,我每年夏天都会去那里。

在过去的100年里,世界上发生了很多事情。但我认为,从长远的历史观点来看,有一件事最终会在所有其他事情中脱颖而出:这是计算概念出现的世纪。

在过去的几十年里,我们看到各种各样的东西都“被计算机化了”,到目前为止,世界上有很大一部分人至少拥有某种形式的计算机设备。但我认为我们还只是刚刚开始理解计算这个概念的含义。今天我想做的是讨论一些正在发生的事情,以及我认为将会发生的事情,这些都是计算的结果。

词云

我从青少年时代就开始研究这些东西,到现在已经有三分之一个世纪了。我想我已经越来越理解了。

我们的计算知识引擎,Wolfram | Alpha大约三年前在网络上发布的,是这一认识的最新成果之一。

它每天做数百万次的事情就是回答人们提出的问题,并尝试利用其中的知识来计算答案。如果你在iPhone上使用过Siri或其他一系列服务,你可能会看到Wolfram | Alpha的答案。

这是Wolfram|Alpha的基本思想:我们想把我们文明中积累的所有系统知识,都变成可计算的。所以如果有一个问题,原则上可以在这个知识的基础上得到答案,我们就可以计算答案。

我们怎么做呢?好吧,首先是关于世界的数据。我们一直在稳步地从第一手资料中收集关于成千上万种不同的东西.城市。的食物。电影。宇宙飞船。物种。公司。疾病。体育运动。化学物质。 Whatever.

我们现在有很多数据,每秒钟都有更多的数据流入。实际上,到目前为止,我们收集的原始结构化数据以字节为单位,大约和人们在网络上找到的所有人类编写的页面的文本一样大。

但即使是所有这些数据本身也是不够的。因为大多数问题不仅需要数据,还需要从数据中计算出特定的答案。你想知道什么时候会有卫星从头顶飞过吗?我们可能有卫星轨道的最新数据。但我们仍然需要做一些物理等来计算它什么时候会超过我们。

因此,在Wolfram | Alpha中,我们做了一件大事,就是尝试从科学、技术和其他领域获取所有这些模型、方法和算法,并将它们全部实现。

你可能会想:你使用的一定是某种技巧,某种主算法。不,没有。这是一个巨大的项目。它涉及到来自无数不同领域的专家。给了我们它们的知识,这样我们就可以计算了。

事实上,即使拥有这些知识并能够从中进行计算也是不够的。因为我们仍然需要解决如何与系统通信的问题。当一个人在处理任何知识,任何问题时,只有一种实用的方法:我们必须使用人类的自然语言。

因此,我们必须解决的另一个大问题是如何将人类发出的那些难听、混乱的话语转化为可计算的东西。事实上,我认为这是不可能的。但事实证明,特别是由于我做了一些科学研究,我将在稍后讨论我们取得了一些重大突破。

结果是,当你输入Wolfram | Alpha或与Siri交谈时……如果你说了一些人类可以理解的话,我们也很有可能理解它。

所以我们可以用语言和我们的系统交流。它是如何反馈给我们的?

我们想要做的是,无论你问什么,我们都能做出最好的报告。不要只给你一个答案,要把它放在背景中。以一种最适合人类理解的方式组织信息。

就像我说的,所有这些,每天都会发生数百万次。我对它对知识民主化的意义感到非常兴奋。

过去,如果你想回答所有这些问题,你必须去找专家,让他们找出答案。但从某种意义上说,我们已经自动化了很多专家。这意味着任何人,无论何时何地,都可以立即得到答案。

人们习惯于在网上搜索东西。但这是完全不同的。

我们找不到你要的东西已经被别人写下来了的网页。我们正在回答你的具体问题,并为你计算一个具体的想法。事实上,我们每天看到的大多数问题都不会出现在网络上;它们是全新的。

当你在网上搜索时,就像问一个图书管理员一个问题,然后让他们递给你一堆书——在这种情况下,是指向网页的链接——让你阅读。我们试图做的是给你一个自动化的研究分析师,他会立即生成一份关于你的问题的完整的研究报告,包括定制的图表和图表等等。

好的。所以这看起来是一个相当大的项目。是什么让它成为可能?

事实上,我从小就在想这个项目。但在一开始,我并不知道这将在未来的十年甚至是一个世纪里成为可能。事实上,这是我所做的基础科学的一个重要部分,我稍后会讲到,这让我相信这是可能的。

这些年来,我参与了一些大型技术项目。但是Wolfram | Alpha作为一个实际问题是迄今为止最复杂的,里面有最多不同种类的运动部件。

事实上,它建立在我25年来一直在研究的东西上。这个系统叫什么数学软件.这是一种计算机语言。我想人们可能会说,这是目前存在的算法上最复杂的计算机语言。

数学软件是Wolfram|Alpha实现的语言。重点是数学软件,做一些类似于解微分方程的事情只是一个命令。这就是我们实现所有这些方法和模型的方式,等等。我们从我们已经拥有的非常复杂的语言开始。

Wolfram | Alpha仍有大约1500万行代码数学软件词多。

Wolfram | Alpha是指尽可能了解世界的所有混乱情况,并让人类使用自然语言与之快速互动。

数学软件是关于创造一种精确的计算机语言,以一种非常连贯的方式,将我们所知道的所有算法功能嵌入其中。

在过去的25年中,数学软件已被广泛使用。它广泛应用于世界各地的所有大型大学校园,以及所有复杂的企业研发业务。人们发现和发明了很多很多东西数学软件

从某种意义上说,我明白数学软件作为计算思想的实现语言。Wolfram | Alpha是这种思想与我们文明中发生的知识集体积累的交汇点。

那么从这里往哪里走呢?很多很多地方。

首先,Wolfram|Alpha使用的是公共知识。当我们使用某种内部知识时会发生什么?

在过去的几年中,已经创建了许多自定义版本的Wolfram|Alpha,它们将一些公司或其他组织的内部知识与公共知识相结合,并计算出答案。

出现了一些非常有趣的东西。很多人都在谈论“大数据”。但是“重大答案”呢?

我们需要做的是建立一些东西让所有的数据都是可计算的。所以我们可以用自然语言问一个问题,然后自动得到答案,然后自动生成最有用的报告。

到目前为止,这是我们为有限数量的大型组织定制的东西。但我们知道如何概括这一点,并在某种意义上提供了一种从数据中自动完成分析的通用方法。事实上,我们在几个月前在Wolfram | Alpha中介绍了实现这一目标的第一步。

您不仅可以问Wolfram|Alpha问题,还可以上载数据去吧。你可以上传各种数据。比如电子表格,甚至是图像。然后Wolfram | Alpha的目标是自动告诉您有关该数据的有趣信息。或者,如果你问了一个特定的问题,你可以给出一个关于答案的报告。

目前,我们所拥有的方法对于很小的数据块非常有效。我们正在逐渐增加大量的数据。

这是我做的一个有趣的例子。它与个人分析或有时被称为“量化的自我”有关。很长一段时间以来,我一直是一个以数据为导向的人。所以我一直在收集关于我自己的各种数据。23年来的每封邮件。十几年来每一次按键。每走一步都有好几年了。等等我发现这些东西在某种程度上对保持我的生活井然有序和富有成效非常有用。

今年早些时候,我想把我积累的所有数据,喂给数学软件Wolfram | Alpha。很快我就会得到这些绘图和分析等等。就像我的自动个人历史学家,向我展示我生活中的所有事件和趋势等等。

我不得不说,我认为一定有很多人在收集关于他们自己的各种数据。但当我今年早些时候写这篇文章时,它在所有常见的媒体上都得到了报道——我非常惊讶地发现,没有人出来说“我的数据比你多”。

所以,有点尴尬的是,我想我必须得出这样的结论:目前,我可能是最讨厌数据的人——或者可能是最擅长计算的人。尽管我们正在努力改变这一点。

就在几周前,我们发布了一款游戏Wolfram|阿尔法个人分析Facebook.所以人们可以将他们的Facebook账户连接到Wolfram|Alpha,并立即得到关于他们自己和他们的朋友等等的所有分析。

到目前为止,已经有几百万人这样做了。看到人们的生活可以这样计算是很有趣的。例如,有很多不同的朋友网络。每一个都有一个故事。并告诉一个人一些心理学。

所以我们在讨论让事情变得可计算。我们真正能使什么成为可计算的?城市呢?

这是一个城市的所有数据,由各种市政机构收集。有许可,有报告,有地理信息系统数据。等等。如果你是一个复杂的城市,你会在网上得到很多这样的数据。但它是原始的。只有专家才能使用。

好吧,如果我们要通过Wolfram|Alpha技术堆栈提供它呢?如果有一个关于城市的问题可以在现有数据的基础上回答,它就能够得到答案。

什么电线离这样或那样的建筑物最近?某个点和最近的变电站之间的电压降是多少?想象一下,你可以向手机提出这些问题,然后让手机自动计算答案。

嗯,关于在世界上实际设置这个有很多细节,但我们现在有技术来做它。建造一个可计算的城市。或者,就这一点而言,建立一个可计算的国家。所有生成的政府数据都可以被设置,这样我们就可以自动回答问题。无论是为国家的公民,还是为国家的管理者。第一个可计算的国家是什么会很有趣,但从技术和工作流程的角度来看,我们现在已经准备好了。

那么还有什么可以像这样计算的呢?

这是另一个例子:大型工程系统。现在有一种语言叫modelica——是的,它是数学软件这是一个面向那些创建大型工程系统的人的开放标准。过去只有工程部件的规格表。现在有一些有效的算法来描述每个组件。

我们最近收购了一家一直在使用数学软件多年来一直从事大型系统工程。我们几个月前刚刚发布了一个集成的系统建模产品,它允许一架飞机上的50000个部件,以可计算的形式表示它们,然后自动计算它们在特定情况下的行为。

我们还没有将其全部组装好,但我们现在有了技术堆栈来完成以下工作:您面前有一些大型工程系统,也许它会将传感器数据发送回我们的服务器。现在你对你的手机说“如果我把它推到300转,会发生什么?”我们理解这个查询,然后运行一个系统模型,然后告诉你答案;说“那不是个好主意”(最好不要用哈尔的声音或别的什么)。

这就是工程系统的运作。设计呢?

因为所有的东西都是可计算的,所以很容易在设计上运行优化算法,甚至在可能的设计中搜索一个很大的空间。越来越多的情况下,我们要做的是设定一些设计目标,然后让计算机自动找出如何实现这个目标。例如,它会知道有哪些组件,有什么规格,成本是多少,然后它会弄清楚如何组装实现设计目标所需的组件。事实上,很快就会有更多的日常例子。

例如,在Wolfram|Alpha中,我们一直在与零售商合作消费品数据.未来,人们只需要用自然语言来要求满足某些要求的产品,然后自动计算出它是什么。

或者,更有趣的是,说:“我正在做这样或那样的一件家装。弄清楚我需要多少产品才能做到这一点。”结果应该是一个自动生成的物料清单,然后是关于如何处理它们的说明。

所有这些领域都已经成熟,可以计算了。这是另一个:法律。

实际上,早在300年前,莱布尼茨就在思考这个问题,当时他首次发明了一些现代计算概念的前身。他设想有一些人类法律的编码,这样就可以让机器自动计算出:“这是否合法?”

现在,有些合同已经可以“计算”了。比如衍生金融工具的合同等等。但如果我们能让税法可计算呢?或者抵押贷款是可计算的?或者更极端地说,是一项专利。

事实上,一些合同,如服务水平协议,已经开始成为可计算的,因为实际上它们必须由计算机实时解释。当然,一旦事情变得可计算,它们就可以以更加民主的方式应用,而不需要所有需要的专家,等等。

这是一个完全不同的领域,我认为它将成为可计算的,实际上我们正计划分拆一个公司来做。这就是医学诊断。

当我审视医学界和医疗体系时,诊断确实是一个核心问题。我的意思是,如果你没有正确的诊断,世界上所有美妙而昂贵的治疗都不会有帮助,事实上,它可能会伤害你。

对人类来说,诊断真的很难。事实上,我认为这对计算机来说并不难。对他们来说,了解更多、不被概率弄糊涂等都要容易得多。

当然,这是一个大项目。首先对所有这些专门的决策树进行编码,等等。然后你继续研读医学文献,弄清楚里面有什么。然后你会从美国以外的地方得到很多实际的病人记录,然后开始对这些记录进行分析。有很多关于获取病史和诊断的信息,在自动化系统中这实际上变得容易多了。

但是,你知道,实际上有一些东西不可避免地会破坏现有的医学诊断,那就是基于传感器的医学。如今,消费者级别的医疗传感器屈指可数,比如温度计之类的。很快就会有很多。有点像我之前谈到的个人分析,人们将例行记录关于自己的各种医疗信息。

问题是:这将如何用于诊断?因为当你带着10兆字节的时间序列来的时候,这不仅仅是一个“你出了很多汗吗”的问题。这需要用算法来分析。

事实上,我认为整个医疗过程最终将是一个非常算法化的过程。因为你会用算法分析症状,但治疗方法也会由算法指定。事实上,即使现在诊断是非常重要的,但我认为最终这种情况会消失。一种是直接从观测数据到算法进行治疗。

这有点像在金融领域。你观察市场中某些股票的行为。是的,有些技术交易员会告诉你这是“头肩模式”之类的。但大多数情况下——至少在定量经济学的世界里——你只会使用一种算法来决定要做什么,而不会关心对正在发生的事情的那种“描述性诊断”。

在医学上,我希望整个计算方法能一直延伸到我们用作药物的分子。如今,药物往往只是做一件特定事情的分子。在未来,我想我们会有每个分子都像小计算机一样,观察它们遇到的细胞,并有效地运行算法来决定如何行动。

你知道,关于医学诊断有一些非常基本的问题。我喜欢考虑软件诊断的类比。你有一台电脑。它运行的是一个操作系统。事情发生在它身上。最终各种积垢堆积起来,开始运行变慢,最终崩溃;它死了。

当然,你可以重新开始——从同样的程序,实际上同样的“遗传物质”给你下一代。这和生物学很相似。但它远没有那么先进。我的意思是,我们有各种医疗条件的代码;对于软件来说没有类似的东西。

但在软件中,与生物学不同,原则上我们可以监控正在发生的每一点。我们刚刚开始做一些实验,试图从总体上理解什么是进行“软件诊断”的最佳监控方式,或者更有趣的是,为了有效地“延长”运行程序的寿命,您必须持续修正什么。

好的。我要讲很多领域讨论计算是如何影响它们的。这是另一个完全不同的行业:新闻业。

Wolfram | Alpha让我们处于一个有趣的位置,它拥有比以往任何人都要多得多的数据源,我们理解这些数据源进入我们的系统的意义。换句话说,我们有一种巨大的感觉系统与世界上的许多事物相连。

现在的问题是:世界上发生了什么有趣的事情?我们看到了所有这些数据。出人意料的是什么?有什么新闻价值?从某种意义上说,我们想要创造的是计算新闻:每小时自动发现“世界上发生的最有趣的事情”。

你知道,除了监控系统运行的算法,还有预测结果的算法。它可能是在解海啸在海洋中传播的方程。我想我们差不多可以做到。也可能是,我不太确定能不能解决这个问题找到一些经济或供应链模型,就像我们找到大型工程系统的行为一样。这样我们不仅能看到原始新闻,还能计算结果。

这就是新闻业的计算。那么书本上的计算呢?这些是如何计算的呢?

其实很简单。事实上,我们在几年前成立了一家公司,生产计算书籍。它被称为联系媒体.我们的第一本书是交互式的化学元素,它在iPad上市的那天就很方便地出现了,并且出现在很多iPad广告中。我真的很惊讶这里没有更多的参赛者。但Touch Press已经成为迄今为止最成功的高互动电子书出版商,实际上是计算书籍。而且,是的,在它的下面使用了我们的技术堆栈,比如数学软件Wolfram | Alpha。出版各种各样的书。最近的两个是埃及金字塔,莎士比亚的十四行诗

事实上,从数学软件我们实际上已经建立了我们所谓的提供-可计算文档格式-可以系统地定义可计算文档:在文档中进行交互和计算的文档。

还有来自cdf的,以及各种各样的企业报告我们开始看到一代教科书这可以交互式地说明他们的观点,也许还可以引入实时数据,这可以交互式地让学生们尝试一些东西,或者测试他们自己。

实际上,计算与未来教育的关系,无论是在形式上还是内容上,都有很多值得探讨的地方。我们一直在努力定义a基于计算机的数学课程,这是一种在21世纪值得教授的东西,现在,例如,很大一部分的美国学生每天例行使用Wolfram|Alpha来做他们的家庭作业。现在知识和计算变得更加大众化,我们可以教授更多的东西,这真的很令人兴奋。

我们也特别意识到数学软件-即使在教育的早期阶段,教授计算和编程的可能性有多大。

也许下次,我可以谈谈我们对如何改变教育结构的思考——以某种方式去制度化。

在我结束之前,我想说一点关于计算的意义不仅仅是我讨论过的所有实际的东西,而且是在更深层次的知识层面上。就像在《科学》杂志上。你们中的一些人可能知道我花了很多年作为一个用户数学软件基础科学

我的主要想法是背离300年来的科学传统,即使用数学方程来描述自然世界,而不是把它们推广到任意的计算机程序中。

嗯,我的大发现就是在所有可能的计算机程序中,只需要一个非常简单的程序就能得到难以置信的复杂行为。

我认为这对理解自然界的许多系统是非常重要的。甚至可以为我们的整个宇宙提供一个基本的物理理论。它也给了我们思考事物的新方式。为哲学。理解系统,组织等等。

牛顿科学给了我们动量,力和积分等概念。我们现在在各种场合都在谈论它。新的科学给了我们计算不可约性和计算等价性的概念,给了我们思考事物的新方法。

还有一些非常实际的含义。就像在科技方面。从某种意义上说,技术就是要获取世界上存在的东西,并看到如何为人类的目的利用它。弄清楚磁性材料或某种气体有什么好处。

在计算的世界里,我们有很多小程序和算法来做这些了不起的事情。现在有一种新的技术,我们可以做。我们定义了一些目标。然后我们在这个计算世界中寻找一个能实现它的程序。从某种意义上说,这让发明变得免费。

实际上,我们用过这个例子创作音乐还有一些人将其用于建筑等领域。用电脑做创造性的工作。而且,如果你想的话,可以非常高效地完成。例如,让大规模定制变得经济。

在一个非常实际的层面上,十多年来,我们一直在创造技术,而不是通过人类工程师一步一步地建立它,而是通过搜索计算宇宙,并找到所有这些东西,我们可以利用为技术。这是很有趣的。有时一个人发现的东西对一个人来说是很容易理解的。有时我们可以验证它的有效性,但它确实是非人类的解决方案。这是任何人类自己都不会想到的。而是在计算世界中发现的东西。

嗯,我认为这种算法发现的方法和寻找实际结构、机械装置、分子等的相关方法将不可避免地变得越来越重要。事实上,我猜在几十年内,我们会发现这些方法创造的新技术比所有现有的传统工程方法加在一起创造的新技术还要多。

今天,从某种意义上说,我们倾向于只使用简化的计算——因为这是我们现有的方法所允许的。但在未来,我们将会在世界的各个方面看到更多明显的复杂计算。

我想留给你们一个想法,即使在过去50年计算机发生了那么多事情之后,我们还没有看到任何东西。计算是一个更强大的概念,实际上我猜它将成为未来人类历史的决定性概念。

2评论

  1. 斯蒂芬,

    我们知道如何生产零能耗建筑,但是,在这个小公司,它需要大量的前期工作,以达到这个水平的能源效率。我们可以使用Sketch up和你们的后端软件来创建节能的经济适用房设计和生产吗

    特里·希尔
  2. 计算的概念…出现…定义的概念…

    想法-出现-概念…

    这就是人类的历史…

    丹Ellwein
Baidu