本体论的实践业务:来自前线的故事

化学哲学

“我们必须做出决定:一种化学品是像一座城市还是像一个数字?”我昨天花了一天的时间,就像过去30年来我一直在设计的新功能一样Wolfram语言.昨天下午,我参加了一个快速的会议,讨论如何扩展语言的化学能力。

在某种程度上,我们正在讨论的问题是典型的实际问题。但正如我们所做的事情经常发生的那样,它最终涉及一些深刻的智力问题。为了真正得到正确的答案——并且成功地设计出经得起时间考验的语言特性——我们需要深入研究这些问题,并讨论一些在哲学研讨会之外通常不会被考虑到的问题。

思想家

当然,问题的一部分是我们在处理以前从未真正出现过的东西。传统的计算机语言不试图直接谈论化学物质之类的东西;它们只处理抽象数据。但在Wolfram语言中,我们试图建立尽可能多的关于一切的知识,这意味着我们必须处理世界上的实际问题,比如化学物质。

我们用Wolfram语言建立了一个完整的系统来处理我们所说的实体.一个实体可以是城市(如纽约市),或电影,或者一个行星-一个实体有某种名称(“纽约市”),并且它有明确的属性(比如人口土地面积成立日期,……)。

我们早就有了一个概念化学物质-像,或乙醇,或碳化钨.这些化学物质都有特性,比如分子量,或结构图,或沸点

我们有很多成千上万的化学物质我们知道很多属性,但从某种意义上说,所有这些都是混凝土化学品:特定的化合物,我们可以把它们放在试管里做实验。

但是我们昨天想知道的是如何处理抽象的化学物质我们只是抽象地构造化学物质,比如说抽象的图表示它们的化学结构。这些应该用实体来表示吗,比如水或纽约市?还是应该把它们看作更抽象的东西,比如数字列表,或者数学图形?

当然,在我们可以构建的抽象化学物质中,有我们已经用实体表示的化学物质,比如蔗糖阿斯匹林之类的。但这里有一个直接的区别。我们说的是蔗糖分子还是阿司匹林分子?或者把这些东西作为散装材料?

在某种程度上,这是一个令人困惑的区别。因为,我们可能会认为,一旦我们知道了分子结构,我们就知道了一切——这只是一个计算问题。和一些属性如摩尔质量-从分子结构来计算基本上是微不足道的,但其他人喜欢熔点-这些都不是小事。

好吧,但这只是一个暂时的问题,我们不应该以长期的语言设计为基础?还是某种永远不会改变的更基本的东西?很巧,我碰巧做了一个基础科学这基本上回答了这个问题:是的,这是一个基本的问题,它与我所说的联系在一起违背了计算不可化归性.举个例子,某些物质的熔点的精确值可能是无穷大的从根本上无法计算. (这与瓷砖问题的不可判定性;安装瓷砖就像观察分子如何排列形成固体。)

因此,通过了解这一部分(相当前沿)基础科学,我们知道我们可以有意义地区分化学物质的大分子和单个分子。很明显,比如说,水分子和大分子水之间有着密切的关系。但是,它们和我们可以为它们计算的性质仍然有一些根本的、不可还原的不同。

至少原子应该没问题

好了,我们来谈谈单个分子。显然它们是由原子组成的。似乎至少当我们讨论原子时,我们是在坚实的基础上。可以合理地说,任何给定的分子中总有一些确定的原子集合——尽管当我们讨论聚合物之类的东西时,我们可能会考虑“参数化分子”。

但至少把原子类型看作实体是安全的。毕竟,每一种原子都对应着一种化学元素,而元素周期表上的原子数量是有限的。当然,原则上我们可以想象额外的“化学元素”;你甚至可以想到中子星就像一个巨大的原子核。但是,这里有一个合理的区别:几乎可以肯定的是,原子核的数量是有限的原子的稳定类型-而其他大多数人的寿命都非常短。

然而,有一个直接的脚注,“化学元素”并不像人们想象的那么确定,因为它总是一种物质不同同位素的混合物.而且,从一个钨矿到另一个钨矿,这种混合物可能会发生变化,产生不同的有效原子质量。

实际上,这是用实体来表示原子类型的一个很好的理由。因为我们只需要有一个代表钨的实体,就可以用来讨论分子。只有当一个人想要得到这种类型的原子的属性,这些属性依赖于限定符,比如它来自我的限定符时,他才需要处理这些事情。

在一些情况下(想想重水,我们需要在本质上是化学的背景下明确地谈论同位素。但大多数时候,只指定一种化学元素就足够了。

要指定一种化学元素,你只需要给出它的原子序数Z然后教科书会告诉你,要确定一种特定的同位素,你只需要说出它含有多少中子。但这忽略了钽的意外情况。因为,你看,钽是一种天然存在的形式180米Ta)实际上是an钽原子核的激发态,这恰好是非常稳定的。为了正确地说明这一点,你必须给出它的激发水平和中子计数。

从某种意义上说,量子力学在这里拯救了一个人。因为原子核有无限种可能的激发态,量子力学说所有的激发态都可以用两个离散值来表征:快速旋转奇偶校验

每一种同位素——每一种激发态——都是不同的,都有自己独特的性质。但是可能存在同位素的世界要比可能存在动物的世界有序得多。因为量子力学认为同位素世界里的一切都可以用有限的离散量子数来描述。

我们已经从分子到原子再到原子核,为什么不谈谈粒子吗?这是一个更大的问题。是的,有一些众所周知的粒子电子质子这是非常容易谈论的,并且在Wolfram语言但是还有很多其他的粒子。它们中的一些就像原子核一样,很容易被描述出来。你基本上可以这样说:“这是一个粲夸克-反粲夸克系统的特殊激发态或诸如此类的。但在粒子物理学中,我们研究的是量子场论,而不仅仅是量子力学。我们不能只是“计算基本粒子”;我们还必须处理虚粒子的可能性等等。最终,什么样的粒子可以存在的问题是一个非常复杂的问题,这个问题充满了计算上的不可约性。(例如,胶子场的稳定状态是一个更复杂的版本,就像我提到的与熔点有关的平铺问题。)

也许有一天我们会有一个基础物理学的完整理论.也许它甚至会很简单。但尽管这很令人兴奋,但在这里并没有多大帮助。因为计算的不可约性意味着,本质上,在下面的东西和出现的现象之间,有一个不可约的距离。

在创造一种描述世界的语言时,我们需要用实际可以观察和计算的东西来谈论。我们需要注意基本的物理知识,这样我们就可以避免以后会导致混乱的设置。但我们也需要关注科学的实际历史,以及已经测量过的实际事物。是的,比如说,有无数种可能的同位素。但是对于很多目的来说,为已知的实体建立实体是非常有用的。

可能的化学物质的空间

但在化学中也一样吗?在核物理学中,我们认为我们知道存在的所有合理稳定的同位素,因此任何额外的和奇异的同位素都是非常短暂的,因此在实际的核过程中可能并不重要。但这在化学中是另一回事。人们已经研究了数以千万计的化学物质(例如,将其投入到论文或专利中)。而且对分子可能没有限制,这可能是有用的。

但是,好吧,那么我们如何指代这些潜在的分子呢?在第一个近似中,我们可以指定它们的化学结构,通过给出图,每个节点都是一个原子,每条边都是一个键。

什么是真正的“键”?虽然它在实际化学中非常有用,但在某种程度上,它是一个模糊的概念,某种半经典近似于完整的量子力学故事。有一些标准的额外比特:双键、电离态等。但是在实践中,仅仅通过标记适当的原子和化学键图来描述分子结构,化学就非常成功地完成了。

好的,但是化学物质应该用实体还是抽象的图形来表示呢?如果是一种已经听说过的化学物质,比如二氧化碳,一个实体似乎很方便。但如果这是一种从未被讨论过的新化学物质呢?你可以考虑发明一个新的实体来代表它。

不过,任何自尊的实体最好有一个名称。那么名称会是什么呢?在Wolfram语言中,它可能只是表示结构的图形。但也许人们想要更像普通文本名称的东西——字符串。好吧,总是有IUPAC命名化学物质的方法,比如1,1′-{[3-(二甲氨基)丙基]亚氨基]双-2-丙醇.或者有更方便的电脑微笑版本:CC (CN (CCCN (C) C) CC (C) O) O.无论有什么基础图,都可以生成这些字符串中的一个来表示它。

但是,这里有一个直接的问题:字符串不是唯一的。事实上,不管你选择怎样写这个图,它不可能总是唯一的。一种特定的化学结构对应于一种特定的图形。但是可以有很多方法来画这个图,也有很多不同的表示方式。事实上,甚至(”图的同构)确定两个表示是否对应于同一个图的问题可能很难解决。

到底什么是化学物质?

好,让我们想象一下,我们用一个图表来表示一个化学结构。起初,这是一个抽象的东西。图中有原子作为节点,但我们不知道它们在实际分子中是如何排列的(例如,有多少个)当然,答案并不完全明确。我们是在讨论分子的最低能量构型吗?(如果有多个相同能量的构型呢?)分子应该是独立的,还是在水中,或者其他什么东西中?分子应该是如何形成的?(也许这是一种蛋白质,当它从核糖体上脱落时,以特定的方式折叠。)

如果我们有一个实体代表,比如说,“自然发生的”血红蛋白,也许我们会过得更好。因为在某种意义上,实体可以封装所有这些细节。

但如果我们想谈论从未真正合成过的化学物质,那就有点不同了。感觉上,只要对任何可能的化学物质有一个抽象的描述,我们就会过得更好。

但让我们来谈谈其他一些情况和类比。也许我们应该把一切都当作一个实体来对待。就像每个整数都可以是一个实体一样。是的,它们有无限多。但至少应该给它们起什么名字是很清楚的。对于实数,事情已经变得更混乱了。例如,不再有相同的uniqueness与整数:0.99999…实际上与1.00000…相同,但书写方式不同。

那么整数序列呢,或者数学公式呢?好吧,每个可能的序列或者每个可能的公式都可能是一个不同的实体。但这并不是特别有用,因为人们想对序列或者公式做的很多事情都是进入它们内部,并转换它们的结构。但是实体的便利之处在于,它们都是“单一的东西”,人们不必“进去”。

那么,“抽象化学物质”的故事是什么呢?它将是一种混合物。但人们肯定会想“进入”并改变结构。这就要求用图表来表示化学物质。

但接下来可能会出现令人不快的中断。我们已经知道了二氧化碳的很多性质。然后我们得到了这个抽象地表示二氧化碳分子的图。

我们可能会担心这会混淆人类和程序。但首先要意识到的是我们可以区分这两个东西代表的是什么。实体代表化学物质自然发生的整体版本,其性质可能已经被测量。这张图代表了一种抽象的理论化学物质,其性质必须计算出来。

但很明显,这里肯定有一座桥。给定一个具体的化学实体,其中一个属性将是表示分子结构的图表。给定一个图,我们需要一些ChemicalIdentify功能,有点像地理识别或者图像识别-试图从图表中识别出哪个化学实体(如果有的话)具有与该图表相对应的分子结构。

哲学遇上化学遇上数学遇上物理…

当我写下其中一些问题时,我意识到这一切看起来有多么复杂。是的,这很复杂。但在我们昨天的会议上,一切进展得很快。当然,这里的每个人以前都看到过类似的问题,这是有帮助的:这是我们所做的一切的基础。但每个案例都是不同的。

不知何故,这个案子比平常更深入,更有哲理。“我们来谈谈星星的命名吧”,有人说。很明显,我们对附近的恒星有明确的名称。其他一些恒星可能已经在大规模的天空调查中被识别出来,并给出了某种标识。但在遥远的星系中有许多恒星永远不会被命名。那么我们应该如何表示它们呢?

这就引出了城市的话题。是的,有一些明确的、特许的城市已经被正式指定了名称——我们现在可能已经在Wolfram语言中基本上拥有了所有这些名称,并定期更新。但是一些游牧民族只在一个季节里建造的村庄呢?我们应该如何表现它?它有一个固定的位置,至少在一段时间内。但是,它究竟是一个明确的单一的东西,还是说,它可能会演变成两个村庄,或者根本就不是一个村庄?

对于其中许多事物,人们几乎可以无休止地争论身份——甚至存在。但最终我们感兴趣的并不是这类事情的哲学:我们试图构建人们会觉得有用的软件。所以最后重要的是什么是有用的。

当然,这不是一件精确的事情。但这就像语言设计一般:想想人们可能想做的每件事,然后看看如何设置原语让人们做这些事情。人们想要一些由实体表示的化学物质吗?是的,这很有用。人们想要一种表示任意化学结构的方法吗通过图表的ctures?是的,这很有用。

但是要想知道实际要做什么,我们必须非常深入地理解每一个例子中真正代表的是什么,以及每一件事是如何相互关联的。这就是哲学必须满足化学、数学和物理等的要求。

年底我很高兴地说,我们一个小时的会议昨天(通知约40年的相关经验我有,和集体100 +年会议)的人,我想我们会想出一个很好的方法来处理化学物质的本质和化学结构。在Wolfram语言中完全完成和实现之前,还需要一段时间。但这些想法将帮助我们在未来许多年里计算和推理化学的方式。对我来说,研究这些东西是一种非常令人满意的打发时间的方式。我很高兴,在我长期努力推进Wolfram语言的过程中,我做了这么多。

6个评论

  1. 有趣的问题和挑战!我没有看到任何关于分子中原子(也许还有原子核中的粒子)固有堆积模式与稳定性之间的关系——我特别想知道原子核中的这一点。我想还有很多未知的事情。感谢您(和您的团队)的工作!

  2. 该解决方案是否会扩展到组织结构图(例如,企业、家庭和政府)?关于人类组织方式的谜题的解决方案看起来很像分子图:http://grinfree.com/marriage-employment-and-interdependence/

    请注意,有些解决方案可以促进细胞自动机之类的东西——我想知道这是否会对使用Wolfram语言来推断团队规模和组成的潜力产生影响?

    克里斯·桑托斯朗
  3. 为了避开你提到的关于化学键、原子等的“模糊”,你可以尝试阅读RFW Baders分子中的原子量子理论(QTAIM)。Paul popier的《分子中的原子》和Matta和Boyds的《分子中的原子的量子理论》是很好的开始。以电子密度(一种物理可测量性质)的概念为基础,阐述了原子、键和分子的精确可定义概念,并与可测量性质联系起来。所以我认为,如果你打算将多年来发展起来的概念应用到化学和化学领域,QTAIM (QTAIM)是一个起点

    罗纳德·库克
    • 谢谢你对这个项目的兴趣。正如博文中指出的,不同的分子表征或多或少适用于不同的环境。确实没有一种最佳的模型可以满足所有的目的,所以我们的目标是提供一个合理的数量,并且易于相互转换,这样用户的分子就可以在计算选择时得到有效的使用。在Wolfram语言中,支持用户渴望的QTAIM方法当然是可行的。

      管理
  4. 嗨,我从事以“构成”图的形式组织的化学工作[名称在50年代就给出了]。许多图论操作直接用于化学。对称性、验证、子图[片段]匹配、共轭、局部化学环境、刘易斯加成物、角度、扭转、手性、氢网络、质子和重原子抗辩、膳食和无机配位、可及表面积、寻环、共振、翻转态、互变异构体、转子异构体和构象、表面化学、晶体对称性操作,使图形变得定期更新,并不断添加更多。

    您的标题使用了“本体”这个词,但您在本文中正确地没有使用这个词,而是使用了图表:-)我还没有发现一种化学数据结构比图表更有用

    罗杰
    • 太棒了!化学图是我们最喜欢的表示形式之一,也是计算化学社区的主力。能够在Wolfram语言中将分子作为图形对象对待,这在我们的特性列表中是非常重要的。我们还将支持其他适合3D原子坐标的表示,并希望尽可能方便地让用户的分子在选择的计算中得到有效使用。

      管理
Baidu