400-123-2268

George Ellis 经典论文:自上而下的因果与涌现新利体育

  新利体育这篇论文主要从机制层面讨论了自然界中的自上而下的因果和涌现,并提出了五种主要的自上而下的因果机制,即基于算法的、非自适应信息控制的、自适应选择的、自适应信息控制的以及基于智能的自上而下的因果机制。作者还讨论了这些机制的数学和理论基础,并提供了许多真实世界的例子加以说明。此外,文章还讨论了生命在自然界中的重要性,并通过达尔文进化论阐述了自然选择如何导致物种适应其环境。总之,该文为探讨自上而下的因果和涌现提供了思考启发,以及多种可供深入探讨的机制和具体案例。它对生命的起源和进化过程的洞见也颇具参考价值。

  本文作者 George F. R. Ellis(1939.8-)是宇宙物理学家,南非开普敦大学数学和应用数学系复杂系统荣誉教授,曾与剑桥大学物理学家史蒂芬·霍金合作撰写了《时空的大尺度结构》一书(1973年),他被认为是该领域的顶尖理论学者之一。从1989年到1992年,担任国际广义相对论和引力学会主席。从80年代起,研究重点转向宇宙学的哲学方面,曾担任国际科学与宗教协会主席,2004年获坦普尔顿奖(Templeton Prize)。2007年5月18日,当选为英国皇家学会院士。

  在结构和因果的层次结构中,自下而上(bottom-up)和自上而下(top-down)的因果都会发生。其关键特征之一便是高层级功能的多重实现,以及由此产生的对应于较高层级状态的诸多较低层级变量的等价类。共存在着五种主要的自上而下的因果机制:基于算法的,基于非自适应信息控制的,基于自适应选择的,基于自适应信息控制的,以及基于智能的自上而下的因果机制(即人类思维对现实世界的影响)。通过思维,像数学结构这样的抽象实体也能具有因果力(causal power)。自上而下的因果是通过因果松弛(causal slack)发生的。因果松弛产生自上而下的行为,实现对高层级功能的系统建构,改变低层级元素的性质,并在微观不确定层面与自适应选择(adaptive selection)相结合。理解自上而下的因果对于当今社会有重要影响。本文将给出两个场景:医疗保健及教育,尤其是关于阅读与写作的教学。在这两个场景中,究竟是自上而下还是自下而上的持续争论对社会有着重要影响。

  物理现象是一切复杂性的基础,包括我们自身的存在。这是如何实现的?我们的生命,是如何从一堆电子、质子和中子的相互作用中涌现出来的?

  复杂性的基础是模块化分层结构(modular hierarchical structures),这一结构使较低层级网络涌现出结构和功能。对从简单单元的交互中涌现出来的复杂性而言,模块化分层结构的每一个方面(模块 modular、分层hierarchical、结构 structure)都至关重要[1, 2]。其基本原则是,当需要执行一个复杂的任务时,你会将它分解成比整个项目更简单、需要更少数据及算力的多个子任务,并将这些子任务分配给具体的模块。每个模块又将被进一步分为子模块,如此往复,直到基础层级。这时,所有任务都是基于简单机制的简单操作,所有的工作都在基础层级完成。而后各个组成部分将任务的结果输出到上一层,直到适当的较高层级拿到其所需的结果。每个级别的不同模块会以某种方式交互:可能只是统计上的,如果各模块都在执行相同的任务时;或者通常执行不同任务时,那它们可能会形成一个复杂的交互网络。总的来说,这是一个高度结构化的交互实体的层级结构(highly structured hierarchy of interacting entities)。

  表1给出了自然(左)及人文(右)的基本复杂性及因果层级的简化版本。人造系统(如语言、数学、计算机、飞机、城市、组织和社会角色)也具有类似的层级性[3],在此毋需进一步举例。层级结构的每一个层级都由交互的模块组成。这些模块在各自内部呈现相对强力的聚合,具有较高频率和较高能量的内部动力学。而模块间的聚合力则较弱,相互作用的动力学也更为低频。该模块以外的实体无法直接获取该模块内部动态变量,只能通过接口变量来关联该模块的内部变量。

  结构与因果的层级。表中给出了自然(左)及人文(右)在现实中的层级简化版本(根据相应的学科特征)。从因果角度,较低层级是较高层级的基础。在化学层级之上的层级中,左列及右列没有相关性,因为自然与人文的涌现和因果是截然不同的;但是它们的前四个层级是相同的(生命是物理现象的涌现!)。可以访问了解更多细节。

  例如,原子中的核子、人体中的细胞、社会中的个体和计算机代码中的子程序,它们在某个特定级别上交互的方式都可以用一个交互网络进行表征,表示是哪些模块通过各种可能的交互模式(模块间的力,或物质、能量和信息的交换)与其他模块相互作用,这正是系统的结构。此结构中,较低层级的单元聚合成较高层级的模块,可被识别为具有意义的实体,且其行为规则可以确定并保持一定的时间惯性,于是可以认为,可靠的较高层级行为从较低层级的交互中产生了——即从较低层级的模块中涌现出了较高层级的系统。想要从真实的交互网络中识别出各个模块并不容易,研究者为此设计了各种各样的算法。正如前文提到的,关键特征之一是递归的可能性(possibility of recursion):每个模块都有可能是由较低层级模块的交互网络组成。(如 Campell 和 Reece 的著作中对于生命层级结构的描述[4])。

  层级结构中的每层都依照着该层级的行为准则而运作,且只能用适合该层级的语言来描述(分子生物学的基本概念,如基因、蛋白质等,不能使用粒子物理学家的语言,如夸克、胶子)。类似地,适用于较低层级的因果无法解释较高层级的行为,因为这些描述中涉及的概念对较高层级不适用。较高层级的实体,如计划、意图等具有自身的因果力,而这也能部分决定较低层级会发生的事情(当我们抬手时,数十亿个原子和分子会根据我们的意图而动作)。与此同时,我们将某层级描述为较高层级,是指该层级可以影响另一个层级(较低层级),即通过层级影响导致该较低层级的动作。

  多重因果产生于这样的系统。某个结果的产生,背后需要一个因果网络,其组成部分互相影响、相互限制,不断交互。为理解这样的系统,通常,我们仅关注众多影响中被我们称为原因,亦即主要原因的那一个,而将其他的影响因素都视作理所当然并忽略它们。但实际上,那个有着相互影响、多重因果的网络一直都在发挥作用。可是为了理解正在发生的事情,我们有必要只关注复杂因果中特定的一些联系,而忽略其他的。实际上,我们不得不这么做,因为我们不可能穷尽所有层级上的全部因果要素。请注意,如后述,因果力并不仅限于有效因果(efficient causality)。

  仅凭自下而上的涌现而带来的效应是有限的。仅基于自下而上的自组装(self-assembly)和自组织(self-structuring)可以带来如晶体、简单的生物分子等结构的涌现,具有吸引子的动力学系统可以带来实体,诸如恒星和星系,以及更复杂的现象,如贝纳尔细胞(Bénard cells)、与反应扩散方程(reaction–diffusion equation)相关的模式、诸如沙丘、生命游戏的动力学(the Game of Life,译注:Conway在1970年设计的元胞自动机)、黏菌(slime mould)的特性、蚂蚁群体的存在和鸟群的行为。但这依然无法解释如单个活细胞这类真正的复杂系统。似乎进化出如此复杂的生物系统需要自上而下的因果关系,以构建必需的生物信息[5, 6]。这种信息无法通过自下而上的方式派生,因为它隐含着关于环境生态位(environmental niches)的信息,在不同的环境中,这一信息会有所不同。因此,即使实际上是较低层级的单元在动作,较高层级的条件也会影响其结果,而这正是此文特指的自上而下的因果。

  译注:贝纳尔细胞 Bénard cells是指当从底部均匀加热薄层状流体时,产生的一种规则的、分隔成细胞(cell)状的涡旋对流结构,由法国物理学家亨利·贝纳尔(Henri Bénard)1900年在实验中发现的,也被称为贝纳尔涡旋,现在是公认的耗散结构的典型例子之一。该原理的类似现象,还可以在热浓汤或季风只吹向一个方向时的气象卫星云图中看到。

  自下而上和自上而下两种机制的相互作用和影响,对我们理解复杂系统非常有帮助,同时也对我们的社会模型及相应的社会政策有重要意义。本文旨在概述自上而下的因果对于复杂系统,尤其在人文方面的重要性。这一重要性在本特刊的其他论文中亦有提及。要特别指出的是,当层级结构被适当扩展到符号系统这样的抽象实体时(为了更好地表示来自社会层面的因果,这是必要的),符号系统将成为高层级因果中的有效变量。本文中将给出两个场景的例子,来说明本文所提出观点可能产生的社会影响。

  在结构和因果关系的层级结构中,同时存在自下而上和自上而下的因果。物理学家的基本思考方式是自下而上的:他们认为较低层级行为是较高层级行为的基础,比如物理是化学的基础,生物化学是细胞生物学的基础等。随着较低层级动态过程的进行,与之相关的粗粒化(coarse-grained)较高层级变量将随之改变,例如分子在气体中的扩散(较低层级动态过程),气体将从非均匀(non-uniform)温度变为一个均匀温度(较高层级的变化)。然而,尽管较低层级通常可以满足较高层级发生变化的必要条件,却只在有些时候(在复杂系统中很少)可以满足其充分条件。实际上,是自下而上及自上而下的因果的结合,使得同层级的行为在较高层级上涌现——较高层级的实体可以改变较低层级的动作环境,产生这种涌现。

  这里有一个关键概念——粗粒化(coarse-graining)——对较低层级的变量进行粗粒化处理以得到较高层级变量[7, 8],伴随部分具体信息的丢失,使得较高层级行为从较低层级属性中涌现。例如,较高层级的某些属性可以通过对应较低层级属性的平均化确定,如气体的压力和密度由气体分子的空间及速度分布确定。与粗粒化相对的是细粒化(fine-graining)——在更精细尺度上的观测。然而,我们无法在粗粒化层级获知其背后细粒化状态的具体信息——这是粗粒化的基本结果之一,即信息隐藏(information hiding)。存在多种细粒化状态可以实现特定的粗粒化状态(即较高层状态的多重实现(multiple realizability),见下一段)。一些物理学家和哲学家声称,较高层级不过是较低层现象的聚合,即较高层级的涌现都来自较低层级的粗粒化。然而,一些较高层级的因果有效变量并不满足这一说法,它们显然不是较低层级变量的粗粒化结果。要想解释这类整体性的较高层级变量,我们必须将层级结构视作一个层级性因果结构,而非一个规模及复杂性简单叠加的结构——不管这一结构是否与物理实体有关。

  自上而下的因果对层级环境中的较低层级因果有关键作用——层级结构中的高层级通过限制并调节较低层级的相互作用,从而增加较高层级的可能性。此处有两个关键概念——较高层级的多重实现,以及由此产生的对应较低层级变量的等价类(equivalence classes)。等价类即同一较高层级状态对应的所有较低层级状态,例如,气体由温度、压力、密度等表征的的同一状态(较高层级)可以对应数十亿个不同的微观状态(较低层级);一台计算机由逻辑门及电子元器件中的电流所表征的同一状态(较高层级),可以对应许多不同的电子状态(较低层级);人脑中某个神经元的同一功能状态(较高层级),可以对应许多不同的分子构型(较低层级)。从较低层级动态中涌现较高层级行为,需要遵循等价类原则(principle of equivalence classes):同一较高层级状态会带来同层级结果,与具体由什么较低层级状态实现无关。这也是自上而下因果的关键之一[9]。若不同较低层级状态导致同一较高层级的不同结果,较高层级的自上而下因果就无法带来稳定的同层级行为(如在混沌系统中,较低层级动态无法产生稳定的较高层级行为(注释1))。人们也可以考虑通过对不能多重实现的较低层级现象结果进行选择或持续约束,来调节较高层级因果。但在实践中,较高层级状态不能多重实现的情况并不常见,这是组成复杂系统的较低层级模块的巨大规模所致,是物质的原子性质和生物的细胞性质所致。

  请注意,自上而下的因果是一个层级概念:它适用于任何两个相邻层级之间,这种因果的存在与是否是最低层级或最高层级无关。

  要想将某些因果效应归因于自上而下的效应,我们必须首先证明较高层级条件的改变将影响较低层级的过程序列。这可以通过改变较高层级的条件并观察较低层级的变化来完成(例如,我们可以压缩气体并观察到分子运动加快)。若条件允许,还应进一步证明存在较低层级的等价类,可以使得较高层级产生同样结果(例如,可以从分子层级各个变量的积分中确定气体的密度、压力和温度)——这是自上而下因果关系存在的有力证据,同时也说明可以通过较低层级变量的粗粒化获得较高层级的有效变量。较高层级的有效变量直接决定结果,而无需较低层级变量的参与——此类情况发生时,就产生了较高层级行为的涌现(例如,气体定律只与较高层级的变量相关,比如压强、密度和温度)。单个较高层级状态所对应的较低层级状态数目决定了系统的熵(entropy)[7, 8]。但在某些情况下,较高层级的有效变量无法通过较低层级变量的粗粒化获得 (例如,象棋规则决定了棋子在棋盘上移动的方式,因此这些规则具有因果效应;但这些规则不能由任何较低层级变量确定)。

  可识别出五种主要的自上而下的因果机制,可以通过许多真实世界的例子来证明它们的存在[2]。下面将依次讨论。

  基于算法的自上而下的因果,即较高层级变量用因果系统构建较低层级的动态过程,其结果取决于较高层级的结构、边界条件及初始条件。较低层次变量根据初始条件和边界条件以一种算法的方式确定结果(例如,计算机中加载的软件),这是由结构关系(例如,计算机的布线或神经元的连接)所决定的;改变这些条件将会影响较低层级的事件及动态结果。只要较低层级的交互是协调聚合的,受到较高层级影响而被约束的较低层级行为将会通过一种规律性/算法的方式带来稳定的较高层级结果,而这一结果取决于约束条件和初始条件的性质。这些常以交互网络的形式出现[11],通常包括循环网络模式[12]。而这些条件都是较高层级的特征,无法用较低层级的概念进行描述(例如计算机中晶体管之间的特定连接无法用电子属性来描述)。如果较高层级的关系被破坏,即使较低层级的元素未发生改变,系统也会停止运行。

  数字计算机是一个非常好的例子:较低层级的门电路和晶体管按照较高层级加载的数据和程序(如文字处理器、音乐程序、图像处理程序等)运作,而程序及数据则是较高层级概念,其结构和功能无法用较低层级的术语来解释。硬件和软件以共生方式层级结构化,实现这种较高层级功能[13]。再一个例子,许多物理系统由偏微分方程决定其结果,而其结果取决于其边界条件和初始条件(参阅Denis Noble[14]和Robert Bishop的文章[15])。

  这些基于算法效应背后的数学和理论各不相同,包括动力系统理论[16]、偏微分方程理论[17]、有限元数值方法[18]、统计物理学[19]、计算机算法分析[20]、电子电路设计[21]和网络模式分析[12]等。

  在非自适应信息控制系统中,较高层级实体通过反馈控制回路影响较低层级实体,取得系统实际状态和期望状态之间差异的信息,根据该信息迭代减小差异,以达到特定的,固定的目标。与前文所述的基于算法的因果不同,此类情况中的结果并非由边界条件和初始条件决定,而是由目标决定。此类系统的整体目标便是让初始条件与最终结果无关。当目标改变时,系统的结果也会改变。因此,其因果的性质与上一个例子大不相同——此处的反馈控制系统由较高层级目标引导。这与物理学的通常原则形成了鲜明对比,但完全符合工程和生物学原则。在生物系统中,较高层级目标在自然选择的过程中建立并体现在基因中;对制造系统而言,较高层级目标则体现在工程设计及后续的用户选择中。

  调节房间温度的恒温器是一个极佳的例子,其目标便是使用者所设定的期望温度。所有生物都包含许多基于反馈控制原理的遗传决定的稳态调节系统,对人类而言这一点尤为明显:体内的稳态是生理研究的关键[22]。例如,我们身体内部的系统相互作用,精确地将体温控制在98.4华氏度(译注:换算等于36.9摄氏度)。

  自适应过程(Adaptive processes)[25]指在许多实体(如身体中的细胞,人群中的个体)进行相互作用时,实体的属性不断变异,而最终更适宜环境的实体将被选择。更高层级的环境提供了生态位(niches),这些生态位对于不同变异的较低层级实体而言可能是适宜的(favorable)或不适宜的(unfavorable),适宜于生态位的较低层级实体的变异将被保留,而其他的则将逐渐消失。这种对于生态位的适应性(suitability)的标准,也可以被视作是引导自适应选择的适应性标准(fitness criteria)。在这个基础上,选择代理或选择器(a selection agent or selector,即系统中的活跃元素)接受其中的一些变异并拒绝其他变异;而被接受并组成了当前系统状态的实体就成为了下一轮自适应选择的起点,这最终导致了生物形态的涌现和特征。若较高层级的环境有所变化,较低层级的结构也将被改变。

  因此,这也是从环境到系统的自上而下的因果。在特定的适应性标准下,一组较低层级变量的等价类将受到某个特定生态位结构的青睐;如果顶层条件发生变化,结果也会发生变化。与反馈控制不同,这个过程中并不存在基于某些机制或系统而预先设定的内在目标,而是会创造出符合适应性标准这一目标本身的系统。这是一个自适应的过程,而不是控制过程。这也是产生先前从未存在的新信息的方式[5],随着内在信息量的不断积累,复杂性也得以涌现。该过程以一种非预定的方式不断搜索解决方案,并适应环境。结果通常既不能从初始条件预测,也不能从元目标(meta-goals)预测,因为其中涉及到随机因素,尽管两者都显然影响结果。这一过程也是生命的基础,包括细胞、植物和动物,是积累生物信息的基础,是物理学和生物学的基本差异[6]。

  译注:Meta-goals 元目标,是目标系统的属性之一,它与具体的目标内容无关,而是与目标系统的一般性质相关。元目标没有严格的学术定义,一般被看成一个新颖但不常用的派生概念。

  达尔文进化论是一个具体的例子:生命进化的标准解释是,随着进化逐渐复杂的结构是具有进化优势的,因为它们制约着会对其自身造成影响的较低层级相互作用[4]。细胞壁就是最经典的例子,不过这个原理不论是对生物高分子还是对社会都适用。通过在漫长的地质时间尺度(geological timescales)中持续的自适应选择,元目标——较高层级的目的引导动态过程——生物种群的生存(两个较高层级概念),最终形成了DNA结构。DNA编码(DNA中碱基对的特定顺序)通过这个进化过程发展,使生物体不断适应其所处的生态位。在这里,选择是通过死亡来完成的,而隐含的适应性标准便是生存。不同的生态位结构最终会导致不同的基因组。例如北极熊拥有白色毛皮的基因,以适应极地环境,而美洲黑熊拥有黑色毛皮的基因,以适应北美森林。由于各自生存环境的不同,这两种熊的DNA编码也不同。

  这是一个典型案例,它覆盖了从大规模环境到精细生物微结构的自上而下的因果——在进化的自适应过程中,环境(以及其他因素)决定了具体的DNA编码方式。任何人都无法仅根据生物化学或微物理知识预测或解释这些DNA编码。在生物体的生存这一适应性标准下,生物必须去满足各类细节条件,以确保自身的生存。对于每个生物体而言,生存这一元目标都是相同的,因为它是比竞争对手更适应环境的种群生存下去的原因。请注意,这并不是说环境是唯一相关的因素,而是说环境是具有因果效应的因素中的一个。事实上,有许多具有因果效应的因素,一些是自下而上的,一些是自上而下的,而最终的结果来自于所有因素的共同影响。那我们又如何证明这是自上而下的因果呢?因为如果改变生态位的结构(比如全球气候的变化),就将有另一个种群适应这一生态环境。事实上,针对同一个较高层级目的的诸多较低层级的等价类,是由较高层级的条件与生态位选择的,趋同进化[26]和微生物学[27]的许多例子都足以证明这一点。

  生物世界的一个关键特征是,类似的自适应选择过程,不仅发生在进化的时间尺度上,也发生在发育与功能变化的时间尺度上[28]。例如,大脑可塑性(brain plasticity)的基础是神经元群的选择过程,而这也是分钟级别学习的基础[29, 30]。需要注意,自适应选择这个概念具有更广泛的适用性;在物理学中,它可以发生在某个一次性的选择事件中,例如状态向量的制备(state-vector preparation)[31]。重复可以增加自适应选择的效用,但并非必要条件。

  大多数情况下的数学是自适应选择的数学过程[25],但是在某些具体的例子中,数学可以带来人口遗传学[32]和分子进化[33]的标准方程式。

  自适应信息选择(adaptive information control)发生在当反馈控制系统中存在自适应性目标,反馈控制和自适应选择两者相结合时。反馈控制系统的目标是能决定结果且不可归约(irreducible)的较高层级变量,但并非像自适应反馈控制系统那样固定不变,而是可以根据经验及所获得的信息而适应性地调整。整个过程由选择目标时的适应性标准所导向。这使得系统在面对不同的环境时拥有了极佳的灵活性。实际上,这种灵活性与记忆一起实现了学习与预测,构成了有效的有目的行为的基础[36]。这种灵活性使得有机体可以依照自身过去的经历,依据环境调节自身行为,从而构建了行为的复杂性。

  经典例子是动物的联想学习(associative learning),例如巴甫洛夫的条件反射(Pavlovian conditioning):动物对某种刺激,比如声音,做出反应,将其视为某种信号并引起由运动神经元(motor neurons)的生理反应[36]。这个训练过程是一个从大脑到肌肉细胞的自上而下的因果过程。在这里,适应性标准是回避负刺激;相关目标的变化(通过环境改变)会导致行为的改变。更一般地,思维依托于不断更新的经历及可选择目标,通过预测接下来可能会发生什么事情而运作[37]。这是我们大部分思维能力的基础。例如,感知过程实际上是一种基于当前对于预测误差的认识,通过贝叶斯统计(Bayesian statistics)更新当前感知的自适应过程[38],其中包括对他人意图的预测——这是他人心智理论的基础[36]。

  译注:他人心智理论 theories of other minds,是指人们用来理解和推断他人心理状态和思绪的一系列心理理论。这些理论试图回答一个基本问题:我们如何知道他人也有像我们一样的心智和意识体验?该些理论是哲学、认知心理学、新利体育神经科学等的重要研究领域,关注人类的社交和交流能力,及其诸种影响。

  一些人认为,进化博弈论的数学原理[39]将成为我们充分理解这些过程的基础。笔者对此存疑,因为这类模型所得出的人类行为过于简单。

  2.6. 自上而下的因果机制5:基于智能的自上而下因果(即人类思维对现实世界的影响)

  基于智能的自上而下因果是反馈控制的一个特例,其中目标的选择涉及符号表征(symbolic representation)。此处所说的符号系统(symbolic system)是一组结构化的模式,按时间和空间实现,被个人或团体任意选择来表征对象、状态和关系[40]。符号系统通常涉及分层结构和递归,因为这些是在解析复杂情况时所必需的,这也使得符号系统具有对于结果进行定量或定性研究的潜力。

  大型喷气式飞机制造的过程中,数十亿个原子按照飞机的制造计划被部署到各处。这绝非易事:在飞机制造过程中,人们需要花费大量资金,雇用航空动力学、结构、材料、燃料、润滑、控制等各方面专家来进行飞机设计,而后再根据设计和计划制造飞机。飞机设计与人体大脑状态不同,它是一组抽象且具有分层结构的等价类表征(如口头描述,绘制,计算机,大脑等等),这些表征共同组成了飞机设计。很显然,它是具有因果效应的(没有飞机设计,就不会有飞机)。

  符号表征与目标选择是抽象实体的因果效应的基础,比如以符号形式表示的行动计划、货币价值。因此,此类较高层级因果的关键特征,有别于自适应控制系统的一般情况,是其使用语言(口头或书面)及抽象符号,延伸到数学模型的定量或几何表述。它们都是抽象性质的不可归约的较高层级变量:形成了各类表征的等价类,可以使用不同语言、口头、书面形式或计算机表示。这一表征系统使得我们可以对信息进行存储、检索、分类、选择、舍弃等一系列操作,使得我们可以理性地从定量、定性两个角度分析事件结果并规划未来行动,使得我们可以基于过往经验及未来预期调整目标。如此,我们便可以根据目标制定并实施计划,从而改变现实世界。因此,此类抽象实体带来的最终结果实为人类的代理操作所致。

  此处有一个关键特征,即在自然或社会中存在的想象及正式或非正式因果模型的因果力——或许是个体对于接下来会发生什么的心理预期,或许是关于物理实体或社会的复杂量化模型[41]——这类在人类思维中存在的抽象实体帮助我们建立对于自然或社会的理解并采取相应行动,最终达到目标,因此它们在现实世界中具有因果效应。这些抽象实体实际上是基于主观个人经验的。语言、科学、数学、无数其他工具和习惯是社会建构,强烈影响着个体行为及社会文化。这些较高层级的变量并非由较低层级变量粗粒化而得。当然,我们不完全理解头脑如何计划和做出选择,从而导致自上而下的行动,就像本文中讨论的那样;我们不知道它是如何运作的,但这并不妨碍我们确定它确实发生。

  现实地看,法定货币只是带有图案的硬币或纸片,物理组成无法解释货币的因果重要性。货币的有效性,即通过自上而下的思维改变世界,例如建造楼房、道路、桥梁,基于货币价值及汇率的社会共识(social agreements)。这些抽象的社会共识源于长时间的社会互动,既不同于个体的脑状态,也不等同于任何较低层级变量的当前值的总和(尽管这些社会共识通过这样的状态和变量具有因果效应)。

  角色是由在社会建构过程中,具有因果效应的社会性决定的抽象实体,各类角色是社会结构因果力的关键要素[42]。角色是在社会和组成社会的个体的持续互动中产生的,这一自适应过程,既包括自上而下,也包括自下而上。角色通过自上而下的社会过程被灌输到个体,而后成为了与社会相关的个体心理的核心特征,也成为了指导个体目标选择及行为的某种社会预期。因此,社会角色具有一种从思维到身体的自上而下的因果力[36]。我们对目的及意义的理解,是思维中因果层级结构中的高层级抽象实体。孜孜探求意义是人类的关键天性之一[43],失去了它,科学的大厦也将倾覆。

  角色将社会价值赋予了个体,这一社会价值与个体价值相关,共同引导个人和社会的目标选择及实现。因此,我们可以说最高层级的自适应目标是与伦理学、美学、意义相关的价值观,它们自上而下地决定了可取的/可接受的较低层级目标是什么,所以也具有自上而下的因果力,它们是对于现实世界具有因果效应的一组抽象原则,事实上,它们关键性地决定了事件的发生。例如,战争的爆发与否取决于道德立场;如果核战争爆发,地球将遭受大规模的破坏。可见,我们的价值观念对人类活动如何影响社会和世界具有至关重要的作用。价值观是不可归约的较高层级实体,它们不可能是较低层级变量的粗粒化结果。

  那么,到底有没有合适的数学模型可以描述人类行为呢?许多学者都做过类似尝试,除了博弈论、进化过程的数学模型[44]之外,主要的还有数字经济学和金融数学,包括金融市场的布朗运动模型(Brownian motion model)、理性定价假设(rational pricing assumptions)和布莱克-舒尔斯模型(Black–Scholes model)[45, 46]。然而,这些模型都只能部分解释人类行为,在某些时候给出正确的预测;如果不加思考地使用这些模型可能招致灾难,例如2008-2009年的全球金融危机[47]。所有这些模型,都应谨慎使用。

  最后三类自上而下的因果都是复杂自适应系统的例子[25, 48]。这些系统是生物信息产生并融入生命系统的唯一途径。自适应选择之所以重要,是因为它可以使得系统去适应环境持续不断的变化,事实上这也是唯一的方法[49]。这也是生命似乎违反热力学第二定律的关键所在。自适应选择可以通过从许多变体中选择一组实体,仅选择与更高级别选择原则相对应的那些较低级别状态,积累结构和信息,最终形成一种自上而下的作用方式。

  类似于麦克斯韦妖(Maxwells demon):一个微小实体(假想的妖)控制着容器中间的门,从容器中的分子中选择高能量的分子并只让它们通过门进入对面的隔间,因此加热了对面隔间中的气体。因为微小实体选择分子的过程所消耗的能量可以忽略不计,这便在局部上违反了热力学第二定律[50]。但由于环境中的熵有所增加,第二定律仍在全局上有效。而达尔文式选择实际上是假想了一个巨大的妖,它能够作用到分子级别,从核酸组合中选择某个序列以编码想要的基因信息。这再次局部违反了第二定律。请注意,在生物学中,这个过程会重复许多次,但在物理系统,例如量子物理学的状态向量制备过程中,它可能只会发生一次[31]。

  正是各类自上而下与自下而上因果的结合,尤其是较低层级和较高层级变量之间反馈环路的建立,使得真正的复杂性得以涌现。例如可以影响个体行为的社会角色[51]之类的社会建构——但它们并非一成不变,它们也在不断进化,在较长的时间尺度上,通过个体自下而上地长期影响社会。

  还原论者的分析(Reductionist analysis)将机器行为拆解为其各部分功能(较低层级的结构),以此解释机器的特性。而系统思维(system thinking)则从整体角度理解一个互相连接的复杂系统的属性[52, 53],并从结构中较高层级的角色或功能来解释一个实体的行为或属性。例如,飞机为什么能飞这一问题可能会有以下几种不同的回答:

  自下而上的解释:飞机能飞是因为空气分子撞击飞机翅膀时,下方速度较慢的分子会产生比上方速度较快的分子更高的压力,根据伯努利定理(Bernoullis Law)这将会产生压力差,从而抵消了重力;

  同层级解释:飞机能飞是因为飞行员在驾驶着它,飞行员经过大量培训和测试,掌握了驾驶飞机必需的技能。同时飞行员之所以要此时驾驶飞机,是因为航空公司规定了今天下午16:35从伦敦到柏林有一次航班,而这一飞行计划是航空公司高管根据季节需求和运载能力制定的;

  自上而下的解释:飞机能飞是因为其设计便是如此!这一设计是由一支工程师团队完成的,金属学、燃烧、润滑、航空学、机床、计算机辅助设计等学科不断发展,满足了飞机设计所需的技术条件;同时在一个有着运输需求的社会经济环境下,能调动造飞机所必需的资源,并完成飞机设计和制造的复杂工业组织诞生了——这一切使得这支工程师团队最终完成了飞机的设计和制造。而一块砖不能飞,是因为它没有被设计成能飞;

  那么,飞机为什么会被设计成可以飞行的呢?因为这一设计将潜在地为制造商和航空公司带来利润!如果没有盈利预期,飞机也就不会存在——这是它存在的最根本原因。

  上述解释都很重要且同时成立;如果它们不同时成立,那么飞机也就不会飞了。较高层级的解释关注目标选择,而这又以较低层级的解释为前提——飞机的物理机制使得较高层级的目标选择可以成功。但显然,较高层级与较低层级的解释完全不同,且较高层级解释无法归约为较低层级解释,也不依赖较低层级元素的性质。较高层级的目标可以通过多种方式实现。而如果较高层级解释(人类意图的结果)与上述较低层级的物理机制不相关,那么自下而上的较低层级解释也就不适用了。

  亚里士多德在《形而上学》(Metaphysics)[54]中提出了四种不同类型的因果,可以用以描述上述情况。根据Falcon的说法[55],它们是:

  质料因(the material cause):物体由何构成,例如青铜便是雕像的质料因;

  形式因(the formal cause):形式,其本质描述,例如形状是雕像的形式因;

  效力因(the efficient cause):使得事物变化或静止的主要来源,例如工匠、铸造雕像的艺术、给予雕塑塑造建议的人;

  目的因(the final cause):末因,为何而为,例如健康是散步、减肥、排毒、服药和手术等的目的因。

  上面最后提及的目的因是一种目的论解释(teleological explanation)——一种关于目的(telos or purpose)的解释。此外,这里也有可能发生循环因果(circular causation)——事物之间相互影响,互为因果。

  笔者建议给出上述四种因果的现代版本,在层级结构中讨论因果——较低层级(物理的,physical),同层级(直接的,immediate),较高层级(环境的,contextual)以及最高层级(目标导向的,purpose or Telos)。但是,我们无法识别出最低层级的原因,因为迄今为止无人知道最低层是什么(粒子物理学的终极理论尚未被发现)。

  译注:Telos 目的,是指一种目标导向的理论,认为事物存在的意义在于它们的目的或结局。这种理论强调了事物的发展方向,以及实现某种特定目标的行动和选择的必要性。在科学和哲学中,Telos被广泛应用于理解自然和社会现象。在生物学中,生物体的生存和繁衍被认为是其存在的目的。在伦理学中,道德规范被视为实现最高目的的手段。

  要想成功完成一项物理实验(如在大型粒子对撞机中观察到粒子的产生)需要上述所有不同形式的因果参与其中。粒子间的相互作用产生了新的粒子,这即是物理原因。而直接原因则是在特定时间,实验者打开了加速器和测量设备。粒子对撞机的设计和制造使得粒子碰撞得以发生,实验者可以观察到结果,这构成了环境原因。而目的可能仅仅是实验者想在反德西特空间/共形场论对偶理论的背景下理解粒子碰撞,或者可能是因为他们渴望获得诺贝尔奖。

  译注:反德西特空间/共形场论对偶理论(AdS/CFT对偶理论):弦理论、黑洞物理学、量子场论等多个领域的重要理论框架,尤其被认为是理解弦理论和量子重力的重要途径。该理论是对这两种物理理论的关联。对偶的一边是反德西特空间(AdS),该空间为爱因斯坦场方程的最大对称真空解,用于量子重力理论,由弦论和M理论表示。对偶的另一边是共形场论(CFT),量子场论的一种,包括与描述基本粒子的杨-米尔斯场论相近的一些理论。

  因此,既可以采用自上而下的系统解释,也可以采用自下而上或同层解释,这些解释都同时适用。事实上,对于任何一个具体情况 ,都存在众多因果因素并构成因果网络,包括在具体情况中可以发现的因素,也包括整个历史、物理和社会背景,如果没有这些背景,那么这些事件就不会发生(例如,物理定律依然作用,地球依然存在,科学家们得以继续实验,设计可靠的测量仪器等)。在人们进行解释时,通常将这些背景视作理所当然,只关注其中一两个具体因素,也许是因为操纵这一两个因素就可以改变结果。

  因此,真实世界中因果的关键点,在于复杂系统中任何时候都有着同时存在的多重因果(multiple causality)(跨层级的,以及在每个层级内的)。如果声称某个单一原因对应了唯一的因果,这是完全的误导,因为这忽略了线. 人类符号系统的因果效应

  复杂系统某些方面的涌现是基于其内在的性质和逻辑,而其他方面的涌现则源自外部环境对于人类符号系统的塑造。此处关键在于,由此产生的较高层级因果实体并不具有物理性质,不可归约为物理实体,也不从物理实体中涌现,但它们却有因果力。它们产生于我们周围的世界,反映了现实世界的行为方式;因此它们起源于外部世界的真实存在,该存在独立于个体思维。它们不由较低层级的变量粗粒化而来,而是由人类思维发现并理解的。因此,符号系统层面的自上而下因果,是通过基于智能的自上而下因果(后简称TDC5)实现的。

  这个例子将为我们呈现一个自上而下的因果,它从数学抽象世界到基于神经元连接的人类思维,再到现实世界。在现实世界中,数学可以在纸上以某种模式呈现出来,是工程与计划的基础。数学的大部分内容都是被发现的,而非被发明的——有理数、零、无理数、曼德博集合(Mandelbrot set),这些都是经典例子。但它们并非通过物理实验发现,而是通过数学研究得出。它们具有抽象而非具体化的特征,同一个抽象的数量可以用许多符号和物理方式表示和具象化,这些表示可以形成一个等价类。基本的数学真理独立于人类和文化而存在[57, 58](注释2)。不难想象,如果仙女座星系的智能生命体也拥有足够先进的数学理解,他们便会像我们一样发现这些同样的数学特征(这些数学特征有望成为星际通信的基础)。这些特征由人类发现,并通过我们的数学理论进行表征;这种表征实际上是一种文化建构,但其所表征的基本数学特征并不是——与物理定律类似,它们也常在无意中被发现,如无理数√2和π的发现。数学真理通过人类思维而具有了因果效应,例如,人们可以将曼德博集合的图像印刷在书中——数学真理导致了墨水在页面上的物理具象化。

  麦克斯韦电磁理论(Maxwells theory of electromagnetism,一个抽象实体,通过麦克斯韦方程描述,详见[60])带来了无线电的发展,然后才有了手机、电视等使用由原子和电子组成的物理材料制成的设备。麦克斯韦的理论不是一个物理实体,也不是人类大脑状态。它可以用许多方式进行表征,如在黑板上、印刷品上、计算机屏幕上,或口头表述,它也可以用很多形式进行表征,如用三维向量或四维张量进行表示。这些不同的表征形式形成了一个等价类,因为它们都表示着相同的东西,也会带来相同的结果。如何通过这个理论说明自上而下的因果呢?基于麦克斯韦理论,我们设计了手机,制造并使用它。可以看到,抽象的物理理论改变了现实世界中的物理配置,因此具有因果效应。该理论也是一个不可归约的较高层级实体(它不能通过任何较低层级变量的粗粒化得出),它代表了物理现实的本质,新利体育因为它是现实世界中物质行为方式的物理定律表达,而这些定律是永恒和普遍存在的(物理在宇宙中的任何地方都是相同的)。物理定律的因果力来自于它对真实世界运作机理的精确描述能力:它被证明是对物理现实的良好表征(即物质行为中的一致性规律,构成了物理宇宙中所发生的现象的基础)。因此,物理世界中的因果规律可以通过这种方式表征为一组抽象模式,带来一系列具有因果效应的思维层级的理论。物质行为中的基础规律是这种因果效力的根源,独立于任何人类理解或意识,通过TDC5的方式,其拥有了对于物理世界的因果力,例如通过支持工程实践(以及支配物质行为)。

  译注:物质行为 behaviour of matter,指的是受物理定律规律支配的物质运动、能量和结构等可观测特性和相互作用。这包括个体粒子和更大的物质系统(如分子、流体和固体)的行为。

  自上而下的因果是通过因果松弛而得以自由发生的,那么因果松弛是在哪里发生的?如果底层的物理学是确定性的,可以确定较低层级的一切物理结果,那么较高层级因果效应是如何发生的?这里有三个相关的关键点。首先,当具体考虑某个物理或生物学系统时,我们要知道其较高层级功能有一部分依赖于系统结构。例如,计算机中特定的连接组合(本可以不同)约束了较低层级的动作,从而引导了其功能。但我们也需注意,系统的边界条件及开放性也在影响计算机的功能——新信息可以跨越边界进入系统,并对系统局部造成影响——它们影响了较低层级的各组成部分所处的环境,从而影响了较低层级动作的结果(可以参考Denis Noble的文章作为例子[14])。

  其次,自上而下的因果关系可以改变较低层级元素的特性。较低层级元素并非始终遵循固定的物理定律并一成不变,其特性是会被其所处的环境所改变的。通常,这类改变使得较低层级元素以特定方式运作,并实现较高层级的意图:这也是自适应选择的一种情况。因此,微观因果的特性可以被自上而下的因果所改变,这深刻地改变了对事物如何运作的机械主义观点。

  在生物发展的过程中,细胞不断分化以实现各式各样的具体功能,这个过程实际上是细胞自适应地改变了它们相对于其他细胞而言的性质[28]。细胞分化成为神经元,以适应其在大脑中的位置,分化为肌肉细胞,以适应其在心脏中的角色。不同的细胞各自发展、分化,以适应它们在身体中被分配的不同角色,并为了完成必要的功能进行微调(fine-tuned),从而创造出身体和其生物形态。其中一种特殊情况,是感觉神经元(sensory neurons)[36]可以从多能干细胞(pluripotent cells)分化而来。译注:多能干细胞 Pluripotent cells,是指一种能够分化为身体中任何类型细胞的细胞,包括胚胎干细胞和诱导多能干细胞。这些细胞能分化为多种不同的细胞类型,如神经细胞、肌肉细胞、心脏细胞等。

  在个体与其他人不断互动的过程中,个体的思维与大脑都在不断发展[61]。个体被社会所塑造,以便适应社会。例如,学习特定的的语言,理解社会中各式各样的角色以及社会期望[51]。这是一种从社会到个体的自上而下因果,甚至可以说是从社会到个体大脑中的突触连接的因果,因为在个体融入其所处社会的同时,大脑也被调整从而能够适应社会[62]。译注:突触连接 synaptic connections,突触(synapse)是神经元之间传递信息的连接点,通过化学和电信号的方式将信息从一个神经元传递到另一个神经元。突触的连接和强度可以根据学习和记忆等经验因素而发生变化。因此,突触连接的改变也是神经系统适应外部环境的重要机制之一。

  第三,自上而下的因果所需要的自由度,实际上也来自于微观不确定性(micro-indeterminism,微观物理效应的随机结果)及自适应选择——微观层面的随机结果让宏观层面的变异成为可能,从而导致了基于宏观层面的属性和意义对微观层面的选择。统计上的变异和量子不确定性带来了一系列可供自适应选择的变异系统,这些系统会根据在整个系统中较高层级特性,而发生自适应选择。

  要想从微观波动中获得宏观变化,需要一个放大机制(amplifying mechanisms)。一些物理系统可以将量子效应放大到宏观尺度,例如光电倍增管(photomultipliers)和人眼;在经典情况下,混沌系统(chaotic systems)可以将初始数据中的微小波动放大;Thom突变理论(Thoms catastrophe theory)也会大幅放大某些捕捉到的微小变化。这其中一些分子生物学过程,例如突变分子的复制,会充当放大器,于是甚至量子效应也可以改变进化结果[63]。由于量子不确定性,在深层次上,宇宙是不确定的,因此较高层级以因果松弛获得自由,挣脱较低层级的绝对统治,而这最终影响了生物过程[64, 65]。但该过程本身不会带来较高层级秩序,较高层级秩序是通过自适应选择实现的。自适应选择过程作用于较低层级变量的等价类,通过较高层级的选择原则,产生相应的结果(参照Jaeger的文章[27])。

  而正因为底层随机性的存在,这类自上而下的因果拥有了充足的因果松弛,使得其能够在不违背物理因果的前提下发生。例如,生物发育的过程使得分子水平的变异被放大到系统级别的变化。而有诸多证据表明此类随机过程线]。正因为宏观物理学和微观物理学存在的巨大差异,以及微观层级组成元素的巨大规模(细胞中的原子、人体中的细胞等),这些机制才得以发生。因此,真正复杂性的涌现离不开物理现实中实体的庞大数量。

  针对前文提到的飞机飞行的原因,Tim OConnor(2011年,个人通信)发表了以下评论:请注意,较高层级的解释涉及到(有意图的)状态,这些状态在飞机起飞之前很久就存在了。也就是说,这个解释之所以成立,是因为它将要解释的事件,置于一个更大的时空背景之中。于是还原主义者可能会反驳这一解释:如果这些意图状态本身,完全由更基础的物理事实决定,那理论上我们就可以获得一个完全的物理(自下而上的)解释,涵盖你指出的更大背景中所有的具体过程。这种解释将会与较高层级的意图完全无关,而是会找到一些基础事实,这些事实足以解释为何会有一种较高层级意图的解释与之并存。在最广的范围内(整个宇宙),基本物理事实和直接统治它们的规律,不对称地决定了较高层级系统的存在,和它们所能提供的解释形式。不过,至少目前为止,本文陈述的任何观点都不与这一主张相冲突。如果这是正确的,那么为什么事物不可能完全受这一规律支配呢?笔者的理解是,这个主张背后有一个假设——宇宙背后一个更大的时空背景设置了一组初始数据,这组初始数据可以完全决定当前的状态,并解释了当前的所有较低层级和较高层级。我的回答包括了两个方面。

  首先,由于量子不确定性的存在,即使是在原则上,也无法用宇宙学初期数据来解释当前的细节情况:例如,量子涨落可以改变动物的遗传基因[63],从而影响地球上的进化史。实际上,早在远古时期就发生过这类事情,宇宙射线(其发射过程受量子不确定性影响)引起了基因损伤[69]。因此,生命在地球上的具体进化结果(恐龙、长颈鹿和人类等)就算是从原理上也不可能被宇宙早期的初始条件,或地球生命起始期间的具体数据所完全确定。量子不确定性导致了不确定性的发生,因为在进化史中它带来的辐射诱导突变产生了重要影响。这会带来什么结果,只有在相关的光量子发射出来的那一刻才会揭晓——它们原本颇具不确定性的路径被一个成为了历史辐射事件所替代,原先不确定的一切成为了一个特定的光子的发射时间和轨迹,原先基于任何原理都无法被预测的结果得以确定——在某个具体的时间和地点,某个细胞中的某个基因遭到了破坏。若我们自己的存在都无法从那些所谓的初始数据唯一地决定,那任何思维和意图也不可能如此。

  第二点是,如果我们忽视上述(第一点)谈及的不可能性,那我们面对的就是这样一种观点——特拉法加海战(the battle of Trafalgar)、达芬奇的《蒙娜丽莎》、爱因斯坦发现广义相对论,这些将来的事情早就被写入了早期的宇宙背景辐射的涨落中,而我们现在正在通过威尔金森微波各向异性探测器(the Wilkinson microwave anisotropy probe satellite)观测这一波动。这显然荒谬。上述这些事件发生的唯一解释,是具有其内在逻辑的真正较高层级因果力的体现,这一因果力最终带来了这一切非凡的结果(还包括电子和质子受较高层级的因果效应影响而在大脑中移动)。这些事实不可能是仅由物理学所决定的。

  最后,OConnor(2011,个人通信)表明,虽然我们必须承认,细胞分化中的生物学自上而下的因果已经表明了存在一些非基本层级的因果,且其解释并非与上述的层级无关,还原主义者还是会说,不管是什么物理事实和物理定律,它们最终都与实现它们的高层级实体无关。但是根据目前最好的万物理论(theory of everything),即M理论,现有的一切粒子和力并不是由基本定律唯一确定的,而是来自于特定的弦真空态(string vacuum state)[70]。在这一背景下,纯粹的自下而上的解释就不起作用了——物理有效定律的本质受环境影响。根据Susskind的说法[71],多元宇宙中存在智能生命体,这解释了为何我们观测到了这样的一些物理理论而不是别的——这是我们在多元宇宙中作为观察者而存在的一种选择效应。这确实是对所有物理因果关系的不可变物理定律这一旧想法的激进修订。

  Purves等人的论文[72]以及Simon Saunders的评论(S. Saunders 2011,个人通信)认为,新利体育人们最终还是得承认,无论发生什么环境效应,实质的工作仍然是在微观层面发生。的确如此,但是正如我们刚才所解释的,就算是将这些行动置于完整的历史背景之下,行动本身依然无法决定结果。我相信上述对OConnor的回应以及本文中的其他观点足以回应这些评论——尽管实质的工作是在较低层级进行的,但是较高层级决定了要做什么。同时我们不需要理解最低层级就可以在较高层级做出预测——事实上,我们甚至不知道最低层级是什么。

  理解自上而下的作用对社会有重要意义。下面将介绍两个场景:医疗保健及教育——尤其是语言教学。在这两个场景中都有着关于是自上而下还是自下而上的持续争论,而这一争论对于社会福利有着重要影响。

  实际上,关于疾病以及如何治疗疾病,自下而上观点(还原主义 reductionist)和自上而下观点(整体主义 holistic)存在着根本竞争,观点的不同会带来治疗模式的不同。自下而上观点强调了微观系统对健康的决定性作用,而自上而下观点则强调心理调节可以如何影响身体健康。自下而上的观点,重点关注微观系统对健康的影响,这也导致对药物和手术的信任;强调治疗整体的方法是治好各个部分。而自上而下的观点,则认为心态对身体健康起着重要作用,因此将心理调节考虑进来。这类自上而下的影响有许多方式,比如一个重要的方式:许多免疫分子也具有调节神经的作用,可以通过大脑与免疫系统的相互作用,通过心理状态影响健康[73],而这正是心理影响健康的一种方式[74]。事实上,整体心态对身体健康至关重要。再比如婴儿的生存依赖于身边关爱婴儿的大人的存在;如果此类关爱被剥夺,他们将会遇到个体发育的问题,一系列的情绪问题,甚至营养不良[75]。在极端情况下,即使所有身体需求都得到了满足,但如果没有得到个体关注和关爱,婴儿也可能逐渐消瘦甚至最终死亡。当今的治疗范式应当将这些也纳入考虑(注释3)。另外,也有研究表明儿童在心脏手术后的生存率,受到他们是否有动物伴侣的影响[76]。在家庭环境中,这一生存率则与家庭沟通模式有关[77]。

  至于具体的心理健康问题,关于如何治疗心理问题的不同范式存在竞争,代表范式包括神经学、精神病学、临床心理学、心理疗法和认知行为疗法。神经学疗法基本是自下而上的,最后三者是自上而下的,而精神病学疗法则介于中间。也许在不同情况下,其中某种疗法会更加合适。而关键挑战正是去找到特定情况中,何种自下而上与自上而下的组合可以带来最好的结果[78]。

  教育中也有密切相关的问题,关于阅读与写作的教与学便是一个极好的例子。在自下而上的教学方法(从部分到整体)中,人们先关注语言的详细技术,例如语音和书写,而后再考虑语言的功能以及其交流作用,这一方法假设不同的部分就像不同的积木(building block)一样,最后会组成一个有意义的整体。在这个方法中,如果我们举一个极端的例子,孩子们首先脱离情境地练习,需要识别和发音许多字母-音素组合,例如ma、me、mi、ma、mu,而后是学习规则单词,甚至是一些无意义单词,如tok,zat,fot。孩子们只有完成了这类似的受限制的文本之后,才有机会接触有意义的文本。因此,语言的机制先独立于语言的本质目的来进行教学,而语言的本质目的,是为了创造和传达意义。至关重要的是,在这种方法中,对儿童进行的测试要求识别无意义的单词,而忽略了语言的核心功能。Dehaene在他的书中明确指出了这一点([79],第200页):在这个阶段,儿童的大脑试图将单词的大致形状直接与其意义进行匹配,而不是关注具体的字母及发音,这是一种虚假的阅读方式。

  但实际上,他错误定义了阅读,也因此误解了整个学习过程!在这里他希望部分起作用,而不是整体,并且将流利阅读者的终极目标、年幼学习者的学习方式定义为虚假的阅读。他所反对的,却恰恰是我们所希望孩子们学习的内容:从整体进行阅读,而不是从部分。而在各类阅读项目中的测试与这段引文所描述的一样——当人们依照惯常方式进行阅读时,反而会受到惩罚。

  反过来,我们也可以采用自上而下的方法,先向孩子们介绍符号可以传递意义,并向他们展示这在生活中是如何实现的,从而让他们沉浸在阅读文化中,与此同时,鼓励他们通过试验和逐步逼近(successive approximation)的方法来学习初级符号的正式约定用法,随着时间的推移逐渐转向更加惯常的符号用法。如此一来,阅读和写作能力会像婴儿学习口语那样,新利体育在一个有反馈的试错过程中不断提升,而过程中我们会始终关注语言的本质——语言是传达意义的方式[80-82]。Bloch[83]以儿童写作为例完美说明了这个过程是如何发生的。在这种情况下,整体性的理解与意义是教学过程的基本主题,而语法、句法等各种组成部分之类的细节是在整体的背景下去解决的。这种将阅读视作一个心理语言学(psycholinguistic)过程的理解,带来了一种阅读和写作教学中的整体语言方法(whole language approach)。

  这是一场在教育领域具有重大实践意义的持续的关键争论。以掌握音素作为第一步的自下而上的方法,被Adams [84]和Dehaene [79]等人大力支持。而持有整体观点者[85]则强烈支持自上而下的方法,他们认为儿童本能地要理解复杂的世界,以看似杂乱无章的学习过程,新利体育利用他们所有的知识和优势,整合他们自下而上和自上而下的理解,以便充分理解这种复杂性。其实这也是学徒制(apprenticeships)的本质,是在资源充足、有读写文化的家庭中成长的孩子所经历的情况——根据Cambourne的描述[86],在家发生的自然学习(natural learning)其条件是合适的,孩子们每天沉浸在故事阅读、使用写作语言玩耍的环境中,这一学习过程就像是渗透作用一样,他们会学到许多在小学初年级被忽略的基本印刷概念(concepts of print)。然而,一些家庭无法给孩子提供这样的学习经历,比如许多非洲地区的家庭[87],于是当最初接触到关注技术细节的阅读时,他们往往会手足无措。许多人往往对他们看作毫无意义的活动失去兴趣,这导致他们阅读能力较差。

  这与一个更大的话题密切关联:大脑如何自上而下地运作。大脑的精妙构造正是用于搜索含义[61]和预测可能发生的事情[37]的。这在视觉上尤为明显——视觉不仅仅是指从眼睛传入数据,由大脑解释这些数据。相反,在这个过程中大脑在不断地预测什么是应该出现的,并对于它每次可以获得并分析的有限的数据进行填补,实现它所期望看到的内容。这可以通过关于视觉错觉的分析[38, 88]来证明。因此,这里也发生了自上而下的解释过程——基于我们的预期,通过特定的神经元连接加以促进,最终调节和塑造了我们实际看到的内容。类似的过程也发生在听音乐时——我们的期望是音乐体验的关键特征[89, 90]。

  这也是我们阅读文本的关键——我们不是通过阅读一个个音素,将它们组装成单词,再将它们组装成短语等来阅读。相反,眼睛会略过单词,一次读取整个短语并填补实际上未实际阅读的部分。这可以通过错读分析和眼动研究[91-93]来证明。比如,您可以做一个简单的练习,亲身体验这个过程。请阅读一两次下面的句子,并在阅读过程中计算F出现的次数:

  这个句子中字母F出现了几次?5次?6次?7次?答案将在第7章结论部分的最后揭晓。

  我们阅读模糊文本的能力,源于从语境我们就可以推断单词的含义甚至是发音——语言是由单词关联驱动的而非个别单词驱动的[94]。因此,语境驱动着整个阅读过程,不是自下而上,而是一个心理语言学的猜谜游戏[95]。这种自上而下驱动的过程是大脑运作的基本特征,是阅读的核心。由于大脑成像研究尚未对这种整体阅读过程进行充分探究,我们还无法断言拼读教学法是否更好(注释4)[93]。

  译注:拼读教学法 phonics approach,一种阅读教学方法,通常强调单词的构成和拼写,通过教字母的名称、音素和如何组合成单词的基本规则,来帮助学生理解字母和单词之间的关系。在这一过程中,学生首先学习语音,然后逐渐学习如何将这些语音组合成单词,最终达到阅读的目的。

  显然,这里我们还没有对于这些有争议的主题进行充分深入的探讨。此处提及这两个例子,是为了证明本文的主题具有重要的现实意义。这表明在教育的其他方面,也应当严肃考虑这种自上而下的可能性,也许这就会带来教育的成功或者其他福利——它们并不是简单地被自下而上的方式决定的。

  本文的主题是,使得真正的复杂性得以涌现的,是自下而上和自上而下效应的相互作用。这种观点为我们提供了一个综合的视角,涉及到复杂性的层级结构中的不同层级,既包括各个学科内部的关系(从粒子物理学到核物理学,从核物理学到原子物理学等等,以及生物学中各个层级之间的关系),也包括不同学科之间的关系(从物理学到化学,从化学到生物学,从心理学到社会学等等)。显然,如本文所设想的那样,自上而下的因果作用在生理学层面[96]和视觉层面[38, 97]都真实存在。事实上,有大量数据支持这种观点,比如文化神经科学领域的大量研究[62, 98, 99, 100]。这也支持了Elder-Vass所提出的自上而下的因果在社会中发生的案例[42]。我们还可以证明,这类因果还在其他许多场景中存在,如微生物学[27]、流体流动[15]等,它在量子物理学中也发挥了重要作用,具体请参阅[31]。

  简而言之,在物理和物理化学过程所涵盖的自下而上的因果之外,还存在着其他形式的因果。随着复杂性层级的变高,这一点变得越来越清晰。尤其是当我们考虑人类思维和生理学方面的时候,这一点完全无法否认。货币的因果力、麦克斯韦电磁理论在工程领域——这些无法通过任何较低层级变量的粗粒化获得的较高层级变量,在某些情况下,其因果效应尤为明显。

  要想对于我们所处的这一世界具有完整的科学认识,我们必须首先认识到这一事实,否则我们就会忽略真实世界中重要的因果,对于事物的看法在因果方面也就不会完整。各种形式的因果,都依赖于自下而上和自上而下两种效应的相互作用,忽略了其中的任何一种,都无法理解真正的复杂系统。

  上一节的问题(在该句子中字母F出现了多少次?),正确答案是8。如果你像大多数人一样回答错误,那是因为你并非在逐字阅读句子——大脑会跳过一些单词并自行插值!在这段文本中,你也许甚至没有注意到of这个词,因为大脑认为这类单词是理所当然的,所以不会仔细去阅读(注释5)。这也是关于自上而下阅读方式的一个小实验。

  (1)在本刊中Butterfield[10]给出了具体发生过程的相关图表。(2)Penrose和Connes认为,将数学视作某种柏拉图式(Platonic sense)的存在,这个观点是最合理的[57, 58]。我同意这个观点[59],但是这肯定是一个在哲学上颇有争议的观点。

  (3)1970年代,Trudi Thomas博士在基斯卡马霍克(Keiskammahoek)的St Matthews医院推行了一项名为阳光病房(Sunshine Wards)的计划,为基斯凯地区(Ciskei)营养不良的孤儿提供情感接触,并提高了孩子们的生存率。这在她的书《Their Doctor Speaks》(1973年,私人出版)中有所描述。基于相同原理的新生儿疗法的当前版本,称为袋鼠护理(Kangaroo care),请参阅以获取有关其疗效的信息。

  (4)一些书籍(如[79])基于脑成像数据等神经科学证据得出了相反的结论。但是这些数据并没有很好地证明它们的结论,因为这些实验并未测试有意义阅读时大脑中正在发生的事情,而只涉及到无意义文本的阅读或阅读过程的某些组成部分。这并不足以从整体上对真正的阅读过程做出断言,因为在这个过程中读者会阅读和理解有意义的文本。

  跨尺度、跨层次的涌现是复杂系统研究的关键问题,生命起源和意识起源这两座仰之弥高的大山是其代表。而因果涌现理论、机器学习重整化技术、自指动力学等近年来新兴的理论与工具,有望破解复杂系统的涌现规律。同时,新兴的因果表示学习、量子因果等领域也将为因果涌现研究注入新鲜血液。集智俱乐部特别组织「因果涌现」系列读书会,深入研读相关文献,激发科研灵感。目前已经进行了两季,聚集了500+成员,积累了大量论文解读资料。欢迎感兴趣的朋友报名,加入因果涌现社区,并解锁对应录播权限。

  因果涌现读书会启动:连接因果、涌现与自指——跨尺度动力学与因果规律的探索因果、涌现与机器学习:因果涌现读书会第二季启动

  2022年11月30日,一个现象级应用程序诞生于互联网,这就是OpenAI开发的ChatGPT。从问答到写程序,从提取摘要到论文写作,ChatGPT展现出了多样化的通用智能。于是,微软、谷歌、百度、阿里、讯飞,互联网大佬们纷纷摩拳擦掌准备入场……但是,请先冷静一下…… 现在 all in 大语言模型是否真的合适?要知道,ChatGPT的背后其实就是深度学习+大数据+大模型,而这些要素早在5年前的AlphaGo时期就已经开始火热了。5年前没有抓住机遇,现在又凭什么可以搭上大语言模型这趟列车呢?集智俱乐部特别组织后 ChatGPT读书会,由北师大教授、集智俱乐部创始人张江老师联合肖达、李嫣然、崔鹏、侯月源、钟翰廷、卢燚等多位老师共同发起,旨在系统性地梳理ChatGPT技术,并发现其弱点与短板。本系列读书会线,欢迎报名交流。

Copyright © 2012-2023 新利体育 版权所有