正文第14节文 / [德]克劳斯.迈因策尔

    出线和联结的权重这里采用二进制，空心圆圈为零，实心圆圈为1。栗子网  www.lizi.tw

    如果一般地，输入矢量xj与输出矢量yj通过线性变换从yj＝ewijxj联结起来，其中wij是贮存的权重矢量，于是我们就获得了一种简单的线性联想子。这种联想网络，能够对于代表某种范畴例子的矢量进行分类，这种范畴是由所贮存的原型矢量实现的。对于动物的生存，这个任务实际上是关键性的。在现实中，种种或多或少的类似的感觉例如怀着敌意的动物必须进行鉴别并归于某一范畴。

    某一种联想网络可以进行矢量完善或矢量校正。所谓的自动联想网络可以产生一种输出，使之在仅仅给出贮存矢量的一部分作为输入时，尽量地接近预先贮存的矢量。在现实中有噪声的例如一个人的图像，必须根据所贮存的图像来加以完善。一个霍布类型的规则，可以通过加强在神经元之间的相关活性程度的关联权重来完成这一任务。

    一种增加这样的复杂网络能力的方法是，对于输出单元引入非线性的阈值。线性的联想网络例如图4.8a具有前向反馈拓扑，信息从输入单元流向输出单元。霍布类型的学习程序认为，神经单元的局域的相互作用通过自组织而收敛到正确的总输出。网络中的循环信息意味着某种反馈构造。在图4.8b中，每一单元都接受从外部的输入，同时也接受网络中内部单元的反馈。权重由水平线和垂直线的交接点来表示。

    显然，图4.8b模型的复杂系统是一种非线性的反馈网络，它允许范围广泛的可能的动力学。约翰霍普菲尔德讨论了一个著名的例子1982。他的非线性反馈网络的类型具有收敛解的动力学。对于它们的兴趣不仅仅是由于对大脑的建模，而且是由于正如我们将在关于人工智能的第6章见到的发展出新的网络技术。对于我们的复杂系统探究方式，值得注意的是，霍普菲尔德是一位物理学家，他把运用于自旋玻璃体物理学的数学方程运用到了神经网络上。

    铁磁体的动力学是大家熟知的一个热平衡态的保守自组织的例子。在伊辛模型中，铁磁体由自旋体点阵构成，每一方向都可以是向上或向下的。每一自旋体都可以与其近邻发生相互作用。在最低能量状态中，所有的自旋体都以相同方向排列。在高温下，自族体的方向是随机的，因为热能使得涨落大于相互作用能。如果减低温度，自旋体就变得按照相同方向排列。显然，自族体的行为类似于磁体参见2.4节。在动力学上，它表现为寻求作为某个吸引子状态的最近的局域能量极小值图4.9a。但是，只有所有的相互作用是吸引作用，才有在相同方向上的所有自旋体点的单个能量极小值。在吸引相互作用和排斥相互作用混合的情形下，复杂系统如自旋玻璃体可以具有许多局域能量极小值。

    霍普菲尔德提出，神经系统的功能是在态空间发展起来的一些局域稳定点。态空间的其他的点流向作为系统吸引子的稳定点。由于对稳定点的偏离的消失，这种动力学是一种自校正程序。另一方面，稳定点适当地将一个并不完善的始态矢量丢失的部分弥补起来。因此，这种动力学可以用来完善有噪声的输入。

    霍普菲尔德的模型是相当简单的，包括有阈值的逻辑单元。加和的突触输入并将此加和与阈值进行比较。如果此加和处于阈值或阈值之上，就产生出1，否则就产生出0。除了自联结之外，神经元相互联结时，就认为该网络恢复了。数学上，相应的联结矩阵的主对角线为零。霍普菲尔德提出，运用霍布类型的学习规则来构建联结矩阵元。栗子网  www.lizi.tw复杂系统的演化如自旋玻璃体伊辛模型遵循非线性的反馈动力学。能量差异项逐渐减少，直到它到达某一个可能是局域的极小值。

    字符特征识别问题是人们熟悉的一个简单应用。此复杂的网络由2维格子的相互作用的布尔变量来代表。一个模式例如字母a可以被联想到格子中，其中黑点代表激活态变量其值为1，空点代表其值为零的变量。这里假定，字母作为所希望的动力系统状态被联想到吸引子不动点。我们可以想像，通过多次看见正确的字母，人的大脑中贮存了正确的字母形状。如果某个不完善的、部分受损的字母显示给该系统，它就应该能够重新构造出正确的形状这是以前已经学会的图4.9b。

    因此，模式识别就意味着自组织的模式演化。这种过程指向某些吸引子，作为所希望的系统状态。我们回忆一下，一个吸引子就是从一定条件出发，系统将向其演化的一种状态。吸引盆由起始条件来定义，起始条件推动着在吸引子方向的系统的轨迹。正如我们在前面的章节中已看见的，一个吸引子可以是包含不动点的或稳定态的唯一状态，如同在霍普菲尔德网络和自旋玻璃体系统的例子。但是，一个周期相继的状态“极限环”或几种形式的混沌吸引子在耗散系统中也是可能的。因此，霍普菲尔德网络对于以复杂系统的吸引子来建立神经状态的模型，仅仅是初级的、简化的方式。

    霍普菲尔德注意了自旋玻璃体中的局域能量极小值与联想的大脑原型之间的类似性。在自旋玻璃体的形式网络中，吸引子可以被设计为原型矢量。在图4.10a中，霍普菲尔德系统的态空间用能量地形图形象地表示出来，这里利用了它与自旅玻璃热力学的类似性。网络上所有可能的状态都由平面上的点来代表。表面的高度表示相应的网络状态的能量。

    图4.10b中的相图显示，轨迹从不同的起始点向稳定的局域最小值的收敛。平面上的每一点就是该网络的一种状态。能量地形图具有霍普菲尔德动力学轨迹的吸引盆。稳定点“吸引子”处于盆的底部。在模式识别的例子中，原型字母与稳定点相关联。因此，模式完善的过程是一种反省形式，在形式上可与保守自组织的退火过程相比较。在此物理学例子中，终态是自旋玻璃体、磁化的铁磁体或冻结的晶体的有序结构。

    一般地说，霍普菲尔德网络仅仅收敛到低能态的局域最小值。在某些应用中，局域最小值是与特定的贮存项目相联系的，也许是不必要到达某种全局最小值的。不过，在许多情况下是需要全局最小值的。这种问题的一个解，是由个体单元的随机运动而不是确定论运动来提供的。

    图4.11a中，通过一个沿着能量地形曲线运动的小球很可能最终是落入最深的最小值，从而显示了问题的求解。从一定的起始状态出发，小球将向能量最小值或曲线的底部运动。如果能量地形是由多个靠得很近的极小值标志的，结果就取决于最初的起始条件。如何来阻止网络粘在某个局域极小值上呢这种想法是以一定的能量增量来动摇能量地形，该增量是逃离局域极小值b低谷而进入全局极小值a所需要的。

    于是，在力学上，小球从b进入a比从a进入b的可能性要大。平均来看，小球应该终止于低谷a。在热力学语言中，动摇地形的动能相应于系统温度的增加。在适当高的温度情况下，在低谷之间的转移几率不再是可忽略的。在热平衡态，占有不同凹地的几率仅仅取决于它们的深度。

    实际上，模拟退火的方法是人们所熟悉的，并用于全局优化上。栗子网  www.lizi.tw正如我们已经提到的，退火是加热一种材料例如金属或玻璃到高温、然后逐步地减低温度的过程。但是，该材料将仅仅终止于其全局能量最低点，如果退火过程进行得足够慢的话。例如，金属的突然冷却将留下仅仅有局域极小值的材料，处于易脆状态。模拟退火使得有可能逃离局域极小值，跳跃到较高的能量状态。

    在气体热力学中，气体由其相转移的几率来描述。波耳兹曼对处在均匀温度分布的气体，推导出来气体状态的几率分布。欣顿、西杰诺夫斯基等人认为，这种分布可以运用于描述神经相互作用。在这种模型的情形，加进系统中的低温项被解释为小噪声项。它是神经与气体中分子的随机热运动的类似物。

    这种形式上的等价，是上述网络被称为“波耳兹曼机”的原因。但是，这里并非是物理主义，并非打算把神经相互作用还原为气体分子相互作用。在波耳兹曼的形式表达式中，可以证明，冷却得充分慢时波耳兹曼机可保证找到所希望的全局极小值。显然，具有模拟退火动力学的神经网络，是能够通过搜索模式的态空间给出全局最小值的。

    一种按照这种动力学的可能的学习规则，是与网络及其环境之间的几率相匹配的。该网络的所有可能状态在热平衡时都是可能的，具有波耳兹曼分布的相对几率。如网络中状态的几率与环境状态的几率相同，那么网络便得到一个适当的环境模型。因此，学习规则必须能够调整波耳兹曼机中的权重，以便减少网络模型与环境之间的差距。

    最初，学习规则让系统自由地运行。每一单元的状态几率可以估计出来。然后，输入和输出单元就被强制或被迫取得适当的值。其次，单元的几率值是估计出来的。局域的权重变化正比于与该权重耦合的单元的几率的差。

    形式上，权重的变化规则要求

    wij＝e＜sisj＞强制＜sisj＞自由

    式中e是比例常数“学习速率”，si是第i个单元的二进制单元，sisj在网络达到平衡后的时间的平均值是＜sisj＞。在强制的条件下，输入和输出单元都固定在其正确值上。在自由条件下，这些单元都不是固定不变的。于是，学习规则并未受到指示。如果输入在自由的条件下是固定不变的，学习规则就是受指导的。

    在图4.11b中，波耳兹曼机的网络中的单元采取了二进制值，它们之间的联结是相互的。连接的权重可以进行训练，也就是把模式提供给存在着和不存在输出模式的输入单元，并应用波耳兹曼学习现则。在学习过程中，网络中的所有的权重都发生了变化。并不直接接受外界信息的隐含单元，可以使得该网络产生出在输入模式和输出模式之间的复杂的联想。因此，在其中间层有隐含单元的波耳兹曼机具有内部的对于环境的表示，而这对于仅仅具有可见输入和输出单元的网络则是不可能的。

    从神经生理学的观点看，由“教师”指导的学习在自然界看来是颇为不现实的。动物对感觉输入分析中进行的特征提取或范畴划分必定是自组织的。在输入矢量中出现得越是频繁的特征，就越是可能归属于一定的范畴。网络的输出必须学会使相应的原型矢量收敛为吸引子。

    如何设计一个网络使得在没有外部教师指导的情况下产生出分类标准呢一些作者提出，这种自组织取决于多层系统中的非线性相互作用和有选择地强化联结。这种学习程序是在选择和竞争的达尔文过程中组织起来的。

    图4.12中，所设计的竞争学习系统的多层构造，可产生出诸如分类和范畴划分这样的突出的认知任务。活性单元由实心点来代表，而惰性单元则由空心点来代表。输入层与第2层的每一元素的联结是激发的。第2层可以划分为若干组，每组中每一元素都抑制所有的其他元素。同一组中的元素处于相互竞争之中，以对输入模式作出反响。按照拉梅尔哈德和奇普塞的法则，在同一组中，一个单元只有在它能够赢得与其他单元的竞争时才是能够学习的。学习就意味着活性联结的增加和惰性联结的减少。

    一个简单的分类任务是小孩的词汇认知。显然，两个字母的词aa，ab，ba和bb可以划分成几个范畴，例如，以a开头的词汇集合aa，ab或以b开头的集合ba，bb，抑或是结束于a的aa，ba或结束于b的ab，bb。在一个计算机辅助的实验中，双字词代表一个多层的网络，其中一层的竞争单元以两单元一组组织起来。该系统能够检测出字母的位置。其中的一个单元自发地作为起始字母a的检测器而起作用，而另一个则检验b作为起始字母。

    在进一步的实验中，增加了字母数，改变了网络结构。尽管这些实验看来仅仅是说明了有限的能力，它们至少是原则上体现了无指导的神经系统中的认知行为的形成。它们已经开始了某种有趣的研究，在复杂系统的框架中把神经生理学与认知科学联系起来，4.4节中将更详细地对此加以讨论。另一种通过竞争学习进行的自组织认知系统的研究方式，是托伊沃科亨仑提出的。他是一位物理学家，也对于联想记忆进行了生理学的研究。他的神经系统的数学建模在人工智能的工程应用中已显示出重要性参见第5章。科亨仑的思想是通过自组织特征的映射来给大脑建模，这种想法源于自动化和生理学上已经确立了的事实。大脑中的大多数神经网络是二维的层状处理单元，它们可以是细胞或细胞组。这些单元是通过侧面的反馈而相互联结的。例如，在新皮质中，每一个主要细胞大约有10000个相互联结。

    对于神经元与其近邻的突触耦合，只要神经元之间的距离小于一定的临界值，这种耦合就是激活的。神经元之间的距离大于此临界值则是抑制的。而距离更大一些时，耦合又是微弱激活的。侧面相互作用的程度在数学建模时使用的曲线，其形状类似于墨西哥帽子图4.13a。

    显然，侧面耦合的互相影响倾向于在空间结合成群。图4.13b示意了一个二维成群的例子，它是由一个21x21个处理单元的方格来模拟的。这种成群现象“活性泡”取决于正反馈或负反馈的程度，它们可能受到神经网络中的化学效应的影响。在神经的实在中，“活性泡”并不具备计算机辅助模拟的规则形式。图4.13c示意了浣熊的脑皮层中活性的分布，它并非是一个形状规则的形象，而是相当混乱的图像。

    然而，成群现象在大脑的自组织过程中可以是有用的。虽然起初神经网络的活性是均匀分布的，但根据自组织学习过程我们可以观察到神经区域的逐步的专业化。在提供了输入模式以后，具有最大活性的神经元及其邻居被选用来进行学习。神经权重的变化，落在以最大活性神经元为中心的一定半径中的环状邻域中。这种学习规则可以用来检测和划分输人的图形或说话模式数据的相似性。

    在形式上，科亨仑考虑了从输入信号u的空间v到二维映射a上的非线性投影p。图4.14说明了学习的步骤：输入值u选定一个中心s。在s的邻域中，所有的神经元都在u的方向上转移其权重ws。转移的程度随着与中心s的距离的增加而减少，这里用不同的灰度来表示。

    映射通过自组织收敛于某个具有不同活性区域的平衡态。投影应该将输入信号的规则性映射到神经映射上。因此，p在数学上被称为拓扑不变映射。实际上，由感觉输入信号规则性所表示的大脑环境的结构，应该被投影到大脑的神经映射上：大脑应该获得适当的关于世界的模型。

    大脑通过自组织映射进行建模的现实性如何神经区域的数值的变化，取决于物种生存所感受到的感觉刺激的重要性。在神经区域中，有一些中心，它们能够以比环境更大的精确性对刺激进行分析并将其再现出来。例如，在哺乳动物的眼睛中，对于视觉信息的精细分析是由“小凹”进行的，小凹是一个沿视网膜光轴的非常小的区域，其中有非常高密度的光敏接受子。因此，信号的分解主要在神经区域的这种中心进行，要比在周围的区域强得多。类似的不成比例的表象，也可以在体感系统和原动皮层中观察到。手对于人的生存的重要性表现在体感和原动皮层占有相当大的区域，比代表体表的区域要大。

    与这些结果相反，猫、狗和猿的听觉皮层并不将外部世界的频率投影到特定的中心。蝙蝠具有特殊的定向系统，这对于它的生存是必要的，这是一个例外。蝙蝠能够发出许多种不同的超声频率，并通过这些信号的反射来测定物体的距离和大小。蝙蝠相对于其他物体的速度可以用超声波反射中的多普勒效应来测定。甚至是细微的昆虫也能够被这种灵敏的系统检测出来。

    蝙蝠的特性，能够用其听觉皮层上的自组织映射在实验上确证。图4.15a中将蝙蝠脑中的听觉皮层示意在矩形图中。图4.15b中把该矩形图放大了，示意出听觉皮层中最佳频率分布。一维频率谱不断地单调地从听觉皮层的后区提供给前区。引起神经元最大激活的频率称作那个神经元的最佳频率。划线区域是初级听觉皮层。图4.15c显示了图4.15a中斜线区域中的最佳频率分布。绝大多数测量点都集中在超声回波频率的周围。前一后区中一半以上用来分析超声回波的多普勒效应。十分显著的是，用自组织映射进行的计算机辅助模拟中，产生出如图4.15c所示的听觉皮层的实际表象。

    灵长目动物的脑由许多区域构成，其中有若干神经网络拓扑。例如，视网膜在个体发生的早期已经发育起来。它的神经拓扑有5个**层：光感受器，水平细胞，极性细胞，无长突神经细胞，视网神经节细胞。人的光感受层大约有120x105个感受细胞。视网输出，由所有的神经节细胞的脉冲速率的空时模式来代表，沿着光神经传向丘脑。对于人，大约有1.2x106个神经节。因此，视网膜的确是一个复杂系统。然而，人们还没有完全理解大于200x106个视网神经元的复杂性。大脑皮层是系统发育上最年青的大脑区域。大脑皮层在大脑中的百分数在进化中不断地增加。鱼那样的低等脊椎动物并没有进化起来大脑皮层。大脑皮层在爬行动物和鸟类中只占小部分，到狗、猫，直到猿和人，它就越来越多。在灵长目动物中，大脑皮层分化成了不同的多层神经网络拓扑的区域，例如视觉、感觉、原动和联想皮层。小脑由小脑皮层构成，其中有许多具有特定感觉原动功能的多层亚区域。

    大脑系统的多样性被描述为一个密集的神经元集合，其中具有特殊的网络拓扑，通过许多神经而相互通信，神经由以千计的轴突构成。与数字计算机有**的中心处理、记忆和贮

    ...

（快捷键 ←）上一章本书目录下一章（快捷键 →）

正文 第14节 文 / [德]克劳斯.迈因策尔

正文第14节文 / [德]克劳斯.迈因策尔