正文第22节文 / [德]克劳斯.迈因策尔

    ，而这对于海底的工程是相当重要的，海底工程需要能区别爆炸矿石和岩石的声纳系统。台湾小说网  www.192.tw用于这种目的的网络构造中，输入层有60个单元，隐含层有1－24个单元以及两个输出单元，每一个代表将要进行区别的原型“矿石”或“岩石”图5.20。

    最初，一定的声纳回声是用频率分析器来处理的，它分解成60个不同的频率带。每一复盖间隔的值域在0和1之间。这些60个值是一个输入矢量的组分，输入矢量给予相应的输入单元。它们由隐含的单元进行变换，导致了两个输出单元之一的激活，这里的值也在0和1之间。因此在一个经过训练的很好调节了权重的网络中，一种矿石的回声导致输出信号1，0，而岩石的回声则具有输出信号0，1。

    为了训练此网络，我们必须向它输入矿石和岩石回声的样品。在每一种情况下，输出单元的实际值，都按照相应的输入，进行了测量并与预期值进行比较。其差异是错误信号，引发单元中的权重发生小的变化。用这种梯度下降的程序，网络的权重就缓慢地进行了调整。

    戈尔曼和西杰诺夫斯基的矿石－岩石网络是复杂系统对于ai的一种应用。当然，它并没有声称，此系统在模拟人的大脑来区分像“矿石”和“岩石”这样两个概念。但是，我们可以说，这种技术系统也具有某种内部表示，即表示了作为其隐含层中原型矢量的两个概念。在这种限制的意义上，人工系统是有“智能”的，因为它可以完成在人脑情况下用智能来进行评价的任务。人工网络并不局限于对概念进行二元区分。1986年，西杰诺夫斯基和罗森伯格设计了一种叫做alk的网络，它已经学会了如何阅读。它采取从英语教科书中形成的字符串，并将它们转化成音素串以输入到语音合成器中。惊人的事实并不是它像小孩似的口吃的声音，在通俗书中它已经被赞为辉煌的成功。alk的基本能力是对于若干拼音概念的内部表示。对于字母表中的每一字母，至少有一个音素指定给它。对于许多字母，其中有若干音素需要标记，这取决于词汇的上下文。

    西杰诺夫斯基和罗森伯格运用了3层馈向网络。它有一个输入层，一个中间隐含层和一个输出层。尽管后向传播与生物学大脑中“自然地”实现颇为不同，但与其他的解相比，它都表现为最快的学习程序。输入层注视课文的七字符窗口，例如，图5.21a中的短语“the－phone－is－”中的词“phone”。每一个七字符都被29个神经元相继地进行了分析，每一神经元代表了字母表中的一个字母，也包括括号和标点。因此，正好是每一具有29个元素的神经子系统的一个神经元被激活。

    输出层包括26个神经元，每一个神经元表示一个拼音组分。对于拼音的位置有6个组分，对于发音有8个组分，对于音高有3个组分，对于标点法有4个组分，对于重读和音节划分有5个组分。于是，从这4组组分中，每一声音都有4种特征。输出层有7x29＝203个神经元，与80个隐含层内部神经元联结起来，它又是与输出层的26个神经元相互联结的图5.21b。在这些层中的神经元是不联结的。输入和输出层的神经元也是不直接联结的。

    隐含层的神经元接收来自203个输入神经元的信号，但是只把26个信号送给输出层。由于内部神经元是阈值单元，具有阈值t1，，t8，输出是乘以特定权重的，这些积的和的大小决定了此神经元是否激活图5.21c。现实中，激活的发生是按照一个连续的“sigid曲线”，并非某种数字跃迁。栗子小说    m.lizi.tw

    最初，权重是随机固定的。因此，alk始于无意义的结结巴巴的发音。在学习阶段，alk运用了特殊的供小孩阅读的课文，其发单是人人皆知的。随机的声音与所希望的声音进行比较，权重由后向传播进行校正。令人瞩目的是，这种程序是一种自组织，而不是一种基于规则的发育程序。对于由实际输出来近似所希望的输出造成的权重改变，仅仅存在一种总体上的要求。对这种课文运行10遍以后，网络已经能够有理解地进行发音。经过50遍以后，就只有5的错误了。在这一阶段，对于未知的供小孩阅读的课文的发音，错误也只有22。

    今天，像alk这样的网络还必须用传统的冯诺意曼计算机来模拟，因为还没有直接的复杂网络的硬件。因此，每一神经元必须顺序进行计算。甚至在今天，自组织复杂网络的原理还主要是在软件上实现的，而不是在硬件上实现的。然而，我们将谈论“神经计算机”，因为硬件的实现只是一个未来的技术发展问题，有赖于诸如固体材料或光学程序这样的新技术，而不是原则性的理论局限问题。

    由神经网络进行的映射，看来是颇为成功的，用于财政、保险和股票交易预见中是有益的。原因在于，对于股票行情的短期预测以混沌时间系列为基础，如果预测的时间周期减少，那么它就变得越来越混沌。

    通常的统计程序仅仅在长期预测中才是成功的，它假定了股票的发展可以平稳进行，而又不丢失有关信息。好的统计程序的精确性在60－75之间。但是，短期的预测则是颇为有限的。传统的统计程序为了平稳股市的发展，必须要忽略短期预测的基本特性，即经常发生着的小的交换涨落。通常的统计程序中，相关计算因子必须明确给出。一个经过良好训练并适当设计的神经网络能够识别出关联因子，而毋需明确的编程。它能够以自组织的程序权衡输入数据并减少预测的错误。而且，它可以采取改变系统环境的条件，而不像计算机程序必须由编程者明确改变。为了设计一个用于股票预测的神经网络，必须对股市数据进行二进制编码使之作为输入数据。输入矢量的构成中，包括若干分矢量，它们代表着交换量，从昨天来的绝对变化，变化方向，从前天来的变化方向，以及与昨天相比的大于1的相关量。如果输入矢量具有固定的长度，例如40个单元，那么分矢量的长度可以有些不同，依赖于它们所希望的相关。该系统可以有两个输出单元。左边单元的激活标志了股票值的减少，而右边单元的激活则标志了增加。

    在学习阶段，网络中输入的是一定时期实际上的每天的交换率，例如从1989年2月9日至1989年4月18日。以这种学习数据为基础，该网络对于后面19天的发展进行预测。预测结果与实际上的曲线进行比较，以测量该系统的精确性。已经用后向传播方法对于几个多层结构进行了考察。它们以自组织方式发展起来对于预测特定的总体启发性。例如，如果一次预测接近该日期以后某天的实际值，那么错误就是相对小的。这种拇指规则的启发方式，在于这一事实：行情趋势的变化比起它保持不变来是更为不可能的。图5.22a，b示意了，预测曲线和对于银行rzbank、公司rcedes的实际股票行情曲线－。

    显然，后向传播的馈向网络在技术上非常有趣，尽管它们看来与生物大脑中的信息处理没有多少相似性。在4.2节中，我们已经分析了具有反馈图4.8b和霍布类型学习图4.9a的霍普菲尔德系统，它显得也是生物大脑的工作方式。栗子小说    m.lizi.tw在均匀的布尔神经元网络的情形，神经元的两种状态可以与处于外磁场中的电子自旋的两个可能值联系起来。一个霍普菲尔德模型是一个动力学系统，与金属退火过程类比，将它看作是一种能量函数。由于它是非增的单调函数，系统进入局部能量极小值，相应于局部的稳定稳恒态不动吸引子。

    因此，霍普菲尔德系统的动力学演化可以相应于精神认识。例如，一个代表字母“a”的始态噪声图像向代表正确图像的终态演化，它用若干个例子来对系统进行了训练图4.9b。物理解释使用了平衡热力学的相变。正确的模式与不动点或平衡终态相联系。一个更灵活的推广是波耳兹曼机，它具有非确定论处理器元的随机网络构造，以及分布的知识表示，数学上相应于一个能量函数图4.11b。

    关于弛豫的一般思想是，一个网络收敛到以局域相互作用为基础的或多或少总体平衡状态。通过反复地修订局部的联接例如在霍普菲尔德系统通过霍布学习策略，网络作为一个整体终于弛豫地进入了稳定的、优化的状态。我们可以说，局域相互作用导致了协同寻求，它不是受指导的，而是自组织的。一些网络对于精神类型的活动运用了协同寻求策略，例如，对于寻找可能的假设。设想竞争假说的一定范围由神经单元来表示，它们可以激活或抑制自己。于是该系统就离开了不太可能的假设，而奔向更可能的假设。

    1986年，麦卡洛克和拉梅尔哈德把这种认知解释运用于模拟两可图的识别。两可图是在格式塔心理学中为人们所熟知的问题。图5.23a示意了一个协同寻求的网络，模拟识别尼克尔立方体两种可能的取向之一。每一单元就是一种涉及尼克尔立方体的一个顶点的假设。缩写是b黑、f前、l左、r右。u上、l下。假设网络由两个联接的子网络构成，每一子网络相应于两种可能解释之一。

    不相容假设是负的联接，一致性假设是正的联接。权重的分配使得2个负的输入与3个正的输入格均衡。每一单元都具有3个正的相邻联接和2个竞争的负的联接。每一单元都接受来自激发的一个正的输入。要寻求的假设子网络是最适合于输入的网络。微小的涨落观察者特定视野的某个小的细节可以决定哪一种长期的取向被观察到。

    为使网络的动力学形象地表示出来，假定所有的单元都是关闭的。然后，一个单元接收了一个随机的正值输入。网络将向一个子网络的所有单元都被激活而所有其他网络的单元都被关闭的状态变化。在认知解释中，我们可以说，此系统已经弛豫地进入了尼克尔立方体两可图左面和右面的两种解释之一。

    图5.23b示意了3种不同的演化模式，它们敏感地依赖于不同的起初条件。环路的大小表明每一单元的激活程度。在第3种变化中，达到的是一种决非处在平衡态中的未确定的终态。显然，这种网络的构造原理是协同计算、分布表示和弛豫程序，这是人们在复杂系统动力学中所熟知的。

    过去已经提出来许多人工神经网络的设计。它们是受到不同的原理如物理学、化学、生物学、生理学的启发，有时只是出于技术的目的。复杂系统探究方式的共同原理是什么在前面的章节中，协同学引进了作为处理非线性作用复杂系统的跨学科方法论。对于推动从许多科学学科中确立的共同原理来建立特殊复杂系统的模型，协同学看来是一种成功的自上而下的策略。其主要思想是：复杂系统整体状态的形成可以解释为，处于远离热平衡的学习策略中系统元素的宏观的相互作用的演化。整体的有序状态解释为相变的吸引子不动点、周期、准周期或混沌。

    例如，模式识别被解释为类似于应用在物理学、化学和生物学中的演化方程的相变。我们获得了一种跨学科的研究纲领，它使我们把神经计算的自组织解释为由共同原理支配的物理的、化学的和神经生物学的演化的自然结果。正如在模式形成的情形下，一种特定的识别模式一张原型的脸用序参量描述为一组所属特征的集合。

    一旦其中属于该序参量的部分特征给定了例如一张脸的一部分，序参量将完成所有的其他特征，所以整个系统是作为联想记忆发生作用的例如给出脸的一部分使脸面根据贮存的原型脸重建出来。按照哈肯的役使原理，识别出来的模式的特征相应于模式生成期间受役使的子系统图5.24。

    如果将作为原型学习的一小部分脸部提供给一台协同计算机，那么它就能够用编码了的姓名来完成整张脸图5.24b。不同程度的模糊图像序列相应于协同计算机中状态的相变。

    当一个不完整的模式提供给神经元，在不同神经元状态每一状态都相应于一个特定的原型模式之间的竞争就开始了。这种竞争中取胜的是相应于原型模式的神经元系统的整体状态，它对所提供检验的模式有最大的相似性。与对于模式形成有效的动力学完全相似，当一个检验的模式提供给协同计算机时，它将把检验的模式从起始状态t＝0拉向一个特定的终态，相应于原型模式之一。

    检验模式的演化，可以用势场中具有一定位置矢量的粒子的阻尼运动来说明。图5.24c示意了一个这种二维势场的例子。这两个原型相应于两个低谷。如果提供了一个模式，它的特征不可能精确地表明与原型的特征一致，那么该粒子的位置就处于势场的低谷之外。显然，识别是一种对称破缺，这已在图4.20a中的一维例子中进行了说明。

    在协同学系统中，势场地形的形状可以由调整序参量来改变。由于协同学系统是开放的，控制参量可以代表能量、物质、信息或其他来自系统环境刺激的输入。当控制参量低于某个临界值，地形可以具有一个稳定的位置如图4.20a中的用虚线标出的一个低谷。在涨落引起的每一激发以后，序参量弛豫地向其静止态演化。当控制参量超过了一定的临界值时，先前稳定的状态就变得不稳定了而被图4.20a中两个低谷的两个稳定状态所取代。

    协同计算机的学习程序相应于势场地形的构造。势强度用地形形状表示，示意神经联接的突触力。协同学探究方式的一个优点在于，标志着一个模式的数量巨大的微观细节是用一个宏观序参量来确定的。因此，协同计算机运用了典型的复杂性约化方法，这种方法已经应用在自然进化的协同学模型中对照3.3节。

    序参量方程允许一种新的非霍布的学习，即一种最小化突触数量的策略。与旋晶类型的神经计算机例如霍普菲尔德系统相比较，神经元不是阈值元素，而是实施简单的乘法和加法。但是，旋晶类型的神经计算机与协同学计算机的基本区别在于：旋晶类型的复杂系统是物理学上的封闭系统。因此，它们的模式生成是由保守自组织推动的，没有任何的能量、物质或信息从外部输入。由保守自组织形成的典型模式是冬天窗户上的“死的”冰花，它们是在低能低温的平衡态冻结起来的。保守自组织的相变可以完全用波耳兹曼的平衡热力学原理来解释。

    在3.3节中，我们已经解释了活系统的模式生成。它只有在远离热平衡时输入能量、物质或信息，才是可能的。这种自组织叫做“耗散”自组织普里戈金或“协同”自组织。然而，它们甚至也是可以在物理学、化学进化中发现的。因此，作为活系统的人脑敏感地依赖于来自外部世界的涨落，它将为协同学框架中的新计算机技术提供“蓝图”或模型。自旋玻璃类型的神经计算机对于特定的技术目的可以是实用的、成功的。但是，由于它们是物理上封闭的系统，在原则上不同于如人脑这样的活系统中发生的东西。

    协同计算机的模式识别过程自发地产生出对于平移、旋转和标度的不变性。这些识别特征相应于现实的情形。例如，脸部并非总是如同学习阶段给出的那样，而是它们可以平移、旋转、缩小和放大、靠近和置远。协同计算机的一个出色的应用，是振荡的识别例如两可图和感知滞后现象。图5.25a示意了一个人们熟悉的滞后现象的例子。当人们的注视力开始从图的左边移向右边，一张男人的脸将在大约6幅模式以后变成一个女孩脸。当人们从相反的方向来进行，从感知到女孩变到一张男人的脸只有在接近左端时才发生。

    图5.25b示意了协同计算机在特征序参量的时间演化中的感知过程。间断线指的是解释“女孩”，实线指的是感知“脸部”。第一幅图示意了，从男人脸的感知向女孩的感知的转移，第二幅图示意了从女孩的感知向男人脸的感知的转移。

    也许可以提出反对意见，认为至今协同计算机仍然必须用传统的串行计算机来模拟。协同计算机的原理仅仅是在软件领域中实现了，而不是在机器的硬件中得到了实现。但是协同学及其跨学科应用将导致它的材料和技术上的实现。如同激光是一个为人们所熟悉的协同学模型对照2.4节，它可能在协同学原理的光学计算机的构造中起着根本性作用。在激光中，不同的模出现依赖于激光阈值的临界值。它们可以由它们的光子数来标志。在微观水平上，光子数目的变化率是用非线性演化方程来描述的，依赖于模的获得、丢失和饱和。在宏观水平上，序参量相应于标志若干种光波迹的场幅度图2.28a，b。

    这是主张一种3层的构造，数据的输入层可以用全息图映射到激光上。激光及其序参量是中间层。它利用它的模，通过自组织起着决策装置的作用。在役使原理意义上的生存的模，激发起新的特征集合。这种水平被设想为输出层。协同计算机的激光构造当然必须得到实验的证实和改进。一台协同计算机将是一种真正的远离热平衡的耗散系统。

    显然，复杂动力学系统对于模拟认知行为和技术系统也很有用。人脑可以作为非线性复杂系统来建模，其动力学可以受到不动点、周期或准周期吸引子，甚至是混沌吸引子的支配。例如，实验上已经证明，混沌是一种有效的大脑再置的机制。在对兔子的嗅觉球进行了研究以后，人们对于种种气味的识别已经用神经网络趋向环状渐进状态的滞后现象进行了建模。混沌态在发散、消除先前的气味记忆时就出现了。在发散期间，特定气味作为输入推动了系统趋向相应于该气味的极限环。

    混沌态的技术应用是颇为有趣的，因为混沌系统能够产生信息。人们熟知的是，混沌系统敏感地依赖于其起始条件。因此，在动力学演化过程中，两条轨迹可以在一定时间惊人地分开，甚至它们的起始条件仅仅有微小差别时也是如此。由于任何观测都只能以有限精度来实现，因此就可能存在

    ...

（快捷键 ←）上一章本书目录下一章（快捷键 →）

正文 第22节 文 / [德]克劳斯.迈因策尔

正文第22节文 / [德]克劳斯.迈因策尔