📄 wiener03.html
字号:
<P ALIGN="JUSTIFY"> 我们已经指出,一个有效的行为必须通过某种反馈过程来取得信息,从而了解其目的是否已经达到。最简单的反馈就是处理演绩成败的总情况的反馈,例如我们是否真的抓住了我们想要抓起来的东西,又如一支先头部队是否在指定时间到达了指定地点。但是,还存在着许多别的形式的、具有比较复杂性质的反馈。</P>
<P ALIGN="JUSTIFY"> 我们常常有必要知道行为的总策略,例如战略,是否已经证实为成功的。当我们教导动物通过迷宫去寻找食物或避免电击时它必须能够把通过迷宫的总计划之成功与否全面地作出记录,还得有能力修改这个计划以便有效地通过迷宫。这种形式的学习肯定是一种反馈,但它是较高级的反馈,亦即它是策略性的反馈,而不是简单动作的反馈。就B.罗素所讲的“逻辑类型”而言,这种反馈是不同于那些比较基本的反馈的。</P>
<P ALIGN="JUSTIFY"> 这种行为模式也可以在机器中找到。晚近在电话接线技术方面的革新对于人的适应能力提供了一个有趣的机械方面的类比。在整个电话工业中,自动交换机很快地就胜过了手工操作的交换机,人们似乎还这样地认为,现在的自动接线装置就是一个近乎完善的东西了。然而,稍微想一想,人们就可以明白,现在的接线过程是非常浪费设备的。我真正想用电话联系的人们是有限的,今天和我通话的大部分人就是昨天和我通话的那些人,日复一日,周复一周,都是如此。我就是使用电话设备来和这批人建立通讯联系的。现在,由于普遍采用了目前的接线技术,以致接通每天同我们打四次、五次电话的人的接线过程和接通那些也许过去从未和我们通话的人的接线过程无法区别开来。从电话线负荷应当均等的角度看,我们可见利用的电话设备,不是对经常的传呼户太少,就是对不经常的传呼户太多,这种情况使我想起了霍尔墨期的《单马车》这首诗篇来。你们大概都还记得,这辆古老的马车,在使用了一百年之后,表明了它自身的设计是如此之精致,以致无论是车轮、车顶、车杠或座位,都没有显示出任何不经济的、其磨损程度超过了其他部分的地方。实在说,“单马车”乃是尖端技术的代表,它不单是一个幽默的幻想。要是车箍比辐条或是挡泥板出车杠耐久些,那这些耐久的部件就会使若干经济价值浪费掉了。这些经济价值或者可以节省下来而不损害整个车辆的耐久性,或者可以平均分配给全车使它更加耐久些。的确,任何不具“单马车”这种性质的结构都是浪费地设计出来的.</P>
<P ALIGN="JUSTIFY"> 这也就是说,就最经济地服务而言,把我跟某甲的联系过程(此人我一天跟他打三次电话)和我跟某乙的联系过程(此人在我的电话本上是不受注意的一户)等量齐观,不是理想。假如稍微多分配一些我跟某甲直接联系的手段,那我即使花费加倍的等候时间来和某乙接通也是完全可以补偿过来的。如果这样,那我们就可以不费多少钱而设计出一部仪器来记录我过去的谈话,按照我过去使用线路的额数重新分配给我一个服务度,那它就会为我服务较好,或花钱较少,或二者兼而有之。荷兰菲力普电灯公司已经成功地做到这一点。借助罗素所讲的“高级逻辑类型”的反馈,它的服务质量已经得到了改善。这种设备具有较多的变化,较大的适应性,工作起来比常见的设备更为有效,因为常见的设备都具有熵趋势,几率大的压倒了几率小的。</P>
<P ALIGN="JUSTIFY"> 重讲一下:反馈就是一种把系统的过去演绩再插进它里面去以控制这个系统的方法。如果这些结果仅仅用作鉴定和调节该系统的数据,那就是控制工程师所用的简单的反馈。但是,如果说明演绩情况的信息在送回之后能够用来改变操作的一般方法和演绩的模式时,那我们就有一个完全可以称之为学习的过程了。</P>
<P ALIGN="JUSTIFY"> 另外一个关于学习过程的例子见于预测机的设计工作中。在第二次世界大战初期,防空火力的效率较差,以致有必要去发明一种仪器,要求它能够跟踪飞机的位置,计算出飞机的距离,确定炮弹在击中它之前在空中所经历的时间,还要算出在该时间终了时飞机将要达到的位置。如果飞机能够采取完全随意的逃避动作,拥我们的任何技巧都无法掌握我们所不知道的飞机在高射炮开始射击和炮弹到达目标附近这段时间内的运动。但是,在许多情况下,驾驶员不是或者不能采取随意逃避动作的。他受到这一事实的限制:如果他快速转弯,离心力会使他失去知觉;他还受制于另一事实:飞机的控制机构和飞行员所受的驾驶训练实际上迫使他遵守某些有规律的控制习惯,甚至在其逃避动作中也不例外。这些规律性不是绝对的,而是多次实践所表现出来的统计优势。对于不同的飞行员讲来也许是不同的,对于不同的飞机讲来则肯定是不同的。让我们记住:在追踪快得象飞机这样的目标时,计算者是没有时间拿出仪器来计算飞机飞向何处的。全部计算程序都必须编进高射炮本身的控制系统中。这个计算程序必须包括我们对一定类型的飞机在不同飞行条件下的过去统计经验的数据在内。现在所用的高射炮都附有一个校准仪器,仪器或者使用这类固定数据,或者对这些有限个的固定数据作选择使用。它们的正确选择可依炮手的需要而随意更变,按一下电钮就行了。</P>
<P ALIGN="JUSTIFY"> 但是,还有另一级的控制问题,它也是可用机械方法来解决的。通过对飞机飞行的实际观测求得其统计材料,再把这些统计材料变换成控制高射炮的规则,这个问题本身就是特定的数学问题。和通过实际观测来追踪飞机的办法相比,按照给定规则来追踪飞机的办法是相对缓慢的,因为它得对飞机过去飞行的情况作大量的观测。但虽然如此,要使这个长时间的活动就象短时间的活动那样地机械化起来,不是不可能的。因此,我们有可能去建造一种防空武器,它自身能对飞行目标的运动情况作统计的观测,然后对这些材料进行加工,把它们编成一个控制系统,最后以该系统作为快速调整的方法,使武器的位置对准所观测的飞机位置及其运动。</P>
<P ALIGN="JUSTIFY"> 就我所知,这一点目前还没有做到,但它已经纳入我们的研究范围,而且有希望应用于其他预测问题中。防空武器之能够根据飞机的特定运动来进行瞄准和射击,这样一个总计划的构成,就其本质讲来,是一种学习行为。这是防空武器计算机构中的程序带的变化,它和数字数据的解释过程并无太大的不同。事实上,它是一种非常一般的反馈,能对仪器操作的整个方法作出改变。</P>
<P ALIGN="JUSTIFY"> 我们这里所讨论的高级学习过程仍然受到所在系统的机械条件的限制,它显然不与人的正常学习过程相当。但是,从读过程出发,我们可以推导出一些完全不同的方法使复杂类型的学习过程得以机械化起来。这些方法的指导思想是由洛克的联想学说和巴甫洛夫的条件反射理论分别给出的。但是,在我讨论它们之前,我要先做一些普通的解释,来答复对我下面将要提出的见解的某些批评。</P>
<P ALIGN="JUSTIFY"> 让我再讲一下关于学习理论可能建立的根据。神经生理学家的绝大部分工作都是研究神经纤维或神经元的冲动传导,而这个过程是以“不全则无”的现象给出的。这就是说,如果一刺激沿神经纤维到达其上的某点或某端,它就沿着该处的某一神经纤维传播下去,只要它在相对短的距离内不消失掉,那么,该刺激在神经纤维的较远点上所产生的效应与共初始强度本质上无关。</P>
<P ALIGN="JUSTIFY"> 这些神经冲动沿着一根纤维传播到另一根纤维是要经过其间的连接点即所谓突触这个地方的,在这个地方,一根输入纤维可见和多根输出纤维相接,而一根输出纤维也可以和多根输入纤维相接。在这些突触中,单根输入神经纤维所提供的冲动往往不足以产生一个有效的输出冲动。一般地说,从输入突触到达一给定输出纤维的各个冲动如果太少,则输出纤维不作应答。我这里所说的太少,并非必然地意味着所有的输入纤维的作用相同,甚至也不是必然地意味着有了一批从事输入活动的突触作为连接点,则输出纤维的应答与否这个问题就可以一劳永逸地得到解决。我也不想忽视这样的事实:有些输入纤维不仅不在它们所连接的输出纤维中产生刺激,反而有阻止这些输出纤维接受新刺激的趋势。</P>
<P ALIGN="JUSTIFY"> 无论如何,冲动沿神经纤维传导的问题,即使可用颇为简单的办法来描述,例如,用全或无的现象来描述,但是,一冲动通过突触层的传递问题仍然要取决于复杂的应答模式,其中输入纤维的某些组合能在某一限定时间内激发,使消息作进一步的传递,而其他组合就不是这样。这些组合不是一成不变的,甚至也不仅仅取决于该突触层过去接收消息的情况。大家知道,它们是随温度而变化的,很可能还随着许多其他因素而变化。</P>
<P ALIGN="JUSTIFY"> 关于神经理论的上述见解和那些由一系列开关装置组成的机器的理论相符。在这种机器中,后面开关的接通取决于前面一批相关开关的同时接通这样一种精确配合的行动。这种“全或无”的机器叫做数字计算机。它在解决各种各样通讯和控制的问题上有着很大的便利。特别是,由于它仅仅是在“是”和“否”之间作出决定,这就使得它的积累信息的方式很便于我们在非常庞大的数字中把极为细小的差别区分出来。</P>
<P ALIGN="JUSTIFY"> 除了这些按照是和否的原则来工作的机器外,还有其他计算机和控制机,它们是用来测量的,不是用来计数的。这类机器叫做模拟计算机,因为它们的操作是以待测的量和代表它们的数值量之间的类比关系为根据。模拟计算机的例子之一就是计算尺,它和进行数字运算的台式计算机完全不同。凡用过计算尺的人都懂得,印有刻度的标尺和我们眼睛的准确度都给我们在尺土所能读到的精密度带来了明显的限制。这些限制,并非如人们所想的那样,只要把尺子造得大一些,就可以方便地得到解决。十英尺长的计算尺只比一英尺长的计算尺增加十分之一的精密度,为了取得这个精密度,我们不仅要把大计算尺的每一英尺造得和小计算尺的精密度相同,而且这一英尺和那一英尺接续起来的排列方向又必须和小计算尺所预期的精密度相一致。除此以外,保持大尺的刚性这个问题要比保持小尺的刚性麻烦得多,这就使得我们依靠增大尺寸来增加精密度的办法受到了限制。换言之,从实用目的看来,用作测量的机器不同于用作计数的机器,因为它的精密度受到了极大的限制。把这一点加到生理学家对全或无活动的偏爱上面,那我们就不难理解为什么对人脑的机械模拟所做过的大部分工作都要在不同的程度上以计数作为基础。</P>
<P ALIGN="JUSTIFY"> 但是,假若我们过分坚持人脑是一部值得推崇的数字计算机,那我们就要受到某种非常公正的批评了。批评可以部分来自生理学家,部分来自心理学家,后者是跟那些不喜欢用机器作对比的心理学家们多少持着相反意见的。我讲过,数字计算机中有程序带,它决定所要完成的操作程序,而程序带在过去经验基础上的变化就和学习的过程相当。在人脑中,最最显见的类似于程序带的地方就是突触阈的确定性,即激发一个与之相连的输出神经元的那些输入神经元要在彼此之间作出精确组合的确定性。我们已经知道,这些阈值随着温度而变化;我们没有理由认为,它们不随血液的化学成分以及许多自身根本没有全或无性质的现象而变化。因此,在考虑学习问题时,采用神经系统的全或无理论,我们就必需特别当心,如果我们对这个概念还没有做过理论上的批判,而又没有特定的实验证据来支持这个假设的话。</P>
<P ALIGN="JUSTIFY"> 常常有人说,任何一个适用于机器的学习理论都是不存在的。也有人说,就我们目前的认识水平而言,我所能提出的任何一种学习理论都不免为时过早,它和神经系统的实际情况大概不对头。我希望从这两种批判意见的夹缝中穿过去。一方面,我希望提出一种制造学习机器的方法,要求这个方法不仅能够使我造出一些特定的学习机器,而且能够给我提供一种制造多种多样学习机器的一般工程技术。只有在我达到这种一般性的程度时,我才能够免除下述的批评:我所主张的类似于学习的那种机械过程事实上是某种与学习的本质完全无关的东西。</P>
<P ALIGN="JUSTIFY"> 另一方面,我希望使用与描述神经系统以及人和动物的行为的实际过程不太不同的语言来描述这种机器。我充分了解到,我在表述人的实际机制时不可能期望在每个细节上都是正确的,我甚至可能在原则上发生错误。但虽然如此,只要我提出一种能够用那些属于人心和人脑方面的概念对之进行文字描述,那我就是给出一个免于受到批评的起点,也是给出一个用以和其他理论所能得到的成果进行比较的准绳。</P>
<P ALIGN="JUSTIFY"> 在十七世纪末叶,洛克认为人心的内容就是他称之为观念的那种东西构成的。对他说来,人心完全是被动的,是一块干干净净的黑板,是 tabula rasa(一张白纸),个人经验就是他在这张白纸上面所写下的印象。如果这些印象经常地出现,或是同时地出现,或是在某一序列中出现,或是在我们往往归之于因果联系的那些情况中出现,那么,按照洛克的意见,这些印象或观念便具有某种能动的趋势把各个组成部分粘合在一起而形成复合观念。观念粘合的机制就在于观念自身之中,但是,洛克在其所有的著作中,有一个令人感到奇怪的反对描述这种机制的意图。他的理论与现实的关系只能是火车的照片与行进中的实际火车的关系。它是一张任何部分都是静止不动的图表。如果我们考虑到洛克学说产生的时代,这一点就不值得惊奇了。动力学的观点,动态地描述事物的观点,首先是在天文学中而非首先在工程学或心理学中获得其重要性的,这项工作要归功于牛顿,但牛顿不是洛克的先驱者,而是他的同时代人。</P>
<P ALIGN="JUSTIFY"> 在许多世纪中,科学在亚里士多德冲动的驱使之下,着重于分类工作而把现代的研究冲动即研究现象发生作用的方式扔在一边。的确,当植物和动物还有待于调查研究的时候,要是不经过一个不断搜集材料以描述自然史的过程,我们就很难理解生物学如何能够进入真正的动力学时代。伟大的植物学家林耐(Linnaeus)就是一个例子。对于林耐讲来,种和类都是固定不变的亚里士多德式的形式,而不是进化过程的路标;但是,我们只有根据林耐的全面描述,才有可能找到令人信服的进化实例。早期的自然史家都是知识领域中的实干的拓荒者,他们围攻和占领新领域的欲望太强烈了,以致对于他们所观察到的新形式不能十分细致地作出解释。拓荒者之后来了讲究操作的农场主,自然主义者之后来了现代的科学家。</P>
<P ALIGN="JUSTIFY"> 在上做纪最后四分之一和本世纪最初四分之一的年代里,另一位伟大学者,巴甫洛夫,以其独特方法从本质上研究了以前洛克研究过的同一个领域。但是,他的条件反射的研究是实验地进行的,而不是象洛克那样理论地进行的。除此以外,他认为条件反射是在下等动物中出现的东西,而不是在人体中出现的东西。下等动物不会讲人的语言,但是,它们能讲行为语。在它们的比较显眼的行为中,就其动机而言,大多数都是情绪方面的行为,而它们的情绪又大部和食物相关。巴甫洛夫正是从食物和唾液的生理征候而开始其研究的。我们可以很容易地把一根小管插入狗的唾腺中,并观测唾液在食物刺激出现时的分泌情况。</P>
<P ALIGN="JUSTIFY"> 通常,许多东西都和食物没有什么联系,例如,视的对象、听的声音等等,它们对唾液不会产生任何的影响。但是,巴甫洛夫观察到,如果狗在进食时系统地出现某种对象或某种声音,那么,这个对象或声音单独出现时也足以激起唾液。这就是说,唾液的反射受到过去联想的制约。</P>
<P ALIGN="JUSTIFY"> 这里,在动物反射的水平上,存在着某种类似于洛克的观念联想的东西,即反射应答所产生的联想,其情绪内容显然是很强烈的。我们现在考察一下那些性质相当复杂的为产生巴甫洛夫型的条件反射所必需的前提。首先,它们一般是动物生活中居于重要地位的东西,在上述情况下,就是食物,虽则在反射的最后形式中食物因素可以全部消除掉。我们还可只用畜牧场周围的电网为例,说明原始刺激在巴甫洛夫的条件反射中的重要性。</P>
<P ALIGN="JUSTIFY"> 在畜牧场上,要建造一个足够牢固的线网来圈住牲口,不是一桩容易做到的事情。因此,比较经济的办法就是用一两根较细的、通有高压电流的导线来代替这种笨重类型的线网,一当动物身体触及电网从而使电流短路时,动物就受到了一个十分可观的电击。这种电网要能在开头一两次承受住了牲畜的压力,但继此以后,电网的作用,不在于它能够承受机械压力,而在于牲畜已经养成力图避免与电网接触的条件反射。在这里,反射的原始扳机乃是痛苦,而避免痛苦对于任何动物的生命延续讲来则是一枚极为重要的事情。形成该反射的扳机是牲口对于电网的视觉。除饥饿和痛苦外,还存在着其他的产生条件反射的板机。对于生物的这些情绪状态,我们可以用拟人的语言来讲述它们,但我们用不着这样一种的拟人主义,即把这些东西说成具有动物经验中所不具有的重要意义。动物的这些经验,无论我们可否称之为情绪的,都能够产生强烈的反射。在形成一般的条件反射时,反射应答使转移到这些扳机状态之一。这个扳机状态经常伴随原始扳机而出现。对于引起给定的应答,刺激物可变,这在神经方面一定是互为相关的:导致应答的突触通路是开着的,不然的话,就应当关着,或者说,不导致应答的突触通路是关着的,不然的话,就应当开着;这样就构戍了控制论所讲的程序带中的变化。</P>
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -