革命
乔治·A·米勒虽然在1960年看上去还相当年轻,虽说年近40,可看起来还喜欢搞些恶作剧的样子,他是哈佛大学心理学系的教授,他在这门职业当中所占据的有名望的地位和舒适的生活方式已经是早有保障的了,真是前程似锦。然而,就在这年,尽管为此极感不安,可他还是感觉到一股无法遏止的冲动,想要暴露自己的本色,哪怕这意味着放弃他在哈佛的位置。
他的自我暴露并非出自激进的政治信仰,亦非迫在眉睫的桃色事件,虽然这两项在当时是司空见惯的常事。他的问题在于他对思维的兴趣。
思维?这有什么可破坏或者争辩的?这不正是心理学关系的核心问题吗?
不,当时并非如此。自从行为主义4O年前开始主宰美国心理学以来,情形一直并非如此。对于行为主义者来说,看不见的、非物质的和只能推测的思维,是一种过了时的形而上学概念,任何一位关心自己的前途和名声的实验心理学家都不会去碰这个话题,更不会花时间去弄这个课题。
可在过去的几年里,米勒已经慢慢变成了一位转变过来的唯心论者了。他出生在西弗吉尼亚的查尔斯顿市,并在这里长大,他读大学一年级的时候对心理学全无兴趣,甚至稍稍有点厌恶;他在回忆录中像平常一样半开玩笑地说,他看到有一本心理学教科书里面有大脑和其它器官的插图,“因为是在信基督教的科学家家庭长大,我从小就学会避开药物,如果碰到恶魔,我会认出他来。”
要么是教育所致,要么是鬼迷心窍,他改变了自己的世界观。他在阿拉巴马大学读二年级的时候,因为一位女孩子的影响(后来他娶了她),他去参加了一次非正式的心理学讲座。讲课的是唐纳德·拉姆斯德尔教授。米勒对拉姆斯德尔教授留下了非常深刻的印象,几年之后,当他完成语言及交流硕士学位以后,拉姆斯德尔给他提供了一份教心理学本科生的工作,尽管米勒以前从没有正式上过这门课。到这时,米勒已经结婚并当了父亲,他需要一份工作,因而就同意了。教了一年心理学以后,他转变了自己。
他去哈佛学习研究生课程,在行为主义心理学方面得到了坚实的基础教育。他使自己成了出类拔萃的学生,得到博士学位以后,他当上了讲师。在接下来的14年时间里,他首先在哈佛,然后又到麻省理工学院,在这些地方进行语言及交流方面的实验研究。尽管他接受过这方面的教育,可是,跟以老鼠为基础进行的实验不一样,这种工作迫使他要对人类的记忆和其它高级心理过程进行思考,不管他愿意不愿意。他参加了在斯坦福大学进行的一次暑假研讨班后,更加接近唯心主义论了,因为他与语言心理学家诺姆·乔姆斯基在这次会上进行了紧密合作。他在学年休假中去帕罗阿尔托的行为主义科学高级研究中心工作了一年,并掌握了大量进行思维研究的新方法,特别是通过计算机程序进行思维过程的刺激。
米勒于1960年秋季回到哈佛,可他已经变了一个人。如他在回忆录中所述:
我意识到自己对哈佛心理学系所限定的心理学概念的狭窄含义极不满意。我刚刚在阳光里度过了玩玩打打的一年。回到一个一头被心理物理学束缚住,另一头被操作性的条件制约所束缚的世界里去是件令人极不情愿的事。我决定,要么是哈佛让我创立某种类似于斯坦福大学研究中心那种交换式激发的东西,要么是我走人。
米勒把自己的不满和建立一所新中心,专门研究心理过程的梦想告诉了朋友和同事杰罗姆·布鲁纳。布鲁纳理解他的感情,也看出他的意图。他们俩人一起去找院长麦克乔治·班迪,得出了他的同意,并在卡耐基公司的资助下建立了哈佛认知研究中心。取这样一个名字使米勒感觉上像一位公开的叛教者:
对我来说,就算已经晚到了1960年,使用“认知”这个词仍然是一种反叛的行为。当然,对杰里[布鲁纳]来说可能没有这么严重;社会心理学家们从来就没有像实验科学家一样因为行为主义的盛行而销声匿迹。可是,对一个接受过减约科学,并应该尊敬这种科学的人来说,“认知心理学”就是一项明确无误的声明。它意味着我对思维有兴趣——我从暗处露出身来了。
他成了一场运动的领袖,并极大地改变了心理学的焦点和研究方法,而且从今以后引导着心理学的方向。
乔治·米勒站了出来,这是60年代发生在实验主义心理学中的典型事件。最开始是少数一些人,接着,大部分人都抛弃了老鼠、迷宫、电栅栏和可以发放食物的杠杆,转而进行有关人类更高级心理过程的研究。在整个60年代,这场运动形成了很大的势头,因而获得了“认知革命”的美誉。
许多因素都助成了这场运动的形成。在过去的20年中,格式塔心理学家、性格研究者、发展心理学家和社会心理学家,都在以不同的方法进行心理过程的探索。其它科学领域(其中一些我们已经听说过,还有一些我们马上就会了解到)里的一些发展碰巧也在形成有关思维工作机制的其它情况。具体有:
——神经科学家,他们利用微电极探针和其它一些新技术,观察涉及思维过程的神经现象和细胞交换连结。
——逻辑学家和数学家形成了信息理论,并利用它解释人类交流的能力和局限性。
——人类学家分析不同文化中的思维模式,他们发现了哪些心理过程是根据民族不同而有所变化的,哪些是全球一样的,因而决定哪些是天生的。
——心理语言学家研究语言获得和用途,他们得知,思维在获取并控制我们称作语言的复杂的符号系统。
——计算机科学家,这是一种新的杂合学家(一部分是数学家,一部分是逻辑学家,还有一部分是工程师),他们提出了有关思维的全套崭新的理论模式,并设计出了一些好像能思考问题的机械装置。
到70年代末尾,认知心理学和这些相关领域均慢慢形成各认知学科,或者集合地称作认知科学。认知革命决不仅指心理学中一场空前规模的深化和扩展,它是非同寻常的——的确,可以说是令人完全难以相信的——它是六门有关心理过程新知识的科学同时的发展。
计算机科学在当时对心理学的影响最大。这个新的研究领域是二战期间深入研究的结果,当时,盟军急需能计算的机器,使它可以快速地处理大量数字,以引导防空火炮,操作航行设备等。可是,哪怕很高速的计算机器都需要人类操作员来告诉它做什么,每次计算之后,下一步做什么,这就严重地阻碍了它们的速度,并引发了计算不准确的情况。到40年代,数学家和工程师开始给机器提供一套存储在其电子记忆中的指令(程序)。现在,机器可以快速和准确地指导他们自己的操作,贯彻很长顺序的操作,并作出一些下一步做什么的决定。计算机器成了计算机。
一开始,计算机只处理数字问题。可是,如数学家约翰·冯·纽曼和克劳德·香农和其它计算机专家很快就指出的一样,任何符号都可以代表另一个种类的符号。一个数字可以代表一个字母,一系列数字可以代表一个词,数学计算可以代表通过语言表达出来的关系。比如,=号可以代表“与……相同,”≠号代表“与……不同”,>代表“大于”或者“太多。”设定一套使字变成数字和逻辑关系,或者反过来的规则,计算机就可以执行一些与某些人类推理类似的操作。
计算机可能在某些方面发挥思维功能的思想——当时,这种想法听上去更像是科幻小说而不是科学——1948年首先由冯·纽曼和神经生理学家沃伦·麦卡洛克在加利福尼亚科技大学举行的一次“人类行为的大脑机制”学术会上提交出来讨论。
这个想法吸引了赫伯特·西蒙,当时他还是卡耐基学院(现在是卡耐基-默伦大学)讲政治科学的一位年轻教授。然而,“讲政治科学的一位教授”几乎没有对他描述。西蒙是一位电气工程师的儿子,非常聪明,在学校总是跳级,比自己的朋友和同学都年轻一些。他不喜欢运动,在威斯康辛长大,很清楚自己的犹太背景,因此,他使自己成为一名知识分子而安慰自己是一点也不奇怪的,可是,实际上,他的兴趣是见异思迁,非常广泛的;他虽然成了一名政治科学家,可是,他对数学却有兴趣,自学了数学、经济学(他为此获得1978年的诺贝尔奖)、管理、逻辑、心理学和计算机科学。
1954年,西蒙和他的一位极聪明的年轻研究生艾伦·纽厄尔发现,他们对计算机和思维(两人后来都在心理学中得到学位)以及创造一种会思维的计算机程序拥有极大的兴趣。一开始,他们选择了非常有限的思维种类,也就是形式逻辑中的求证定律,这完全是一种符号和几乎是代数的过程。西蒙的任务是要求出公理的证明,“不仅尽量拆细,不仅是求证步骤,而且要找到引导我的一些提示。”接着,他们两个人一起试着把这个信息合成一个流程图,他们把这个流程图变成了一种计算机程序。
一年半之后,西蒙和纽厄尔在1956年于麻省理工学院举行的的一次信息理论学术会上震惊了出席会议的人。他们描述了自己的智力产品——“逻辑理论器”。这种程序在一座由真空管制造的原始大型机约尼阿克上首次运行,能够以逻辑形式证明一系列的公理,每个公理求证时间从不到1-15分钟不等。(如果用现代计算机,需要的时间可能不够眼睛眨一下。)“逻辑理论器”是第一道人工智能程序,它当时还不是非常智能化的。它只能证明逻辑公理——求证的速度跟一位普通的大学生所需的时间差不多——而且,还必需以代数符号进行。可是,作为第一道能进行某种类似思维的活动的计算机程序,它的确是一种石破天惊的成就。
到第二年的末尾,即1957年,纽厄尔和西蒙以及一位大学生克利弗德·肖已经编写成了另一个聪明得多的程序,即GPS(通用问题求解器),它合成了一系列宽泛的原理,与许多智力任务差不多,包括求证几何公理,解决密码算术问题和下国际象棋。GPS会先走一步,或者首先探索,开始决定“问题空间”(在开始状态与预期目标之间所含所有可能步骤的区域),察看结果,以确定这个步骤已离目标更近一些,调合接下来的可能步骤并加以测试,看哪一个会使它向前更进一步接近目标,如果一系列推理偏离了方向,则倒回到最后一个决定点,从另一个方向重新开始。GPS早期能够很容易地解决的简单问题如下所示(问题不是以这些单词表现出来的,因为GPS不理解,而是以数学符号表达出来的):
一位长得很胖的父亲和两个年轻的儿子必须在森林里跨过一条湍急的河。他们找到了一条废弃的船可以划过,但如果过载就会沉没。每个孩子重100磅。两个孩子加起来的重量与父亲相等,这条船最多只能载重200磅。父亲和孩子如何过河呢?
答案虽然很简单,要求退一步才能前进。两个孩子上船过河,一个上岸,另一个划回去上岸;父亲划过去下船,另一边的孩子再划回来,把这边的孩子拉上去再一起划过河。GPS在设计和测试这个解时,在做与人类思维类似的事情。通过同一类的启发过程——广泛的探索及评估——它就可以解决类似但困难得多的问题。
GPS的两个基本特征(及后来的人工智能程序)给认知心理学带来了深刻的变化,因为它们给了心理学家一些更为详细和可操作的心理过程概念化,这超过了他们以前所具有的一切,而且还有调查问题切实可行的办法。
特征之一是代表:即用符号代表其它符号或者现象。在GPS中,数字可代表词汇或者一些关系,而在由GPS进行操作的硬件中(即实际的计算机),成组的晶体管通过二进制开关的开闭代表这些数字。通过类比,认知心理学家就可以把图象、词汇和其它一些存储在思维中的符号当作外部现象的代表,把大脑神经反应看作这些图象、符号和思想的代表。换句话说,一个代表对应于它所代表的东西而不需要完全与它相似。可这实际上是新瓶装旧酒;笛卡儿和费马很久以前就曾发现,代数等式可以通过图中的线条表现出来。
第二个特征是信息处理:通过程序进行数据的变形和操纵以达到一个目标。在GPS情形中,进入的信息——即每个步骤的反馈——是以它导向什么地方进行评价的,用来确定下个步骤,存储在记忆中,需要时再调出来等等。通过类比,认知心理学家可以把思维看作一种信息处理程序,它可以将知觉和其它进入的数据变成心理代表,并一步步地评估,用它们确定达到目标途中的下一个步骤,把它们增加进记忆中,再在需要时重新调出来。
信息处理(IP)或者思维的“可计算”模式自60年代开始一直就成了认知心理学指导性的比喻,并使研究者及理论家们能够以前所未有的方式探索内部的宇宙。
这样的探索方法中的一个例子可以说明IP模式是如何使认知心理学家们确定思维里面发生的事情的。在1967年的一项实验中,一个研究小组请受试者尽量快地大声说投在屏幕上的两个字母是否有相同或者不同的名字。当受试者看到AA时,他们几乎立即就说出“相同”,而当他们看到Aa时,他们也差不多同时就说“相同”。可是,研究者们利用高精度计时器测出了极细微的差别。平均来讲,受试者在549毫秒的时间内回答AA,在623毫秒的时间内回答Aa。这肯定是个细微的差别,可在统计学上却是个有意义的差别。用什么来解释这个差别呢?
IP模式把任何简单的认知过程都看作一系列一步一步以数据形式采取的行动。下列简单的流程图是认知心理学家们经常画的典型的图例,它可以象征当我们看到并辨认出事物时发生的事情:
这可以解释实验中的反应——时间差别。如果一个图象直接从最开始的“处理”框向“意识”框进发,它会以比必须通过其它两三个框而达到目的的过程更快些。为了辨别包含在AA中的字母是相同的字母,受试者只需要完成视觉图象中的视模式辨别就可以了;为了辨别Aa中的字母是否是相同的字母,受试者得把记忆中每个字母的名字定位下来,然后看看它们是否一样——这额外的处理需要74毫秒,一个很小但是必然的差别,也是思维如何完成这个小任务的证据。因此,基于IP模式的哪怕微不足道的一个实验也可以显示出思维里面发生的事情。
确切地说,这项发现是从结果中得出的推论,而不是对过程的直接观察。可是,与行为主义教条不一样的是,从结果中推论一个看不见的东西,这在“硬”科学中是不合理的。地质学家根据沉积层来推断过去的事件,宇宙学家根据遥远星系古老的光来推论宇宙的形成和发育,物理学家根据瞬时原子粒子留在雾室或者乳胶上的痕迹来判断其特征,生物学家通过化石推论产生了人类的进化通道。探索思维的内部宇宙也是根据同样一些方法:心理学家不能进入里面,可是,他们可以根据可以说是通过可视的思想过程这个痕迹而推断它工作的情形。
认知神经科学家眼中的记忆
认知神经科学,也叫做行为主义神经生物学的爆炸性发展也给认知过程带来了完全不同的一线曙光。生物学的这个专业分支是要解释神经现象水平上的心理过程;我们在胡贝尔和威塞尔的实验中看到过一个例子,它历史性地发现了只对特别形状或者运动方向有反应的一些视网膜细胞。
神经科学方法早已有之,至少可以回溯到笛卡儿时代。尽管他相信思维是非物质的,可是,他猜想,如我们所看到的,反射是由“活力”通过神经系统的流动引起的,正如御花园里的自动装置的移动是由水管里的水流冲动所致,而记忆是特种“大脑孔隙”扩大所致,通过这些孔隙,活力就可以在学习期间通过。同样的,一个世纪以前,年轻的弗洛伊德很自信地宣布说,所有的心理过程都可以当作神经元“可以进行数量确定的状态”,尽管他后来很快懊恼地承认,进行这样的理解时间尚未成熟。
同样的希望却继续激发许多研究者的灵感。在过去的40年间,特别是在过去的15年间,认知神经科学中超凡的进展已经使得一些狂热者宣布,像需要、情绪和思想这样一些概念会被生物学数据所代替。一位神经科学家保尔·丘奇兰德宣布,当人类能够得到这些数据时:
我们在终于到来的真正充裕的框架内,将着手对内部的状态和活动加以重新考虑。我们对人们彼此之间的行为的解释会利用像神经药物生理状态、专门化的解剖学区域的神经活动,以及被新理论视作有关的所有无论什么状态。
认知神经科学家——他们当中有些是研究过心理学的神经生物学家,还有一些是研究过神经科学的心理学家——不是在思维过程上进行研究的,而是以“湿件”中实际发生的现象进行研究的,这些“湿件”是一万亿到二万亿构成人脑的神经元。使他们发生兴趣的是像钠和其它离子作为电脉冲沿着神经元的提轴(主杆)进出的现象;神经传递器(突触中产生的化学物质,脉冲通过它进入其它神经元的联接处)的分子结构;从一个神经元带着激发或者抑制的信息跳过显微级的突触间隙,到达另一个神经元的神经传递器分子;和由不同刺激及心理活动引发的神经通道和网络。
有些工作还带着滑稽的色彩。一位研究者在一只雄草蜢的肌肉里植入了16根微电极,以期记录其神经元在交尾期间的电脉冲。另外一些人把微电极插入蟑螂左前腿和蜗牛的足部,以测量它们爬向目标时的神经脉冲。调查者们认为这些是对“动机行为”的研究。
在所有认知过程中,特别是在更高级的物种中,记忆是最为基本的。认知神经科学家一直在想办法辨认记忆力如何以及存储在分子水平的什么地方。下面是他们进行研究的一些办法:
——早在1949年,唐纳德·赫布这位加拿大心理学家就曾提出过假设,说记忆的存储是通过对连接神经元的突触的修改而形成的(这与笛卡儿的想法大同小异)。他说,突触在学习经验中反复的激发多少会加强突触,并将两个神经元连接到一种电路或者“记忆痕迹”上。赫布的假设多少在1973年得到印证,当时,一位英国神经生理学家蒂莫西·布利斯及其同事特杰·洛莫测量了一只兔子大脑中一个神经通道中的电压,然后沿着这个通道反复地施放电流,后来发现,这个通道携带有比平时更高的电压。突触已经因为电脉冲而得以加强。其含义是,这就是学习时发生的事情。
——也是在70年代早期,一位美国心理学家威廉·格林努夫在两种环境里饲养老鼠,一种环境里装有玩具、迷宫和其它刺激用的装置,另一种里面完全是空的。在刺激环境里面长大的老鼠长有更多的树突,因而产生了比枯燥环境中的老鼠更多的突触。后来,通过电子显微镜检查,格林努夫和一位同事实际上发现,环境丰富一些的老鼠大脑中受到影响的皮层区里面的突触数比另外一些老鼠多出百分之二十到二十五。学习生成了额外的连接;记忆痕迹多少一定在这些突触里面记录下来了。
——最近几年,丹尼尔·L·阿尔肯及其在国立神经及交流疾病及中风研究院的同事们对一种海洋蜗牛进行培训,以使其产生一种它平常不会产生的对光的反应。这种海洋蜗牛很快就爬向光源了。另外,当水流很急时,它会本能地展开触须,以抓到表面的东西。阿尔肯把这些反应合并起来。他们往池子里打光线,并把水搅动,因此就使蜗牛适应了条件形成——教它——使其一看到光线闪动就展开触须。然后,他发现,在这种蜗牛的某些光电接受神经元里,PKC分子,即一种对钙敏感的酶从神经元的内部转移到了膜上,它们在这里减少了钾离子的流动——这是对记忆的分子级解释。
——在过去的30年里,詹姆斯·L·麦戈及其他研究者给学会了钻过迷宫的老鼠注射了肾上腺素(肾上腺分泌的一种荷尔蒙)及其它儿茶酷胺类神经传递器物质。肾上腺素特别引起了老鼠对已经学会的东西比没有注射药物的老鼠记忆更长的时间。通过其它研究中得出的一个解释好像是,肾上腺素的一种副产品能够克服阿片样物质,这是一组神经传递物质,它可以达到一些有用的目的,可是却会堵塞突触接受一侧的接受器。结果:更多的接受器保持张开状态,突触更高地起作用,记忆得到加强。
对记忆和其它心理过程采取的神经科学研究办法具有很大的哲学意义。它好像给灵肉这个古老的论题一次性的划上了句号,因为它能够以物质和现象的术语解释所有的心理过程。记忆和其它高级心理过程只是一些在大脑的迷走神经和极微管道中流动着的离子和分子。
然而,大部分认知心理学家都认为,神经现象并不能提供对认知现象足够或者有用的解释。很少有人是相信非物质思维意义上的二元论者,然而,他们强调,心理过程尽管是由神经现象构成的,但它们是这些构件组织或者多元结构的特性,而不是构件本身,就好像是说,掩蔽之所不是砖石、屋梁和薄板的特性,而是用这些东西制成的房子的特性。
本人就是一位脑科学家的诺贝尔奖得主罗杰·斯佩里提供了另一种类比:高级心理过程就像是一只朝山下滚的轮于,滚动是由轮子“整体的系统特性”决定的,而不是由原子和由它们构成的分子决定的。
发展心理学家杰罗姆·凯根使用了另一种类比:行星运动的优美法则显示的一些现象无法用其所从构成的原子来描述。
另一种比喻是认知科学家厄尔·亨特说的:“我们可以从生理测量中知道,大脑左太阳穴区在我们阅读时处于活跃状态,可是,我们不能确定这种活跃状态是由读莎士比亚的著作,还是由读阿佳莎·克里斯蒂的作品时引发的。”
最后,还有认知心理学家乔治·曼德勒说的一句话:“思维具有的一些功能与中枢神经系统中的一些功能有所不同,正如社会在某些方面起的作用,不能从单个头脑中得出的一些功能中推导出来一样。”
大多数认知心理学家因此而相信,从记忆里面抽出的一个词,与神经元成百上千万次的发射及其结果的几百万甚或几十亿突触传递不能相提并论,可是,它却是这些发射或者传递的结构或者模式的产品。对记忆的神经生理研究虽然很有价值,可是,它不能告诉我们如何学习一些东西,如何辨认我们早先经历过的一些事物,或者从记忆里面检索出所需的一些东西——比如我们讲话时要用到的一些词。这些现象,或者副现象,不是由认知神经科学,而是由认知心理学掌握着的。
《认知》杂志以前用的刊标就可以证明基础现象与副现象之间的差别:
这个图案是由纸上的墨迹分子构成的,这个东西与其意义没有任何关系。在较高层的组织水平上,分子构成字母,它们本身是没有意义的符号,可是,在这里却组织起来形成“认知”这个词。可是,我们还没有完。这个设计尽管看上去像是真实的,而是三维的,可是,它却是一种不可能存在于现实世界的东西;这种似真又假的错觉是一种心理附带现象。如果可能的话,可以用墨水、字母的分子这些术语来解释,或者把它解释成视觉皮层神经元的能量发射。
认知心理学家眼中的记忆
在心理学界本身,至少在学术界,认知革命很快赢得了某些高级心理学家的认可以及大多数年轻的心理学家和大多数心理学研究生的狂热。一开始,就跟神经科学家们一样,他们首先集中精力于知觉,可很快就将注意力转移到了思维对知觉的利用上了——其高级心理过程。到1980年,心理过程的理论家约翰·安德森将认知心理学定义为“理解人类智力的本质及人们如何思想”的尝试。
按照信息处理学说,最基本的第一步是进入记忆的数据的储存,不管是存储几分之一秒还是存储一辈子。如詹姆斯·麦戈在最近的一次讲座中所言:
记忆对于行为是必不可少的。任何重要的东西没有一件不是从根本上建立于记忆之上的。我们的意识和我们的行动是由经验构成的。而且,我们的经验使我们成为现在的样子,是因为它们具有长期的影响力。
记忆对于思维具有何等至关重要的意义,这对任何知道一位经受着深度阿尔滋海默氏病影响的人来说,是非常痛苦且记忆犹新的。他可能在话讲到一半时忘记了自己想说什么,沿着小路去自己的信箱时可能会突然迷路,认不得自己的孩子了,对他自己的信息突然不熟悉了,因此而大发雷霆。
乔治·米勒1955年在东岸心理学协会的一次会议上发表过一篇演讲,这篇演讲后来成了研究记忆的认知心理学理论家们的界标。米勒以惯常的活泼风趣把这次讲话称作“神密的第七,加上或者减去二”。他一开始就说:“我的问题在于,我一直受到一位整数的折磨。”这个整数就是7,米勒为此感到很神秘和难以忍受的东西是,如许多实验已经显示的,人们可以立即转入记忆的往往是这个位数。(人们经过短时间的研究之后可以暂时记住像9237314这样一位数字,但记不住像5741179263这类数字。)
很值得注意,也很神秘的东西是,暂时记忆,我们能够注意到的东西中的限制性因素竟会如此短小。局限可以起到很关键的一个作用:它会把进入的数据极大地修整成思维可以在任何时候急需的东西,从而注意并作出决定,这种功能无疑会帮助我们原始的祖先在丛林和沙漠中的生存。可是,它也提出一些令人困惑的问题。这么小的一个注意区是如何处理我们在开车或者滑雪时必须注意的知觉的泛滥的?或者,在一个人对我们谈话。或者当我们试图向他们说点什么时,声音和意义是如何混合起来的?
可是,哪怕是用程序分块,暂时记忆的能量与材料的巨大数量比较起来也还是不那么重要的——我们的日常经验、语言和各种总体的信息——这些我们学习并存储在长效记忆里,并在需要的时候调出来的东西。
为了解释这种不一致的现象,并确定记忆如何工作,认知心理学家在60和7O年代进行了许多实验,实验结果串在一起形成了人类记忆的信息处理全图。在这幅图中,记忆是由三种存储形式构成的,从几分之一秒到终生不等。只需要用几秒种的经验或者信息项在使用过后很快就消退了,或许会转变成半长久或者长久的长效记忆中。研究者和理论家们以类似于后面的流程图的形式描述了其中信息的类型和传递。
最简单地记忆力形式由感觉“缓存器”构成,进入的感觉首先被接收和保持。研究者们通过速转实体镜证明,缓存器是存在的,而且还测量过长效记忆在消失之前会在缓存器里保持多长的时间。在1960年进行的一项经典实验中,心理学家乔治·斯伯林在一块屏幕上闪动如下所示的字母图案,让受试者仔细观察:
R B L A
T Y Q N
G K R X
这些字母闪动约二十分之一秒,这个时间太短,受试者不可能看到所有的字母,尽管看完之后,他们马上能写下任何一行的字母。(闪动之后,会有声音告诉他们写下哪一行。)他们听到声音时还能“看见”所有三行字母,可是,等他们写完一行时,他们已经就不清楚其它的几行了。记忆已经在不到一秒的时间内消失了。(别的人用声音进行的一些实验得出了可比较的结果。)很明显,进入的知觉存储在缓存器里,并从这里很快消失——所幸的是,如果它们保持更长一些时间,我们看到的世界将会是一片模糊。
然而,由于我们需要将目前所关心的东西保持更长一些时间,因而就必须有另一种持续时间更长的临时记忆形式。当我们注意感觉缓冲器里面的材料时,我们可以用好几种方式中的任何一种进行。一个数字不仅仅只会是一个知觉到的外形,而是一个符号-4会有一个名字(四),它还会有一个意义(它所代表的数量);同样的,我们读到或者听到的词会有意义。这个处理会把我们正在注意的东西从缓存器里传递到米勒正在说的短期和立即记忆中。
按一般人的话来说,短期记忆是指最近几小时或者最近几天的事件的保留,可是,按行话来说,它是指任何成为当前心理活动中的一部分,但在使用过后不再保留下来的东西。这种形式的记忆是短暂的。我们所有人都有这样的经历,找到一个电话号码,然后遇上占线,得重新再找到号码才能拨号。但是,我们可以自己把这个号码念几次后使其在脑海里保持好多秒甚至好几分钟——心理学家把这种活动叫做“预演”——直到用完为止。
因此,为了测量短期记忆的正常保留期,研究者们只好防止预演。印第安那大学的一组研究人员1959就进行了这样的实验。他们告诉受试者说,他们得努力记住三个三个一组的辅音,这很容易做,可是,他们一看到辅音时,得根据节拍器的节奏倒着念辅音,这把他们事先的注意力倒空了,使预演不可能产生。研究者在不同的时间内使受试者倒读的活动突然停止,看看他们能够把三个辅音保持多长时间;没有一位受试者的保留时间超过18秒的。许多后来的实验都确证,短期记忆力的衰退时间为15-30秒钟之间。
最近,其它研究在两种短期记忆之间作了区分(上图并未表现出来)。一种是语言的:我们刚刚讨论过的对数字、单词等的直接记忆。第二种是概念性的:一个概念或者通过一个句子或者其它好几个部分的表达传达出来的意义(比如某个代数方程)。在1982年进行的一项实验中,让受试者看一些句子,每次看一个单词,每个单词只给十分之一秒的时间;他们可以轻松地记住如下所示的有效句子(不过不一定是真实的):
愚蠢的学生讨厌没有经验的老师。
但对于同样长度的无效句子,他们就束手无策了,比如:
紫色具体培训想象性的苍道。
更早一些时候(1967年)进行的一项实验已很清楚地显示出,我们很容易在短期记忆中保持住一个句子的意义,可是,很快会忘掉一些准确的词。研究者雅克琳·S·萨奇让受试者读下面这句话:
在荷兰,有一位名叫利普谢的男人专做镜片。有一天,他的孩子们在玩一些镜片,他们发现,如果两片镜片放在约一英尺远的间隔内时,东西好像更近些。利普谢开始实验,接着,他做的“间谍镜”吸起了人们极大的注意。他就此给伽俐略写了一封信,就是意大利那位伟大的科学家。伽俐略建起了自己的仪器,第一个晴朗的夜晚就把仪器抬了出来,他很惊奇地发现,空阔的黑色夜空里挂满了星星!
接着,萨奇问他们,下面这三个句子里,哪一句出现在他们刚刚看过的原文中:
1.伽俐略这位伟大的意大利科学家,就此给他寄了一封信。
2.他给伽俐略这位伟大的意大利科学家就此寄了一封信。
3.他就此给伽例略写了一封信,就是意大利那位伟大的科学家。
结果是:萨奇的受试者都知道第一句不在原文中,可大多数人都说第二句在原文中。他们错了。它的内容当然是正确的,可其形式却不对,他们在读第二句之前读过第一句,而衰退时间长得足以让他们忘记用词和内容。
同样的,我们可以在“长时间记忆”中,将我们谈过的一些话,我们读过的一些书,我们经历过的一些事情的要点和我们得知的无数的事实保持几个月,几年或者终生不忘,可是,没有人,或者只有很少一些人,能够记住这些事情发生时准确的用词。以这种方式记忆住的大量的材料比我们大多数人能够记忆住的多得多:数学家约翰·格里菲斯计算过,一般人类的记忆终生的记忆能量是十的十一次方(100个百万的立方)比特(在信息学说中,比特是最小的信息单位,它等于一个简单的是或者不是。一个数字或者字母表中的一个字母等于好几个比特),或者是《大不列颠百科全书》里面所包含信息的500倍。
短期记忆中的新信息在我们使用之后就遗忘了,除非我们使其经过进一步的处理变为长期记忆的一部分。一种形式的处理是死记硬背,如小学生背诵乘法表一样。另一种是将新信息与某些很容易记忆的结构或者助记忆术联系起来,如单调的儿歌(学龄前儿童背诵字母表的歌)或者是押韵规律(“看见字母C,记得加上E”)。
可是,最为重要的是在60年代和70年代进行的实验中变得非常明显起来的一种,即“精细处理”,根据这种方法,新信息与我们现存的有组织的长期记忆联系起来。我们可以说是将它叠接到语义网中了。如果新项目是一枚我们以前从未见过的芒果,我们会把这个词和概念与合适的长效记忆联系起来(不是一种物理的位置——思想和图象现在被认为是散布于大脑中的——而是一种概念上的位置:即“果子”这个范畴),连同芒果的视觉图象、触觉、口味和嗅觉(我们将它们分别列入图象、触觉品质等等的范畴中),再加上我们所知的、有关它的生长地、它的价格等等的其它信息。将来,当我们试图想起芒果时,我们会以上述任何一种办法检索出芒果来:通过回忆它的名字,或者思考水果,或者回忆有青皮的水果,或者想起黄色的切片,或者任何其它的范畴或者联系起来的特征。
所有这些信息是如何组织起来的,对此,我们已知的许多东西都是通过反应——时间实验得知的,比如请受试者在很短时间内说出尽量很多红色东西的名字,或者说出水果的名字,或者说出一些以某个字母开始的东西的名字。利用这些方法,华盛顿大学的伊丽莎白·洛夫特斯发现,在一分钟的时间内,志愿者平均可以说出12种“鸟类”,但“黄颜色的”东西一分钟只能说出9种来。她的结论是,我们不能在记忆中直接地找到符合某种特征的东西,但能很快地找到范畴(鸟、水果、蔬菜),并在每个范畴里寻找到这些东西。
同样地,如洛夫塔斯和另外一个同事阿伦·柯林斯所发现的,人们面对“鸵鸟是一种鸟”这样的说法,回答“是”或者“不是”,比面对“金丝鸟是一种鸟”这样的说法所花的时间要长些。含义在于:金丝鸟是一种比鸵鸟更加典型的鸟类,它更接近于范畴的中心,因此需要较少的时间就可以辨认出来。
到1975年,柯林斯和洛夫塔斯在这样一些资料的基础上,象征性地把长期语意记忆描述成复杂的网络,它是层次性的(一个总的范畴围着具体的例子),也是联想性的(每个例子都与一种特征相联)。他们用下面这个图描述了这种情况:
这还只是语义记忆网络中微不足道的一个例子。图中的每个结点还与其它许多的结点链连接在一起,这里没有显示出来,比如“游泳”也许可以跟“鲸鱼”、“人类游泳运动员”、“运动”。“有益的锻炼”连接在一起,而这每个词又可以与其它许多的词和特点及其它东西连接起来,无穷无尽。
记忆研究已经伸展到了很远的地方,我们只得就此打住,看看其它许多发现的简短报告,然后继续往前走。
概念化:许多研究证实,人类思维具有一种倾向,会自动地把一些类似的物体在记忆里面组成相同类别,并从其相似性中找出总体的概念或者范畴。哪怕只有几个月大的婴儿好像都知道进行简单地概念化工作。一项研究显示4个月大的婴儿会把不同的蓝色、绿色、黄色和红色分成类别。看到过一种色彩组的不同物体以后,它会显示出对别的任何色彩组的爱好。结论是:色彩分类要么是天生的,要么是在出生后迅速形成的。
许多其它的研究也曾统计过,当孩子获取语言能力时,他们会在有过与狗、猫、松鼠和其它动物的经验后,慢慢地发育像“动物”这类范畴的东西。确切地说,父母也向孩子们教授这种概念,可是,有一部分好像是天生的。这种倾向在所有民族中都如此常见,以致于成了一种天生的人类特征。人类学家布伦特·伯林发现,在12种不同的原始社会的民族中,人们都将植物和动物以惊人地相同的方式归结成类了,也就是说是以层次的方式进行的,从与生物学种类相类似的子类开始,并把一些类似生物学的种属的东西放在一个较大的门类之下,进而按照生物学中的植物和动物界的方式将一些范畴归结在一起。
概念化的能力也许是由进化选择而成的。它具有生存价值,因为从这些分组开始,我们可以对一些陌生的事物进行有效的推论。在最近的一项研究中,洛切尔·格尔曼及其一位同事让受试者看红鹤、蝙蝠和一只山鸟的照片。受试者被告知说,红鹤“这种鸟的心脏只在右边有一个动脉弧”,然后又对受试者们说,蝙蝠的心脏“只在左边有一个动脉弧”。然后,问他们说,山鸟“这种鸟的心脏有什么”?几乎百分之九十的人都正确回答说“只在右边有一个动脉弧”。他们的答案不仅以蝙蝠和山鸟的相似性为基础,而且以红鹤和山鸟的范畴为基础。哪怕4岁的小孩子面对这样一种类似和简单的测验时,百分之七十的时间里也会以范畴的成员关系为基础回答问题。
代表:研究者们一直就不了解材料存储在记忆中的形式。有些人相信,它是以形象和词汇双重形式存储下来的,这两种数据库之间还存在着交流。其他一些人则以信息理论和计算机模式为基础,认为信息只以“命题”的形式存储在记忆中。一道命题是一种简单的“思想单元”或者是一些像蝙蝠和翅膀(蝙蝠有翅膀)或者蝙蝠与哺乳动物(蝙蝠是哺乳动物之一)之间的概念关系的形式象征出来的知识。
在第一种看法中,蝙蝠会以一种图象的形式在记忆中与关系到自己的语言说明的形式记录下来;在第二种观点中,蝙蝠只会以一种关系的形式记录下来(如在图39中的语义网络关系中一样),虽然它不是语言的,但与“蝙蝠有翅膀”,“蝙蝠有皮毛”等等是相等的。另一个命题性的例子可以在下面的句子中看出来:
公主吻了青蛙。
及其被动态:
青蛙被公主吻了一下。
这两个句子表达的是同一个意思;它们都是语言的表达,焦点不一样,但它们是同一个命题,或者是同一个关系知识的单元。
每种观点的倡导者都有很多证据来证明自己的观点。我们早先看到罗杰·谢帕特做的“心理旋转”实验,就指明,我们看到物体时是以“心灵之眼”进行的,而且在对待这些图象时,就好像它们是三维的物体。在类似的一项实验中,阿兰·帕维沃问受试者一座钟上面的指针之间的角度是6:15还是11:25,是6:15时大些还是5:15时大些。他们回答说第一部分,因为这部分的角度差别大些,也更明显,对第二个问题的回答也快些。当受试者看着实际的钟时也是同样的情况。帕维沃合理的结论是,不看实际的钟就解决了问题的受试者是在心理之眼中“看着”这些钟的。
可是,命题论的提倡者也有同样好的证据来支持他们的观点。他们辩论说,图象不能传达像“有”,“引起”和“与……押韵”等的关系,也不能代表范畴和抽象的概念。赫伯特·西蒙和威廉·蔡斯发现,国际象棋大师只需几秒钟扫一眼棋盘就可以重复整盘棋的布局——但他们能够这样做的前提是,这盘棋必须是实际比赛中下的真棋。如果是随意摆的棋,棋子摆在任意位置上,他们就记不住了。含义是:大师的记忆不是视觉上的,而是基于几何关系——棋子的攻防移动位置。最后,计算机程序中的信息是以命题形式存储起来的,如果可计算性是一种好的认知模式,思维以同样的方式存储信息就不无道理了。
(还有第三种提法,是有些理论家赞成的,即,有好几种类型的心理代表方式:命题式的、心理模式型的、图象式的,每种方式都能在不同的抽象程度上对信息进行编码。)
对于这一点,最后的结论尚不得而知。
概要:1932年,英国心理学家弗雷德里·巴特利特给受试者讲一些非西方文化来源的民间故事,然后让他们复述故事。他们不能准确地记住故事,偶尔补充一些细节,修改一些事件,以便给发生的事件提供一些道理,并漏掉一些细节,因为这些东西对西方头脑来说没有意义。巴特利特的结论是:“记忆不是对无数固定的、无生气的和零碎痕迹的重新激发”,而是以我们自己有组织的经验体为基础的“想象性的重构,或者建筑”。他把这种组织起来的东西称作“概要”。
巴特利特的思想最近几年得到复苏。概要——也称作“框架”——现在被认为是对不同话题整合信息的包装,它们保持在记忆中,我们依靠他们来解释暗指和零散性的信息,一般的对话——甚至最有叙述性的写作是由它们构成的。1978年,当时还在圣迭哥的加利福尼亚大学的大卫·鲁美尔哈特报告了一些实验,他在这样的一些实验中给受试者读故事,一句一句地读,看他们是怎样以及何时形成对整个故事的清晰思想的。比如,当他们听到:“我被带到一间白色的大房子里,我的眼睛因为明晃晃的光线的刺激而眨巴起来”时,约有百分之八十的受试者立即猜想到,他们听的一定是在某个医院或者审讯室里的情景,并对他们听到的几个词提供了大量信息。如果下一句或者下两句与他们的猜想不一致,他们会把故事改过来,根据不同的概要重编故事。
最近进行的其它许多工作都确切地证明,我们理解并解释——或者说经常错误地解释——我们听到,看到和体验到的东西,是通过唤起我们的预期和有组织的知识结构来进行的。总起来说,记忆不仅仅是需要是可以唤醒的一种信息登记册,而且是能指导我们思维的程序。
遗忘:许多研究曾探索过,我们为什么会忘掉某些事情,但不会忘掉另外一些事情;怎样才能改善记忆力,特别老年人的记忆力,因为这些人中的大部分人都会经历某种程度的非病理性记忆力减损。(与年龄相关的正常的记忆力问题经常可以通过助记术和其它培训得以改善。还有一种可能是,就在不远的未来,人们会找到一种药物生理学的治疗办法,以重新平衡被更改过的神经传递器输出。)
一些最有兴趣的工作不仅与特定记忆的整体丢失有关,而且与重要细节及其由新材料所替代的遗忘有关。我们的法定系统在很大程度上依赖于一种假定,即如果我们记得某个事件,我们所记忆的一定就是事件的原委。法庭和许多心理治疗者也相信,遗忘的材料如果通过催眠加以检索出来,也一定就是实际发生的事件的真实记录。可是,心理治疗者早就有了证据,知道我们会修改记忆,以便使回忆出来的东西更易为自我接受。伊丽莎白·洛夫特斯也收集到了大量证据,显示一种令人震惊或者创伤性的事件会被创伤本身所扭曲,对一个事件的记忆会在一位有经验的检察官提出的有圈套的问题面前发生倾斜,随着时间的推移,我们会给记忆里增加新的信息,没有办法得出原来的真实情况。催眠有时候会检索出深埋于记忆深处的东西——有时候又会调出一些人为的东西来。
然而,我们几乎所有的人都确切地相信,某些事件永远地,准确地留在了我们的记之中,挥之不去,磨之不掉。对有些经验的回忆,如听到肯尼迪总统被刺的消息时,或者听说挑战者号太空飞船爆炸等,在心理学家们看来是“闪光灯泡记忆”,因为它们是非常生动的人生定格,很难忘掉。最近,艾莫利大学的阿尔里克·莱塞及助手尼可勒·哈尔什抓住了一次特别的机会,研究了这种现象。挑战者号空难发生(1986年1月28日)的次日,他们请一大批大学生记录了他们如何听说空难的消息。两年半以后,再请还能找到的这些回答者填写一份有关该事件的问卷,6个月后又加以采访。
有三分之一强的学生对该事件的时间、地点、谁告诉他们的,等等的回忆是完全错误的,他们在1986年的报告中的回答也是如此,另有四分之一的人有部分错误。当受试者看到他们自己原来的说法时,哈尔什和莱塞报告说:“许多人因为原来与现在的说法之间出现的差距而不安……有趣的是,许多人继续认为自己现在的说法是正确的,原来的说法可能有误。”错误是从哪里来的?哈尔什和莱塞把它们称作“叙述重构”,与巴特利特在1932年描述的类型一样。
有时候,哪怕是在快速发展的认知革命中,会发生更多此类变化……
语言
科学家从标本、事件、自然现象和这种或者那种实验发现中推论出自然法则。对认知科学家而言,可比的原始材料就是思想,可是,神经的排放,或者可以指示思想的脑波尽管可以通过示波图加以追踪,但却不能透露里面的任何东西出来。体态、表情、数学或艺术符号及演示(如在运动培训中)可以传达思想,但也只在非常狭窄的范围内。思维可以观察到的主要形式还是语言,因此,它也就堂而皇之地被称作“心灵的窗口”。
人们当然也可以说语言是思维的足迹,因为语言不仅仅传递思想,而且还在其结构中带有思维如何工作的痕迹。对通过这些痕迹显露出来的思想过程进行的研究是心理语言学家的地盘。(语言学是一门旧学科,它主要处理语言本身的特性。)
这里有一个例子,可以说明语言的痕迹:小孩子们倾向于把不规则动词和名词当作规则动词和规则名词进行处理(“小狗跑溜走了,”“那个小孩子长生了两粒牙”)。可是,他们并没有听到过成人这么说,因此也不是模仿所致。心理语言学家说,这种错误显示,孩子们能够辨认成人语音中的一些规则,如加上“ed”就可以形成一个简单的过去时,加上“s”或者“es”就可以做成名词,然后认为这种规则适用于所有动词和名词(这种倾向称作“过高归纳”)——这证明,人类思维自发地根据例子而形成概念,再把规则应用到新的情形中。
这只是心理语言学家们在语言中找到的思维过程留下的少数痕迹之一。这并不是只在英语中才有的情况。类似的情形可以在任何语言中找到,而且好像还是人类思维的特征之一。“我们对人类语言观察得越多,”洛衫矶的加利福尼亚大学领头的心理语言学家维多利亚·弗罗姆肯说,“它们越像是由同一些万有原则和制约所掌握着。”
这种万有原则当然不包括语法和词汇在内;从这个角度来看,英语、斯瓦希里语、巴斯克语可以说没有任何共同之处。可是,在听说这些语言而长大的孩子们中间,他们能够在不需要教授的情况下区别名词的单复数形式,代表过去和现在的动词形式等等,并为自己建造一套主管这门语言的规则。同样的,他们直觉地学会了掌握词序的基本规则,并能利用正常的词序建造一些简单的感叹句来。没有哪一个讲英语的孩子会说:“牛奶更多一些想我。”也没有哪个讲另外一种语言的孩子会把基本的词序搞错。
本世纪中叶以前,心理学与语言学几乎不搭界,可是,随着认知革命的到来,有些认知心理学家和语言学家看到了各自学科的新发展,并呼吁通过另外一门学科来扩张自己这门学科。比如,语言学中有关语法工作机制的某些新理论意味着,思维在处理概念时会执行一些行为主义心理学不能解释的复杂操作。1953年,一系列心理学家和语言学家在康奈尔大学举行了一次学术会议,讨论了它们共同感兴趣的领域,并采纳了“心理语言学”这个名字,以确定为语言心理学研究的名称。
心理语言学当时还是一个不太为人知道的新学科,4年以后,哈佛教授协会的一位29岁的年轻会员发表了一篇专题论文,从而使这门学问受到人们的注意。在这篇专题论文中提出来的理论,已经成为当前这个时代里心理学的两大重要发展之一(另一个是人工智能)。其作者便是诺姆·乔姆斯基,他的一些观点我们在前面已经听说过。
乔姆斯基有一头蓬松的头发,戴着眼镜,是位浑身皱巴巴的天才——可说是知识分子的典型。他差点就没有当成心理语言学家。他在大萧条时代纽约激进的犹太社区里长大,但他父亲却是一位知名的犹太学者。年轻的乔姆斯基还在小时候就已经掌握了闪族语的一些基本结构知识,也了解到语言学大致是什么东西。这两样,一样是缴进的政治学,一样是语言学,从此以后就主宰了他的一生,可有一阵子,乔姆斯基政治的一面几乎就克服了语言学的一面。他在宾夕法尼亚大学读过两年书,发现学术生活比较起左派政治生活来说十分枯燥无聊。1948年,他准备去以色列,准备在那里从事一种激进的、理想主义的阿拉伯-犹太工人阶级运动,这时,他遇到了泽尔格·哈里斯这位宾夕法尼亚大学的语言学教授。他们因为共同的政治信仰而相遇,可是,乔姆斯基很喜欢,也很敬佩的哈里斯让他对语言学产生了浓厚的兴趣,使他放弃了去以色列的打算,转而投身于语言学和左激政治运动。
当乔姆斯基遇见他的时候,哈里斯正打算发展一个基于行为主义原理的语言学系统,这个系统将能够解释语言模式而不必推论其意义。可是,他的计划有误,而且,在许多年里,乔姆斯基花了很多精力试图使其产生作用。当他达不到目的时,他放弃了哈里斯的理论,并在两年时间内形成了自己的理论。可笑的是,乔姆斯基是位左派分子,而他的学说的中心议题,如他在《句法结构》专题论文中所述的,却是说,语言知识和能力的某些方面是天生的,不是后天学成的,这个观点是左派分子、自由主义者和接受过行为主义培训的心理学家们认为是唯心灵主义和反动的。
乔姆斯基认为,孩子使听到的语言产生意义,以及获取语言的途径,不是通过语言的语法而来的,(“表层语法”,按他的说法),而是通过天生的能力来辨识听到的句子中间所包含的元素短语之间的深层句法关系而来的,这就是他称作起支撑作用的连接的“深层结构”的东西。他指出,作为一种证据,孩子们拥有一种轻松感,他们可以轻易地理解一种形式的句子转换成另一种形式的句子时的真实意义,比如,当一个陈述句转变成问句时,而且还可以自己完成这样一些转换关系。如果表层语法是孩子们所依靠的东西的话,他们可能会从转换句子中得出不正确的抽象。下面一些例子可以说明这些问题:
这个人很高。
这个人高吗?
他们会得出一个规则:从开始处着手,转到下一个出现“is(是)”的地方,或者另外一个动词,再把动词移到前面去。可是,这个规则太简单了;遇到象下面这个句子时,他们就不起作用了:
个子很高的那个人在房间里——
按理,他们会把这个句子转换成:
那个高人会是在房间里?
可是,孩子们不会犯这样的错误。他们只犯一些很小的错误,如“牙奇”,而不会犯严重的错误。他们可以感觉到思维元素之间的关系——其句法构成或者“短语结构”。正是通过这种“万用语法”的知识方法,孩子们才使自己听到的东西产生意义,并毫不费力地构造自己从没有听说过的正确句子。
孩子们是在什么时候以及以怎样的方法来获取这种万用语法和深层结构的知识的?乔姆斯基的答案完美地代表了针对行为主义理论的一场革命,因为行为主义认为新生儿是一块白板。他认为,在大脑的某个地方,有一个专门化的神经结构——他把这个地方称作语言获得器,或者叫L.A.D——这个地方是靠基因连接起来的,可以辨认由名词词组和动词词组所代表的一些事物和动作与彼此作为主动者、动作和客体之间发生联系的各种方法。
乔姆斯基和其他采纳了他的观点,或者开发出自己的观点的一些语言心理学家们开始以新的形式回答一些老问题。这在行为主义时代是不允许进行的,这些问题涉及知识是否在经验之间就存在于思维之中。他们的答案是:虽然语言本身是学习得来的,但大脑的结构殊同一般,孩子们可以自发地从他们听到的东西里面抽取语言的规则,而不需要人们来告诉他们这些规则,虽然他们会犯一些枝节性的错误,但能在构造自己的句子时利用这些规则。
尽管乔姆斯基平常很严肃认真,但他也会有很幽默的时候。为了演示一个句子元素之间的深层关系,他构造了一个完全荒诞不经的句子,从此以后变得非常出名:“没有色彩的绿色思想愤怒地睡着了。”尽管这个句子毫无意义,可它对读者来说还是与这样一句同样没有道理的句子很不同:“思想愤怒地绿色毫无色彩睡着了。”任何熟悉英语的人都会觉得,第一个句子多少让人能够忍受一些——它几乎是能够表达什么事情的——而第二个句子完全是令人不快的垃圾堆。其理由是,第一个句子遵循了表层语法和深层语法的规则,而第二个句子却没有。
乔姆斯基引发了激烈的争议,很大一部分原因是因为他的先天论思想,尽管他并没有断定天生的思想,而只是说天生能够以有用的方式体验语言的能力。有些批评家排斥L.A.D.的假设后同意说获取语言的能力的确是天生的,但他们说,那是总体的知识能力的副产品。其他觉得天生的语言获取器很难接受的一些人也在不停地寻找证据,以期对之加以反驳。最近的一位是心理语言学家菲利普·利伯曼。他说,基因传递的器官服从变异是生物学的原则。果真如此,有些孩子就具有不正常的语言获取器,因而在语言理解的某些领域里就会出现不足情形,可目前好像还没有这方面的证据。
除开这些争议之外,在三十多年时间内,心理语言学家和认知心理学家一直在收集证据,以期显示语言与思维是如何发生联系的,并希望显示出思想过程。有些人很有耐心地观察孩子在学习语言的过程中出现的错误和自我纠正行为。有些人分析语言游戏,还有一些人研究发育语言障碍,如失语症和由大脑损伤造成的获取语言的丢失疾病。更有一些人进行反应——时间实验。最后一种实验的例子是:赫伯特·克拉克及其他人发现,当给受试者显示一个简单的图案时,比如加号上面的一颗星,然后在它旁边写上一个正确的陈述句(“星在加号上面。”)或者一个真实的否定句(“星不在加号下面。”)他们说第二个否定句是正确的时间,比说第一个肯定句是正确的时间长十分之二秒。我们好像更习惯于思考什么东西是什么,而不太习惯于思考什么东西不是什么,为了处理这些句子,我们得首先把否定句改写成肯定句。
今天,许多心理语言学家研究到最后都相信,环境的确给语言获取带来很大的影响,这与乔姆斯基所认为的要多些。比如,他们强调,由“母亲亲昵之语”,即一些母亲(包括一些父亲)对小孩子谈话的特别方式,进行的非正式语言培训。然而,尽管许多心理语言学家都对乔姆斯基的L.A.D.学说的一些细节提出了疑问(他本人对此也做了进一步的完善和修改),但他们中的大多数人都同意,人类具有基因决定的能力,以理解和获取任何语言。另外,按维克多利亚·弗罗姆肯的说法:
然而,这个问题仍然存在,即,这种基因决定的语言能力是否基本上是派生的-是否是总体认知的、生理学的和其它支持人类智力的非具体系统的副产品-或者,它是不是因为一些语言学上的具体和独特的能力所致。
一系列证据在说服越来越多的科学家,即,人类的大脑不是一台“总体目标”的计算机,而是说,它可以助长的语言能力最好看作由其自身的一套不同原理规定的自动认知系统。
心理语言学家们还探索了语言与思维之间的关系中其它的一些重要问题。我们是总以词汇的形式思考问题呢,还是有时候如此?我们母语中的一些词汇是会塑成或者是会限制我们的思想?这些问题一直在进行辩论,也得到过很多的研究。这里有一些材料:
——一代人以前,语言学家本杰明·沃夫曾提出理论说,思维是由一个人的母语中的句法和词汇塑造的,并给予跨文化的证据来让他证明自己的观点。他举的一个例子是,赫必族印第安语并不在过去、现在和未来之间作出区别,至少不象我们这样区别(这是几乎全球通用原则的一个很少见的例外)。的确,赫必族人讲话时通过变调来指示他或者她是指的过去,现在或者将来要发生的事情。沃夫及其同事相应地认为,我们所用的语言会塑造我们,并影响我们看到或者思想的东西。
——另一方面,人类学家发现,在其它许多文化中,人们使用的表示颜色的词比讲英语的国家的人使用得少些,可他们体验这个世界的方式却毫无二致。新几内亚的达尼人只有两个表示颜色的词:mili(黑夜),mola(白昼),可是,对达尼人和其它缺少许多明确的色彩词汇的人进行的测试表明,他们对于色彩的记忆和他们判断色彩之间的差别的能力与我们自己的是一模一样的。至少,当谈到颜色时,他们不需要词汇就能思考。
——皮亚杰和其他发展心理学家对儿童思维进行的研究显示,语言和思维之间存在很强的相互联系。一方面是层次化的范畴,它是一种强有力的认知机制,可以使我们认知并利用自己的知识;如果有人告诉我们说,异族杂货店里有一种不熟悉的东西是一种水果,菲利普·利伯曼说,我们马上就知道它是一种植物,可食用,还可能是甜的。这种推理能力是建筑在语言中的无生的能力,并在发育的正常过程中获取的。研究显示,儿童在约18个月就开始了语言的范畴化工作,其中的一个结果就是“取名爆炸”,这是每个父母都很熟悉的一个现象。因此,利伯曼说:“特种语言并不会天生地限制人类的思想,因为两种能力[语言和思维]好像都涉及紧密相联的大脑机制。”
大脑的这些机制中,至少有一部分现在已经找到了精确的位置,有些在很早以前就发现了,是通过对失语症的研究发现的,因为失语症是由大脑某个部分的损伤或者切除造成的一种语言病症。如我们在前面看到过的,对维尼克区的切除会导致相对流畅但没有语法意义的语言;受害者要么叽吱吱地说不出话来,要么就是找不到他们需要的名词、动词和形容词。研究过失语症的哈佛认知心理学家霍华德·加德纳举出了下列例句,是从他与一位病人的对话中搞出来的:
“您以前做过什么样的一些工作,约翰逊先生?”我问。
“我们,孩子,我们所有人,和我,我们有一阵子在……您知道……工作过很长一段时间,那种地方,我意思是
说在……后面的那个地方……”
这时,我插话说:‘对不起,我想知道您做的是什么工作。”
“您说的那个,我也说过的,布马,就在那个走运的,走近的,坦布,就在3月的第4天附近。我的天,我都搞混了。”他回答说,看上去很是困惑,好像是说语言之流完全并没有使我满意。
对比而言,布洛克区受损的病人尽管能够理解语言,但要说出话来却非常不容易。他说的话支离破碎,缺少语法结构,而且没有名词和动词的修饰词。
在宏观上就知道这么多。可是,在正常人的维尼克和布洛克区内的神经网络是如何执行语言功能的,对此,我们一无所知。这些区域对心理学家们来说一直还是个“黑箱子”——其输入输出的机制是知道的,可它内部的机制却仍然是个谜。
然而,神经科学家们已经开始寻找提示了。最近,在手术期间进行电极探查、脑电图扫描和其它方法对一些语言能力受损的病人进行的大脑功能的复杂分析显示,语言知识不仅位于维尼克和布洛克区,而且还位于大脑的其它许多地方,并在需要时可以集合起来。爱荷华大学医学院的安东尼奥·达马西奥就是这样一些研究者之一。他们现在认为,关于任何物体的信息都是分布极广的。如果这个东西是比如说一只聚苯乙烯杯子(达马西奥的例子),它的外形会存储在一个地方,其易破碎性在另一个地方,纹路在另一个地方,等等。这些东西通过神经网络与“会聚区”连接起来,并从这里向一个语言区移动,名词“杯”就在这里成形。这与柯林斯和洛夫塔斯对语义记忆网络的抽象描述(图39)极为相似,奇怪而且令人鼓舞。
可是,哪怕最新的和最详细的神经科学研究,对这些区域里的神经元的发射如何变成了一种性状、一种图象或者在人的思维中形成了一种概念也只字未提。神经生理学的学说不是一种认知的学说,神经科学和心理学对同一种现象的看法是如此不同,他们也可能永远也不会连接起来。可是,这还须假以时日。
推理
十几年以前,我曾问过著名的记忆力研究者戈登·鲍尔有关思维的一些问题,我被他暴跳如雷的回答吓了一跳:“我完全不做‘思维’的工作。我不知道‘思维’是什么。”斯坦福大学心理学系的主任完全不做思维的工作,甚至一点也不了解它,这怎么可能?接着,鲍尔很不情愿地说:“我想,你可能是指对推理的研究。”
思维在传统上一直是心理学中的一个中心议题,可是,到70年代,认知心理学中知识的爆发使这个词变得不那么称手了,因为它包括一些彼此相隔很远的过程,比如暂时的短期记忆和长时期的问题求解。心理学家们喜欢以更具体的一些词汇谈及思维过程:“极度规范化”、“程序分块”、‘检索”、“范畴化”、“正式操作”及其它十几种说法。“思维”现在已经慢慢变成了一个比以前狭窄得多,也准确得多的意义:即对知识的操纵,以实现一个目标。可是,为避免任何误解,许多心理学家,比如,鲍尔,情愿使用“推理”个词。
尽管人类一直总是把推理能力看作是人性的本质所在,可是,对推理的研究长期以来一直是一团死水。从30年代到50年代,除了卡尔·登克尔和其它一些格式塔学者进行的问题求解实验,以及皮亚杰和追随者们进行的不同知识发展阶段儿童思维过程的特征研究以外,很少有人进行推理的研究。
可是,随着认知革命的到来,对推理的研究变成了一个活跃的领域。信息处理模式使心理学家可以提出一些假设,可以用流程图的形式推论在不同推理过程中发生的一些事情。而计算机又是一件很好的机器,从此以后可以用它来测验一些假设。
信息处理学说和计算机是互为协作的。一种有关任何推理形式的假说都可以用信息处理的术语描述出来,把它们看作是信息处理的具体步骤。计算机然后就可以进行编程,以执行一种类比的步骤顺序。如果这个假设是正确的,机器就可以得出与人类推理思维相同的结果。同样,如果一个给一台计算机编写的推理程序得出人类对同一个问题相同的结论,则人们就可以假设,这个程序所运行的方式与人脑推理的方式是一样的,或者至少在以类似的方式在推理。
一台计算机是如何进行这样的推理工作的?它的程序包含一个日常的程序,或者是一组指令,再加上一系列子程序,每一道程序都使用或者不使用,这取决于前一个运行的结果和程序存储器里面的信息。一种常见的程序是一系列如果-则步骤:“如果输入符合条件1,则采取行动1;如果不符合,则采取行动2。比较条件2和结果,如果结果[大于]小于或者其它任何情况,则采取行动3。否则采取行动4……存储所得的条件2,3……然后,根据进一步的结果,以这样或者那样的方式使用这些存储起来的项目。”
可是,当计算机执行这些程序时,不管是在数学计算或者是在问题求解中,它们真的是在推理吗?它们难道不是在像自动机一样毫不动脑筋地执行事先规定的行动步骤?这个问题留给哲学家比较好。如果计算机能够像可获得知识的人类一样证明一项公理,开始一台空中航行器,或者确定一首诗是否为莎士比亚所创作,谁又能够说,它就是一种没有思维的自动机,或者人类又不是这样一种自动机呢?
在1950年,当时还只有几台非常原始的计算机存在,但计算的理论却在一些数学家、信息理论家和其它一些人中进行着激烈的讨论。艾伦·特林是一位有天赋的英国数学家,他提出了一种测试法,这种方法更具哲学意味,少一些科学性,它是要测试一台计算机是否可以思想。在测试中,一台编程解决某些问题的计算机放在一个房间里,很熟悉这类问题的一个人站在另一个房间里,第三个房间里有一位裁判,他通过电报方式可以与其它两间房通话。如果裁判可以从对话中看出哪一个是计算机,哪一个是人,计算机就通过测试了:它可以思想。特林测试的有效性值得商榷,可是,至少,它可以证明,如果一台计算机好像能够思想,它所做的事情就算跟思维差不多了。
(到目前为止,还没有一台计算机能够通过特林测试。1991年11月,在波士顿计算机博物馆进行了一次特林测试。10位从大街上挑选来代表那个人的裁判,在键盘上敲出问题和说明,然后从屏幕上看到一些答案,这些答案来自好几种计算机程序中的任何一种,或者是一些看不见的人做的。最后赢得了准入的一个程序是一种商用程序,名叫PC治疗专家第三代。这里,我们从1991年11月9日的《纽约时报》第一版上摘录一些问题和答案:
PC治疗专家第三代:也许您在这种伙伴关系中没有得到另一方足够多的关心。
裁判:为了防止冲突或者问题出现,在这些关系中哪些是最为重要的关键因素?
PC:我认为您没有按我的思路考虑问题。
裁判:这哪里算是对问题的答案?下个问题:你认为男女私情是不现实的吗?是否从一开始就注定要失败?
PC:我倒宁愿闭着眼睛过日于。
裁判:你在男女私情中碰到过问题吗?
PC:我总是想法让自己逗人喜欢。
任何把这样一些牛头不对马嘴的回答看作是人类回答的裁判,他一定是对人类的对话能力有一种奇怪的理解。)
到60年代,大多数认知心理学家,不管他们是不是同意计算机真的会思维,都认为计算理论是一种概念上的突破;它使他们第一次能够以详细和准确的信息处理术语描述认知的任何方面,特别是推理。再说,已经提出有关任何此类程序的步骤的假设以后,他们可以把它们从单词翻译成计算机语言,并在计算机上进行测试。如果结果是成功的运行,则它意味着思维的确是通过某种类似这个程序的方式在推理。因此,毫不奇怪,赫伯特·西蒙说计算机是对心理学的重要程度不亚于显微镜对生物学的重要程度。也不奇怪,其它一些狂热者说,人类思维和计算机是“信息处理系统”这个种属的两个物种。
求解能力是人类推理中最为重要的应用。大多数动物都是通过天生或者部分天生的行为模式进行象寻找食物、逃避天敌和筑巢等的活动。人类解决或者试图解决大部分问题的办法,是通过学习或者创造性的推理进行的。
50年代中期,当西蒙和纽厄尔着手创立“逻辑理论器”这第一道刺激了思想的程序时,他们向自己提出了一个问题:人类是怎样解决问题的?逻辑理论器花了他们一年的时间,可这个问题却占了他们15年的时间。最后的学说发表在1972年,它已经成了这个领域从今以后的工作基础。
他们主要的工作方法,按照西蒙的自传,就是两个人的集体讨论。这涉及归纳和演绎推理,类比和比喻性的思维以及想象的驰骋——简单地说,任何种类的推理,不管是合理的还是不合理的:
从1955年到60年代早期,当时,我们每天见面……[我们」主要是通过对话来进行工作的。艾伦可能比我说得还多些。现在的情形肯定如此。我认为事情一向就是这样的。可是,我们谈话是有一定之规的,即,一个人可以瞎谈一通,可以没有道理,也可以模模糊糊,可是不准批评,除非你准备说得更准确一些,更有道理一些。我们谈的一些东西有些是有一定道理的,有些只有少许道理,有些纯粹是胡扯,就这样乱谈一气,然后听着,一次又一次地谈。
他们还进行了一系列实验室工作。不管是一个人做还是一起做,他们都会记录并分析一些步骤,把他们或者别人解决难题的步骤写下来,然后把这些步骤当作程序写下来。有一个很喜欢的难题,他们一直用了好些年,就是一个孩子的不动玩具,名叫“汉诺依之塔”。如果说最简单的,它是由三块不同大小的圆片组成的(中间都有孔),平底座上有三根坚杆,圆片就堆在这三根杆的其中一根上。一开始,最大的圆片在最下面,中等大的圆片在中间,最小的一个在顶层。问题是要以最少的步骤一次移动一个,不准把任何圆片放在另一个比它小的圆片上,直到它们都以同样的顺序堆在另一根竖杆上。
完美的解只需要7步,不过,由于移错了步骤就会引起死解,因而得退回去重来,这就需要好多步骤。在更先进的版本中,这种解需要复杂的策略和许多步骤。一种由5个圆片组成的游戏需要31个步骤,7个圆片组成的游戏需要127步,等等。西蒙曾很严肃地说过,“汉诺依之塔对认知科学的重要性不亚于果蝇对现代基因学的意义——它是一种无法估量其价值的标准研究环境”。(可是,有时候,他又把这项荣誉归结给了国际象棋。)
这个小组使用的另一项实验工具是密码算术,在这种难题中,一道简单的加法题中的数字换成了字母。目的是要找出这些字母代表哪些数字。下面是西蒙和纽厄尔简单一些的例子:
S E N D(送)
M O R E(多)
———————————
M O N E Y(钱)
第一步很明显:M必定是1,因为任何两位数——这里指S+M——都不可能加起来大于19,哪怕有进位。西蒙和纽厄尔让志愿者一边解题一边大声念,把他们所说的一切话都记下来,之后把他们的这些思想过程的步骤编进图中,表现成一个步骤的寻找轨迹、不止一个选择时交叉点的决定,走向死解的一些错误选择,从最后一个交叉处回过头来重试另一个办法等等。
西蒙和纽厄尔特别利用了国际象棋,这是一种比汉诺依塔或者密码算术难得多的复杂问题。在一种60步骤的典型国际象棋比赛中,每一个步骤平均都有30种可能步骤;只先“看”三步就意味着要看到27000个可能性。西蒙和纽厄尔希望了解的问题是,象棋手是怎样处理数字如此庞大的可能性的。答案是:有经验的象棋手并不考虑他自己下一步可能要走,或者对手可能要走的所有的可能步骤,而只是考虑几步有意义,并符合基本常理的一些棋路,如“保护国王”,“不要因为很低的价值而随便弃子”等。简短地说,象棋手进行启发式的寻找——一种由宽广的、符合棋理的战略原则引导的寻找——而不是整体但没有条理的瞎找。
纽厄尔和西蒙问题求解学说又花费了他们15年的时间,因为字母顺序的原因,纽厄尔的名字在他们的共同出版物上总是处在前面。他们的学说是,问题求解是对一种通道的追寻,从开始状态直到目标。为了实现这个目标,求解者必须通过由他可能到达的所有可能状态构成的问题空间,并通过所有符合通道限制(规则或域的条件)的步骤找到一个通道。
在这样的一些寻求中,可能性通常会呈几何级增长,因为每一个决定点都会提供两种或者两种以上的可能性,可能性下面又有若干决定点,因此而提供另一套可能性。在普通的国际象棋比赛的60个步骤中,如前面已经说过的,每一个步骤平均都有30种可能性;一场比赛中通道的总数为30的60次方到3000万个百万立方百万立方百万立方百万立方百百万立方百万立方——这个数字完全超出了人类的理解力。相应地,如西蒙和纽厄尔的研究所演示的,问题求解者在他们的问题空间里寻找他们的通道时,并不会寻找每一个可能的通道。
他们于1972年出版,并相应地称作《人类问题求解》的卷秩浩繁的著作中,纽厄尔和西蒙把他们认为是总体特征的东西提出来了。其中有:
——因为短期记忆的局限,我们是以串行的方式在问题空间中搜寻的,一次解决一个问题。
——可是,我们并不去执行对每一个可能性一个一个的串行搜寻。我们只在有很多种可能性的时候才使用这种方法。(比如,如果你不知道一小串钥匙中的哪一个可以打开朋友家的门,你只好一次试一把。)
——在许多问题求解情形里,试误法是不可行的,这样,我们就只好进行启发式的搜寻。知识使这一点变得非常有效。解决象由八个字母构成的颠倒字母构成的字这样一个简单问题,比如SPLOMBER,可能需要56个工作日,如果你把全部40,320个排列以每5秒钟一个写下来的话,可是,大多数人可以在几秒或者几分钟内解决这个问题,因为他们排除掉了无效的组合(比如,PB或者PM)而只考虑有效的组合(SL,PR,等)。
——一个常用的、重要的启发式简化法是纽厄尔和西蒙称作“最好从头开始”的方法。在搜寻通道的任何交叉点或者“决定树叉”上,我们必须先试有可能会把我们带到离目标最近的地方的那一个。每一步都试着靠近目标是非常有效的(尽管有时候我们得离开它,以便绕过一个障碍物。)
——另一种补充性的,更为重要的启发是“中值末尾分析法,”西蒙称这种方法为“GPS(总体问题求解法)的马力”。中值末尾分析法是一种前进和后退混合起来的分析法。跟只寻求前进步骤的象棋不一样,在许多情况下,问题求解者知道,他不能够直接进入目标,而只能退而求其次,先接近子目标,再从于目标接近大目标,或许,他还得退回到更早以前的子目标,或者更早更早一些的子目标。
最近回顾问题求解学说时,基思·霍利约克提供了中值末尾分析法的一个很差的例子。你的目标是要将客厅重新喷漆。最近的子目标是你可以进行喷漆操作的条件,但这要求你拥有漆和刷子,因此,你必须先到达购买这些用品的子目标。要这样做的话,你又必须先实现到达五金商店这样一个子目标。这样一直退下去,直到你完全策划好了从目前的状态到拥有一间喷了漆的客厅为止。
像纽厄尔和西蒙求解学说这样一种成就虽然了不起,可它只使用了演绎推理。再说,它只考虑到了“知识贫乏”问题求解:只应用于迷宫、游戏和抽象问题。这种方法描述知识丰富领域里的问题求解,比如科学、商业或者法律等如何,还不太清楚。
因此,在过去的二十多年时间里,一系列研究者已经把推理的调查拓宽了。有些人研究了演绎和归纳推理以之为基础的一些心理倾向;有些人研究了两种形式的推理,还有一些人研究了我们在日常推理中的情况。有些人研究过专家和新手在知识丰富领域里进行的推理差别。这些调查已经结出了丰硕的成果,给人类思维推理这片看不见的工作领域闪进了光芒。这里是一些典型例子:
演绎推理:上溯至亚里士多德时代的传统观念认为,一共有两种推理形式,演绎和归纳。演绎是从已经给定的信条中抽出进一步的信条,也就是说,如果前提是正确的,结论也应该是正确的,因为结论必然包含在前提之中。从亚里士多德经典的三段论的前提中:
所有人都有生有死。
苏格拉底是个人。
我们必然得出:
苏格拉底有生有死。
这种推理非常严密,强烈,也很容易理解,很有说服力。它得到了逻辑和几何公理的证明。
可是,许多只有两个前提,也只包含三个段的三段论却不是如此明显的;有些很难理解,大多数人都无法从中得出一个有效的结论。菲利普·约翰逊-莱尔德曾研究过演绎心理学,他举出了一个曾在实验室里使用过的例子。想象一下,一间房子里有一些考古学家,生物学家和象棋手,再考虑下述两个论断是真实的:
这里的考古学家都不是生物学家。
所有的生物学家都是象棋手。
从这两个前提中能够得出什么呢?约翰逊-莱尔德发现,很少有人可以给出正确答案。(惟一正确的演绎就是,有些象棋手不是考古学家。)为什么不能?他相信,从上述苏格拉底三段论中得出有效结论很容易,从上述考古学家三段论中抽出结论很困难,是因为这些推论在思维中表现出来的方式——即我们从中创立的“心理模式”的方式。
一些接受过正式的逻辑训练的人通常会以几何图形的形式想象这个问题,可以把这两个前提用圆圈代替,一个套在另一个里面,或者重叠在一起,或者分开单独成一体。可是,约翰逊-莱尔德的学说是以其研究为基础,并通过计算机模拟来求证的。他认为,没有接受过这方面训练的人使用的是一种更为简易的模式。在苏格拉底三段论中,他们无意识地想象着一群人,都有生有死,想象苏格拉底也与这群人有关,因而准备找到任何例外(可以超出这群人的例外,也可能就是苏格拉底)。因为没有这种可能性,因此,他们就正确地得出了苏格拉底有生有死的结论。
然而,在考古学家三段论中,他们先想象并尝试第一种,再尝试第二种,最后是第三个模式,越往后越难(我们在此略去细节)。有些人依靠第一种,不能够看到第二种会使其无效,另外一些人依靠第二种,也没有看到第三种和最困难的一种使其行不通,这也是导致惟一答案的通道。
心理模式不是错误演绎的惟一来源。实验显示,一个三段论的形式很简单,其心理模式也很容易确立的时候,一些人也容易受到自己的想法和信息的误导。一个研究小组问一批受试者说下述三段论在逻辑上是否正确:
所有有发动机的东西都需要油。
汽车需要油。
因此,汽车有发动机。
所有有发动机的东西都需要油。
奥普洛班因需要油。
因此,奥普洛班因有发动机。
认为第一个推论在逻辑上是正确的人,比认为第二个推论在逻辑上是正确的人多些,尽管这两个推论在结构上是一模一样的,只不过是用“奥普洛班因”这个无意义的词代替了“汽车”。他们受到自己对汽车的知识的误导;他们知道第一个三段论的结论是真实的,因而认为这个推论在逻辑上是正确的。可是,如他们在奥普洛班因的情况下所看到的,这个推论是不正确的,他们对奥普洛班因这个词毫不了解,他们可以辨认出来,奥普洛班因与有发动机的东西之间没有必然的重叠在内。
归纳推理:对比而言,归纳推理稍为松动一些,也不是很严密。它从具体的想法向更广泛的概念推进,也就是说,从有限的情形向总体的概括上发展。从“苏格拉底有生有死”,“亚里士多德有生有死”和其它例子中,根据自己对案例不同程度的信心而推出,“所有的人都有生有死”,尽管哪怕一个例外就会使该结论无效。
人类重要的推理当中有很多都属于这一类型。对思维至关重要的范畴化和概念形成都是归纳推理的成果,如我们在儿童如何形成范畴和概念能力的研宪中所知道的。人类所拥有的全部有关世界的高级知识——从死亡的不可避免到行星运动和星系形成的法则——都是从大量具体事例中推出概括的产品。
在模式辨认中使用到的归纳推理也是解决问题的关键。有一个简单的例子:
下个数字是什么?
2 3 5
6 9 10 14 15——
10岁的小孩子看看之后也会解答这个题;成人可以在一分钟左右看出这个模式和答案(20)。经济学家、公共卫生官员、电话系统设计员和其他许多进行对我们这个现代社会的生存至关重要的模式辨认工作的人,他们利用的正是这个推理过程。
然而,令人不安的是,研究者发现,许多人不会从进入的信息中得出演绎推理。我们经常只注意到支持现存想法的一些东西,并把它们存储在记忆之中,而忽视相反的东西。心理学家把这种现象称作“确认偏差”。丹恩·拉塞尔和沃伦·琼斯让受试者读一些有关超感知觉的材料,有些是确定性的,有些是否定性的。之后,拉塞尔和琼斯对他们的回忆进行测试。相信超感存在的人百分之百记得确定性的材料,而否定性的材料只记得百分之三十九。怀疑论者可以记住两方面的材料达百分之九十。许多类似的偏见研究发现,有强烈偏见或者种族偏见的人从负面的信息中得出有关他们仇恨或者不相信的东西的总结,或者忘记对他们的任何支持性材料。
或然性推理:人类思维的能力是进化选择的结晶,可是,我们在高级文明社会生活的时间太短了,不可能形成对统计性的或然性进行严密推理的天生能力,尽管现代生活极需要这种能力。
丹尼尔·卡恩曼和亚莫斯·特沃斯基都在这个领域里进行过大量工作,他们问一群受试者说他们喜欢哪一种:肯定拿到80美元,或者百分之八十五的机会拿100美元,当然就有百分之十五的可能是什么也拿不到。大部分人愿意拿80美元,尽管统计上的风险平均数为85美元。卡恩曼和特沃斯基作出结论说,人们一般“不愿冒风险”:他们情愿拿到确定的东西,哪怕一个风险项目更值得一赌。
我们再回到正面情形中来。卡恩曼和特沃斯基问另一群人说,他们喜欢肯定赔出80美元,或是喜欢百分之八十五的可能赔出100美元,当然也就有百分之十五的可能是一分钱也不赔。这次,大部分人宁愿赌一赌,而不愿照赔,尽管平均来说,这场赌局代价更大。卡恩曼和特沃斯基的结论是:当在获取中进行选择时,人们不愿意冒险;当在损受中进行选择时,人们会找机会冒一下险——在这两种情况下,他们都有可能作出错误判断。
后来的一项发现更引人注意,他们让一群大学生在两种解决公共卫生问题的版本前作出选择。这两种办法在数学上是相等的,但措辞不一样。第一个版本是:
假设美国正在准备防御一种罕见的亚洲疾病的爆发,它估计会使60O人丧生。有人提出了两种方案来对付该病。假设对这些方案的后果进行的、准确的科学估计如下:
如果采纳A方案,则有可能会拯救200人;
如果采纳B方案,则有三分之一的可能性使600人全部获救,还有三分之二的可能是这600人一个也救不了。
你喜欢哪一种方案?
第二个版本的故事与前面一样,只是措词略有不同:
如果采纳C方案,400人会死去。
如果采纳D方案,有三分之一的可能性是没有人会死去。但有三分之二的可能是600人全部死去。
受试者对这两个版本的问题反应差别极大:百分之七十二的人选择方案A而不是方案B,但百分之七十八的人(另一个小组)选择了方案D而不是方案C。卡恩曼和特沃斯基的解释:在第一版中,结果是以获取(拯救的生命)来描述的,在第二版中是以损失(损失的生命)来描述的。这是与上述金钱方面的实验同样的偏见,受试者的判断受到扭曲,在处于生死关头的生命和处于赌桌上的金钱上是一样的。
我们在这些情况下会作出很差的判断,是因为涉及的因素是“否直觉的”;我们的思维不愿意抓住或然性中的现实。这个缺点既影响个人,也影响整个社会。选民和选民代表经常因为很差的或然性推理而作出一些付出很大代价的决定。如理查德·尼斯比特和李·罗斯在他们的《人类推理》一书所说的,许多政府行为和在危机时期采取的政策都因其后发生的事情而被看作是有益的,尽管这些政策经常是无用或者有害的。错误的判断是由人类的倾向引起的,他们把一种结果归因于产生这个结果的行动,尽管这些结果经常是事物自然的进展所致,是从异常复归正常的自然趋势。
类比推理:到70年代末,认知心理学家已经开始认识到,逻辑学家认为是谬误推理的很多东西实际上是“自然”或者“行得通的”推理——不准确,不严密,直觉型的,而且从技术上讲也是无效的,但经常是合宜的,而且是有效果的。
这样的思维当中的一种就是类比。每当我们认识到,一个问题与另一个不同的问题,即,我们大家都很熟悉也知道答案的问题是可以类比的时候,我们会跳跃式地直接进入结论。比如,许多人在组装一件散落的家具或者机器零件时,根本不看说明手册而直接凭“感觉”动手——寻找各零件之间的关系,并在不同的家具或者机器零件之间寻找他们以前组装过的东西的类同之处。
类比推理是在儿童心理发育的晚期阶段形成的。最近一直在进行类比思维研究的认知心理学家迪德尔·金特纳,她问5岁的孩子和成人说,云彩和海绵在哪些方面相像?孩子们以类似的特点回答问题(“它们都是圆圆的,毛绒绒的”),而成人则以相关的类似点来回答(“它们都吸水,而且都能挤水出来。”)
金特纳把类比推理看作是一个域和另一个域之间的高级关系他说:
在我看来,这些程序里没有一个堪与人类思维过程的复杂性相提并论。“人工智能”程序与人类不一样,它们倾向于是专心一致的,不可能分心,也没有感情。再说,它们一般从一开始就配备有解决一个问题所需的全部认知材料。
然而,这位权威性毫不亚于赫伯特·西蒙的人却从范畴上确定地说,思维和机器是类似的。1969年,在一系列收集在《人工智能科学》一书中的讲座中,他提出,计算机和人类思维都是“符号系统”——能够处理、转变、精确而且一般也能操纵各种各样的符号的物理存在。
在整个70年代,专心至致的心理学家中的少数人和麻省理工学院、卡耐基-默伦大学、斯坦福大学和其它一些大学的计算机科学家们狂热地相信,他们已经面临着一种巨大的突破,因而开发出一些既可以说明思维的工作原理,也是人类思维的机器翻版的程序来。到80年代初期,这项工作已经扩张到了好几所大学和一些大公司的实验室里。这些程序可以执行像走国际象棋、对句子进行语法分析、把一些基本句子从一种语言翻译成另一种语言和根据大量光谱数据推论出分子结构这样一些各种各样的活动。
狂热者认为信息处理解释思维的工作原理的能力无边无际,人工智能通过执行同一些过程而检测这些解释的能力也没有什么限制,他们相信这些程序最终会比人类做得更好。1981年,哥达德太空研究院的罗伯特·杰士特罗预测说,“到1995年左右,按照现在的趋势,我们将看到硅制的大脑这种突然出现的生命形式,它们会与人类展开竞争。”
可是,跟赖塞尔一样,有些心理学家感觉到,计算机只是对思维某些方面的机械模拟,心理过程的计算模式只是很差的一个方面。赖塞尔本人到1976年的时候,也对信息处理模式“非常失望”,当时,他出版了第二本书,即《认知及现实》。赖塞尔深受詹姆斯·吉布森和他的“生态”心理学的影响,他在该书中提出,信息处理模式太过狭窄,与现实生活中的知觉、认知和有目的的活动离得太远,而且不能把我们从周围的世界里持续不断地吸收到的经验和信息考虑在内。
其它一些心理学家虽然没有说他们深感失望,但他们还有想办法扩宽信息处理的观点,以将思维对概要、捷径和直觉的利用,以及其同时在有意识和无意识层次上并行展开模拟过程的能力(这是个关键的话题,我们随后将谈到这一点)。
还有另外一些人提出了挑战,认为一些编好程序,以便像人类那样去思维的计算机根本就没有在思考问题。他们说,人工智能一点也沾不上人类智力的边,虽然它也许在计算方面远胜人类思维能力,可是,它却永远也不可能轻松地,或者完全不可能从事人类思维日常毫不费力就能完成的工作。
最为重要的差别在于,计算机不能理解它自己正在思考的问题。约翰·塞尔和休伯特·德赖弗斯两位都是贝克莱的哲学家,还有麻省理工学院的计算机科学家约瑟夫·魏森包姆以及其他人都认为,计算机在按编程进行推理工作时,只会操纵符号,根本不了解这些符号的意义或者含义。比如,总体问题解决器也许能够推算出父亲和两个孩子怎样过河,但是,它们只能以代数符号进行这项工作;它不知道一只船、父亲和孩子是什么,“沉船”以后会意味着什么,他们沉下水里后会发生什么事情,也不知道这个现实世界里的任何东西。
这些设计用来帮助人们进行问题求解工作的程序,一般会用英语问这些操作程序的人,用答案和它们自己存储的知识在一种推理的决定模式上移动,从死点上走开,把寻找范围缩小,最后到达一个结论,对此,它们再分配一个比率(“诊断:红斑狼疮;可靠性:O.8”)。到80年代中期,几十种这样的程序已经在日常的科学实验室里、政府部门和工厂里使用着,到80年代末,这个数字已经达到数百种之多。
然而,虽然专家系统的聪明之处是一些银行计算机、航空订票处的计算机以及其它一些场合的计算机所不具备的,但是,在现实中,它们不知道它们所处理的现实世界信息的意义,不是我们了解的那一种。卡杜塞斯是一种内科咨询系统,它可以诊断五百种疾病,诊断效果与高级医疗人员可以说相差无几,可是,一本权威的教科书,《建立专家系统》却说,它“对所涉及的基本病理生理学过程一无所知”,也不能思考一些处在它的专业知识以外,或者处在其周围的医学问题,哪怕只需要最普通的常识也不行。一种医学诊断程序在一位用户问及羊水诊断是否有用时也不能够提出反对意见;这位病人是位男士,而系统却不能够“意识”到这是个荒谬的问题。如约翰·安德森所言:“人类专家能够很好地解决的一些难题就是了解可以利用知识的环境。一台逻辑发动机只有在环境被仔细地规定好了以后才会得出合适的结果。”可是,为了像人类那样广泛而丰富地确定环境,将需要无法想象的数据和编程工作量。
除了其它一些反对人工智能会思想的论断的说法以外,还有下面这些意见,它们是由许多心理学家和其它的科学家提出来的:
——人工智能程序,不管是专家系统型的,还是具有更广泛推理能力的程序,它们都没有对自我的感觉,也不知道它们自己处在这个世界里的位置的感觉。这就严重地限制了他们进行现实世界思考的能力。
——他们不能,至少目前不能直觉地,或者大致地推理,也不能创造性地思想。有些程序的确能够生成新的办法来解决一些技术问题,可是,这些只是对现存数据的重新组合。另外一些程序写出了诗歌,编出了音乐还画出了油画,可是,它们的产品并不能在艺术世界里留下痕迹;如约翰逊博士的经典说法,它们“就像是狗踮着脚走路。走得不太好,可是,你会很吃惊地发现,它竟然能走了。”
——最后,它们没有感情,也没有身体的感觉,尽管在人类当中,这些都会深刻地影响、指导而且还经常误导思维和决定。
尽管如此,信息处理的比喻和计算机都已经在人类推理能力的调查中发挥了至关重要的作用。信息处理模式已经产生了大量的实验、发现和有关以系列方式发生的认知过程的洞见。而信息处理学说可以建立在上面,并得以确立或否定的计算机已经成了无法估价的实验室工具。
然而,信息处理模式的缺点和人工智能模拟的局限都已经在过去的10年里,导致了认知革命的第二阶段的到来:即修改极大的信息处理范式的出现。它中心的概念是,尽管信息处理的串行模式适合认知的某些方面,但是,大多数——特别是更为复杂一些的心理过程——都是一种很不相同的模式,即并行处理的结果。
事有奇巧——也许可说是不同思想的互相滋润——这与最近的大脑研究结果十分相符。最新的大脑研究显示,在心理活动中,神经脉冲不是沿单向通道从一个神经元向另一个神经元前进的,它们是通过多种内部交流电路的同时激发而自发产生。大脑不是一个串行处理器,而是一台庞大的并行处理器。
与这些发展相匹配的是,计算机科学家们一直在创立一种新的计算机建筑模式,连锁和内部交流处理器可以并行工作,以极复杂的方式影响彼此的操作,可以比串行计算机更接近大脑和思维的运作。这种新的计算机建筑不是以大脑的神经元网络为模式的,因为它们当中的大多数仍然没有绘制成图,也太复杂了,复杂得无法复制,可是,它的确可以用自己的方式进行并行处理。
这三种发展的技术细节不在本身的范围之内。可是,它们的意义和重要性却是本书必须重视的。让我们来看看可以怎样利用这些东西。
新模式
一位法国数学家亨利·彭加勒1908年花了15天的时间想研究出法奇森函数理论,但没有成功。他接着放下工作进行一项地质探险活动。正当他上汽车与一位同行的旅行者谈话时,答案突然出现在他脑海里,非常清晰,毫不含糊,他甚至没有中止自己的谈话以便验证这个理论。当他后来去验证时,答案证明是正确的。
创造力的年鉴里满是这样的故事;这表明,思维可以同时进行两种(或者更多)思索,一种是有意识的,另一种是无意识的。传说不是科学证据,但是,在认知革命的早年,好多种对注意力进行的实验的确证明,思维不是一种单一的串行计算机。
这样的实验中最出名的一项是在1973年进行的。实验者詹姆斯·拉克纳和梅里尔·加勒特告诉受试者们戴上耳机,只注意左耳听到的东西,而不管右耳听到的内容。他们的左耳内听到的是一些含义模糊的句子,比如:“这位军官弄出火苗,示意进攻”;而同时,有些人在右耳却可以听到一个句子,可以清楚地解释一个模糊的句子,如果他们注意听的话。(“他把灯熄掉。”)而其它一些人听到的却是一些不相关的句子。(“红人队今夜要连赛两场。”)
事后,没有哪一组能够说出他们的右耳听到了什么。可是,当问及含义模糊的句子的意义时,那些用右耳听到不相关句子的人被分成两组了,一组是听到含义模糊的句子后说是扑灭火苗,另一组是听到句子后说是弄出火苗来。大多数听到过解释性句子的人都说是扑灭了火苗。很明显,解释性的句子被同时和无意识地与模糊的句子一起处理了。
这是好多理由中的一个理由,说明70年代为什么会有一些心理学家开始提出一种假设,说思维不是串行处理的。另一个原因是,串行处理不能解释大部分的人类认知过程,神经元太慢了。它是以毫秒进行操作的,因此,发生在一秒左右时间内的人类认知过程只能补偿不到100个串行步骤。很少有过程是如此简单的,而许多过程,包括知觉、回忆、语音读出、句子理解和“配对”(面孔辨认模式)在内,都要求大得多的数字。
到1980年左右,一系列心理学家、信息理论家、物理学家和其他一些人开始开发详细的并行处理系统工作模式的理论。这些理论特别专业,涉及高等数学、符号逻辑、计算机科学、概要理论和其它的神秘莫测的东西。可是,这场运动的领袖之一大卫·鲁麦哈特最近以简单的话,总结了鼓励他和15位同事开发出自己的“并行分配处理”(PDP)理论的那种思想:
尽管大脑的元件很慢,可它们的数量庞大。人脑装有数十亿这样的处理元件。它不是组织许多串行步骤的计算,如我们在一些步骤很快的系统中所看到的一样,人脑一定是在用许许多多的单元以协作和并行的方式执行它的活动。除开其它的以外,这些设计特性我相信会导致对计算的总体的组织,它与我们已经习惯的方式一定有很大的不同。
PDP还在对信息如何存储的解释上面与当时使用的计算机比喻有很大的不同。在计算机中,信息的存储是以其晶体管的状态保留下来的。每只晶体管要么是开着,要么是关闭的(代表0和1),一连串的0和1代表用符号表示的各种各样的信息的数字。当计算机运行时,电流保持这些状态和信息,当你关掉机器时,一切就会丢失。(依靠磁盘进行永久存储完全是另一码事;磁盘在操作系统之外,正如书面的记事薄处于大脑之外一样。)大脑不可能是按这种方式存储信息的。一方面,神经元不可能是开或闭的状态,它会从其它成千上万的神经元中增多输入,在到达一定量的激发时,会把一个脉冲传送到其它神经元中去。可是,它保持激发状态的时间不会超过几分之一秒,因此,只有很短时的记忆是通过神经元状态存储起来的。而且,由于记忆在大脑因为睡眠或者因为麻醉而处于无意识状态时不会丢失,事情一定是,大脑中的长期存储一定是以其它的某种方式获取的。
这个因为大脑研究而获得的新观点是,知识不是以神经元的状态而存储的,而是通过经验形成的神经元之间的连接形成的,或者,如果是机器,就是在一种并行分配处理器的“单元”之中。如鲁麦哈特所言:
几乎所有的知识都包含在执行任务装置的结构之中……它就装在这个处理器本身里面,直接决定处理的途径。它是通过对连接的调谐获取的,因为这些东西就在处理中使用,而不是作为说明性的事实形成和存储起来的。
这种新的理论相应地也就称作“连接主义”,这是当前认知学说中第一号新词。过世的艾伦·纽厄尔不久前说,连接主义者认为他们的学说是认知心理学的新范式,他们的运动是第二次认知革命。
鲁麦哈特和两位同事划的一张图可以使PDA学说更清楚明白一些,如果你愿意花几分种时间分析一下的话。它不是大脑某块组织的细图,可是理论化的连接主义者所认为的网络图的一部分:
连接主义者所认为的网络假想图例:
第1到第4单元接受外部世界的输入(或者这个网络的其它部分),加入来自第5到8单元输出的反馈。这些单元之间的连接是由没有标上数字的圆圈象征性地指示出来的:打开的圆圈越大,连接越强,填满的圆圈越大,受抑制越强,传递的干扰就越大。因此,第1单元不影响第8单元,但会影响第5,6和7单元,影响的程度各个不同。第2,3或者4单元都影响第8单元,影响的程度很不相同,而第8单元反过来也向输入的单元发出反馈,对第1单元的影响几乎没有,对第3和4单元的影响很小,对第2单元的影响极大。所有这些都是同时进行的,并得出一个输出排列,与信号过程和并口设计中的信号输出形成对照。
尽管鲁麦哈特及其同事说,“PDP模式的吸引力毫无疑问会因为其生理可行性和神经灵感而得到极大的加强”,但是,图中的单元不是神经元,其连接也不是突触连接。这个图代表的不是一种生理的存在,而只是里面发生的事情;大脑的突触和这个模式的连接是以不同方式运作的,禁止某些连接,而同时又加强另外一些连接。在两种情况下,这些连接是这个系统知道的东西,也是它对任何输入作出的反应。
这里有一个简单的图示:在这幅图中,被墨迹部分盖住的是什么字母?
你可能立即会说,被盖住的这个字是RED(红色)。可是,你怎么知道的?盖住的每个字母都有可能是别的字母,而不是你所认为的那一个。
鲁麦哈特和杰伊·麦克莱兰德对你的猜技是这样解释的。第一个字母里面的竖线是输入你的认知系统的一个输入,它与存储着R,K和其它字母的那个单元有很强的联系;斜线连接着R,K和X。另一方面,看见这些线条中的每一根并没有跟——人们也可以说禁止跟——代表圆角字母如C或者O的单元连接起来。同时,你从第二个字母中看到的东西与登记着F和E的单元有强烈的联系,因为经验已经确立了RE但没有把RF当作一个英语单词的开始。以此类推。许多连接都在同时并行操作,它们使你能够立即看到RED这个词,而不是任何别的词。
在更大的一个范围里来说,信息处理的连接主义模式与认知心理学研究中其它开创性发现的成果十分吻合。比如,我们可以考虑一下图39中的语义记忆力网络中已知的东西。网络中的每一个结点——比如,“鸟”、“金丝鸟”和“歌唱”,都对应于某个连接主义模块,有点像最后一个图中全盘的排列,但也许是由成千上万个单元而不是这八个单元构成的。想象一下,足够多的该类单元模块会登记下存储于大脑中的所有知识,每个模块都与相关的模块有好几百万种连接,而且……可是,这种任务对于想象来说的确是太浩大的一个工程。连接主义者的思维建筑不再有可能把它整个的图景像表现宇宙结构一样表现出来。
连接主义模式是对实际大脑结构和功能的强烈类比。弗朗西斯·克里克曾因与人共同发现了DNA结构而分享了诺贝尔奖,现在又在索尔克研究院研究处于前沿阵地的神经科学,他说,大脑的概念作为一个复杂的大型并列处理器层次结构,“几乎可以肯定地说是沿着右边的线路前进的。”保尔·切尔奇兰和帕特里夏·切尔奇兰都是认知科学中的哲学家,他们总结当前的大脑结构知识时说,大脑的确是一个并行机器,“信号是同时在成百上千万不同的通道中进行处理的”。神经元的每一种集合都会向其它集合发送成百上千万的信号,并从这里接受返回信号,用以修正其这种或那种输出。正是这些反复不断的连接模式才“使大脑成了一台真正充满动力的系统,它连续不断的行为既十分复杂,而在某种程度上又不依赖于其周边的刺激”。因此,笛卡儿才有可能整个早晨躺在床上胡思乱想,正如许多心理学家后来也如法炮制的一样。
也许,最了不起的发展是计算机与思维之间的关系的变化。一代人之前,好像是说计算机是一种模式,通过它,推理的思维可以被理解。现在,这个秩序反过来了。会推理的思维是一个模式,通过这个模式,更聪明的计算机就可以建成了。最近几年,计算机工程师们一直在设计和建造并行计算机,其线路的连接将会使64000个处理单元同时操作,并彼此发生影响。同时,人工智能研究者也在编写程序,使其能模拟小型神经网络的并行处理,这种模拟相对于约1000个神经元。他们的目的是多重的:要创造比基于串行处理更接近聪明一些的智能程序,要编写出能模拟假设的心理过程的程序,这样,它们就可以在计算机上进行测试。
这是一个很好的嘲讽:使思维成为可能的大脑到头来成了一种机器的模型,而这种机器一向被认为比大脑聪明一些,这个模型是如此复杂,如此繁锁,以致于目前只有计算机才能干好这件事,只有计算机才能处理对它进行的微型模拟。
如最伟大的的赞美诗作者大卫在25个世纪以前,在认知革命和计算机时代之前所赞叹的:“我要称赞您;因为我是在惶恐中诞生,我乃天赐而成。”
|