另外一种运动效应是理发店标志牌错觉(barbers pole illusion)。因为圆柱上有螺旋条纹,当它绕长轴旋转时,条纹看起来不是在转动而是在顺其长轴方向运动,通常是向上运动。(这将在第十一章中作充分讨论J因此,我们的运动知觉并不总是直接的。在这种情况下,你看到的并不是每个条纹的局域运动,而是大脑错误地把它想像为整个模式的全局运动。
下面我们稍微提一下另外一些视觉恒常性。一个物体看上去总是大致相同的,即便我们没有直视它,使得它落在了视网膜上的不同部位也是如此,如果我们在不同的距离观察一个物体,物体的视网膜图像可能变大或变小或产生一定的旋转。然而,我们同样将它看做是同一物体。我们将这些恒常性视为理所当然的事情。但简单的视觉机器却无法做到这一点,除非它具备发育成熟的大脑所具有的完成该任务的固有装置。大脑到底如何完成这些任务,我们仍然不十分清楚。
要获得颜色信息,就需要不只一种具有不同波长响应曲线的光感受器。它们的响应曲线是部分重叠的。但是,一个具有同一波长的光子流,对不同的光感受器引起不同程度的兴奋。大脑利用这些不同兴奋的比例,确定落在视网膜上某点光的"颜色"。
换句话说,大脑需要一个合理的解释而不是奇特的解释。这就意味着,这种解释不因观察点的微小变化而发生根本改变。这是由于,在过去当你看一个物体时,你常常在景物中运动,因此,你的大脑已经把该物体的各个不同方面记录了下来,并认为它们属于同一个事物。
①这种从背景分离图形的任务提出了一个困难的理论问题,因为大脑必须在不知道什么是图形的情况下进行图形背景分离。
让我们举一个(过分简单的)例子。一个红色方块在屏幕上闪烁很短的时间,再隔一段时间后,在离红方块不远的地方紧接着出现一个闪烁的蓝色三角形。如果时间、距离等参数选取得使长程系统占优势,那么观察者就会看到红方块变成蓝三角并从一个位置移到另一个位置的表观运动。另一方面,如果选择的参数主要激发短程系统(时间间隔和距离都很小),那么观察者将只看见运动而看不见运动的物体。他感受到运动但不知道什么在运动。在大多数情况下,两种系统在某种程度上可能同时起作用。只有精心设计的刺激才会仅仅激活一个系统。
运动和颜色之间具有奇怪的相互关系。大脑的短程运动系统有些色盲,它主要观看黑白图像。利用演示很容易说明这一点。将仅有两种均匀亮度的颜色(比如红和绿)构成的运动模式投射到屏幕上。然后调节两种颜色的相对亮度,使它们对于观察者来说看起来具有相同的亮度。这一过程必须对每个人分别进行,因为你和我的色平衡点不会完全相同。①这一平衡条件被称为"等亮度"。
另外一个距离线索是纹理的梯度变化。如图16所示。你只要看到这种草地的图,就会立刻产生草地逐渐离你而去的印象。这是由于,页面上的草叶自下而上逐渐变小的缘故。你的大脑不会将它看成是一面平坦而垂直的墙,在它的下面草长得比较高,而上面草长得比较矮:而是把它看成一个伸向远方的具有均匀高度的草坪。
①一小部分人似乎缺少真正的立体视觉。
这种情况的幻觉边界主要由于了组线段的端点排成了一条线。机场中的"线"出现的原因有多种,如物体(如衬衫)的图案或斑马的条纹以及阴影等。一个遮挡背景的物体经常会截断背景中的线。在这种情况下,线段端点产生的虚幻轮廓将会勾画出这一物体的轮廓,就像图15那种故意设计的图形那样。正如心理学家拉马参准(V.S.Ramachandran)所说:"虚幻轮廓的感觉可能比真正的轮廓还真实(对我们更重要)。"
①严格他讲,我们大家都是色盲。因为除了像紫外线这一类我们不能看见的波长外。可以构造出任何数目的、在我们看来是完全相同的波长分布;而它们如果用一个合适的物理仪器去测量,实际上并不完全相同。除了少数情况有保留外,我们对任一波长分布的响应可以与仅仅三种波长的合适组合相匹配。这是早在19世纪就已确认的事实。按数学术语,颜色是三维的。
请看图12。你很可能将它看成是具有均匀灰度的一些小正方形的组合体。现在,如果把它弄模糊(摘掉眼镜、半闭着眼睛或将它放到房内的远处),你就可能认出是林肯的面孔。图的细节(小正方形的边缘)干扰了识别过程。当视觉变得模糊时,这些细节就不那么显眼了。这时,尽管由于图像中只有较低的空间频率信息,因此图像仍然有些模糊,但是你却能认出他的面孔了,当然,一般说来,不论低空间频率或高空间频率对解释图像都有帮助。
这便是格式塔心理学家马克思·沃特海默(Max Wertheimer)。沃尔夫冈·科勒尔(Wolfgang Kohler)和库尔特·科福卡(Kurt Koffka)的主要研究兴趣之一。这场运动于1912年前后在德国兴起,并在美国结束。纳粹掌权后,他们三人全部离开德国。我的词典将"格式塔(gestalt)"定义为"一个各部分之间相互影响的有机整体,而整体大于各部分之和。"①换句话说,你的大脑必须根据你以往的经验和你的基因中所体现的远古祖先的经验,通过发现各个部分的最优组合,主动地构造这些"整体"。这种组合最有可能对应于真实世界中某个物体的有关方面。很明显,重要的是各部分之间的相互作用。格式塔学派试图对视觉系统共同的相互作用类型进行分类,并把它们称为知觉定律。他们的组合定律包括接近性、相似性、良好的连续性和封闭性。下面让我们依次对它们进行讨论。
当你观察眼前较近的真实景物时,你可以通过闭上一只眼睛亲自体验一下什么是体视。对大多数人而言,此时的深度感并不像同时使用双眼时那么强。(当然,由于上面提到的其他深度线索的存在,即使闭上一只眼睛,你仍可具有较好的深度感。)另一个明显的例子就是建筑、城市、风景等的写生或摄影。在这种情况下,两只眼睛就能使大脑推断出画面是平面的。实际上,用单眼仍然可以获得较生动的深度感觉。只要你站在一个没有玻璃反光的位置,并用手挡住图画的框架。这些动作去除了图画表面的某些平面线索,使得艺术家在图画中用于表达深度信息的线索产生较强的效果。
①大脑如何利用视差是个值得重视的理论问题。比如,需要弄清楚,一只眼睛的图像中的哪个特征与另外一只眼睛的哪个特征相对应。这称为"对应问题"。最初认为,要解决这个问题,大脑首先要识别物体,在贝尔实验室工作的匈牙利心理学家贝拉·朱尔兹(Bela Julesz),用随机点立体图进行的精彩的实验清楚地显示,两图之间的"对应"可以在先于物体识别的、低水平的信息处理阶段实现。
现在,我们对视觉心理学的复杂性已有了大体的了解,显然,观看并非是一件简单的事情。这与我们仅凭日常经验作出的猜测有很大的差别。它的工作方式还没有被我们完全理解。它涉及许多我们不得不略去的实验和概念。下一章我们将涉足看的两个其他方面——注意和短时记忆,用来拓宽我们的研究领域。它们都与视觉意识有紧密的联系,而且还会引人不同视觉加工所需时间这样一个十分棘手的课题。
大脑利用运动线索获得变化中的视环境的附加信息。我已经描述过,在某些情况下如何从运动恢复结构,还可以通过其他方式利用运动信息。一个正朝你眼睛跑过来的物体会产生一个逐渐膨胀的视网膜图像。如果一个屏幕上的物体突然增大,你就会感到该物体正向你冲过来(尽管屏幕还在同一距离)。这种视觉图像运动被称为"膨胀"。它产生的效果是如此鲜明,以至人们怀疑大脑中有一个特殊的部位对图像的膨胀加以响应。事实上这个部位已经被发现(见第十一章)。
运动情况又怎样呢?视觉系统对运动感兴趣的原因是明显的。当你看电影时,尽管银幕上看到的是一系列快速呈现的静止画面,而你却具有运动物体生动的印象。这种现象称为"表观运动"。在这种相当人为的情况下,视觉系统可能会出现失误。汽车或马车轮子的辐条有时看起来会向相反方向转动。一般说来,它发生的原因已很清楚。这大体上是由于大脑把一幅图像中的一根辐条与下一幅图像中离它最近的那根辐条联系起来引起的。由于轮子在不停地转动,被联系在一起的可能并不是同一根辐条,而是其他邻近的一根。由于所有的辐条看起来完全一样,大脑很可能把相邻两幅图像中两根不同的辐条联系在一起。如果联系在一起的两根辐条所在的位置完全相同(相对于汽车),则轮子看起来就会是静止不动的。如果转速稍微放慢一点,则轮子的辐条看起来就会向后转动。特别是旧式电影中,这种现象时有发生。当汽车减速时,辐条看起来就改变方向(相对于汽车的运动)。心理学家们已经做了大量实验,试图确定获得好的表观运动所需要的条件。
①这可能或多或少地依赖于估计信息内容时采用的是哪些"基元"(primitives)。
但是,这一论证是不充分的。因为他没能证明,盲点处的信息无法推论出来。他只是说明大脑可能没有进行这一推论。说大脑肯定没有完成这件事情的必需机制也是不正确的。对大脑的细心研究表明,确实具有某些神经细胞有可能完成这一任务(见第十一章)。
需要注意的是,大脑中因伤害形成的盲斑与眼睛真正的盲斑两者所引起的结果具有重要的区别,对于后者,填充差不多是立刻完成的。在大脑损伤的情况,这个过程则需要若干秒。这大概是由于损伤失去了大脑中快速填充的部件。
对一个动物来说,出色地完成此类任务是至关重要的。否则,它就很难发现天敌或猎物以及苹果之类的其他食物。它必须能把图形和背景分离开来。所谓的伪装物就是试图混淆这一过程,伪装的作用是破坏表面的连续性(如战士穿的迷彩服),并产生一个易于混淆的轮廓,从而使真实的轮廓伪装起来。颜色也可能与背景混杂在一起。一只蹑手蹑脚移动的猫不时地停下来,就是为了避免给猎物提供任何运动线索。正如有人所认为的那样,我们由进化获得的良好的颜色视觉,使我们的灵长类祖先能够在纷乱的绿色背景中发现红色的果实。能给我们带来众多视觉乐趣的东西,可能就是最初发现食物和识破伪装的装置。
正如我们在后面章节将会看到的,在某种程度上,大脑对不同类型信息的处理是在不同的平行通路中实现的。因此,对如何观看形状、运动、颜色等过程分别进行研究是有道理的,尽管这些过程具有某种程度的相互作用。
我们对最早阶段视觉加工知识的了解,部分来自于对眼和脑的研究(参见第十章)。需要执行的最早操作差不多是去除冗余信息。眼中的光感受器对落人眼睛的光强起反应。假如你观察一面完全均匀而光滑的白墙,那么你眼内的所有光感受器将会对光作出同样的反应。有什么理由将所有这些信息传递给大脑呢?对眼底视网膜来讲,最好是先对这些信息进行处理,使大脑知道哪里是空间上光强变化的地方——墙的边缘。如果整个视网膜区域没有光强变化,那么就不发送任何信号。大脑从"无信号"就可以得出"无变化"以及墙的这一部分是均匀的推论。
——托马斯·里德(Thomas Reid)
格式塔的相似律是说,我们将那些明显具有共同特性(如颜色。运动、方向等)的事物组合在一起。如果你看见一只正在跑的猫,你就会把它身体的各个部分组合在一起。因为一般来讲,当猫跑时,它的各个部分会在一个方向上运动。同样原因,正在树丛中爬行的猫也会被识别出来。但是,如果它纹丝不动,我们就很难发现它。
颜色知觉也并非像看起来那样直截了当。基本的观点认为它与眼内不同类型的光感受器有关。每种光感受器只对有限波长范围内的光起反应。重要的是我们应当意识到,单个光感受器的反应怎么会不依赖于输入光子的波长。一个光感受器可能捕获一个光子,也可能捕获不到。如果确实捕获到,则不管光子的波长如何,其效果会完全相同。但它响应的概率却依赖于波长。某些波长激活它的概率很大,某些波长则很小。比如,它可以经常对"红"光子起反应,却很少对"绿"光子有响应。
长程运动系统似乎与物体运动的登记(register)有关。它不仅仅登记运动本身,而且还登记是什么物体从一个地方运动到另一个地方。长程运动系统受注意的影响。
现在,如果你在屏幕上观看一个绿色背景上的红色运动物体,而且两种颜色调整为等亮度,那么其运动速度就显得比实际情况慢得多,甚至可能停止运动(特别是当你注视屏幕的一侧时,情况更是如此)。这是因为你大脑中的黑白系统将屏幕看成是均匀灰色(因为两种颜色是等亮度的),所以短程运动系统几乎得不到运动信息。
为了强调这一结果,拉马参准又将其他几个类似的圆环放入被试者的视野中,当这些图形呈现之后(其中一个圆环围绕盲点,其他圆环放在别处)。被试者报告说,他不仅看到盲点区域的完整圆盘,而且看到圆盘立刻"跳出"(popout)。这表明,被试者的注意立刻被圆盘所吸引,这和你睁开双眼观看黄色环组成的随机阵列中有一个实心圆盘时的情况完全一样。明显与圆环不同的圆盘会立刻跳出在你前面。正如拉马参准所说,你确实对盲斑进行了填充,而不是仅仅忽略了那里存在的东西。因为,被忽略的东西怎么能真正跳出来呢?
偶尔,这种解释也可能是模棱两可的。凝视一会儿该图或者将页面倒置,你就会把凹陷看成突起,或把突起看成凹陷(注意,这种变化是同时发生的)。你的大脑最初认为,照明光来自某一侧,但倘若照明光实际来自另一侧,那么同样的阴影就会对应不同的形状,正如你所看到的那样。
线条能产生两种与遮挡有关的神奇效果。图2所示的卡尼莎三角属于第一种。白色三角形的虚幻边界是由黑色缺损圆盘的直线边界的延伸形成的。另一种效应如图15所示。
大脑在决定哪些视觉特征属于某个物体时,要依赖于大体上符合格式塔知觉定律的明显的视觉线索。因此,倘若一个物体较坚实(接近性)、具有明确的轮廓(封闭性)、朝一个方向运动(共命运),而且整个为红颜色(相似性),那么,我们就很可能认为这是一个运动的红球。
所有这些例子都说明,大脑可以从视觉场景的多个不同方面抽取有用的视觉信息。那么,如果外界提供的信息不完整,大脑如何处理呢?眼睛的盲点就是一个很好的例子。如我们在第三章中讲过的那样,你的每只眼睛中都有一个盲点,你的大脑会对它进行"填充"。因此,即使你闭上一只眼睛,也看不到视场中盲点处有一个洞。哲学家丹·丹尼特(Dan Dennett)不相信存在填充过程。在他的(意识的阐释)(Consciousness Explained)一书中,他正确地争辩说"信息的缺失不等于缺失的信息。"他还说:"你要看见洞,大脑的某个地方就必须对反差作出响应:或是内外边缘之间的反差(但在这个位置,你的大脑没有完成该任务的装置),或是前后之间的反差。"因此,他认为不存在什么填充,只是缺少那里有洞的信息。
另一个令人信服的线索是"从运动恢复结构"。这是说,如果一个静止物体的形状难以看清楚(经常是由于缺少某些三维形状线索),那么稍微转动一下该物体就容易识别了。在讲课时,如果把一个由小球和辐条制成的复杂分子的模型投影在屏幕上,就不易理解。但如果播放它的转动模型的电影,其三维形状就会一目了然。在电视节目《生命的故事》的片尾,你可能看到过这种情景。在那里,DNA分子的模型随空中的音乐而旋转。
让我们先从形状开始,很明显,抽提轮廓对于大脑非常有用。这就是为什么我们对线条图能如此容易地产生反应的原因。即使没有任何阴影、纹理、颜色等特征,你仍然可以对某景物的线条图形作出解释(如图11)。这说明,大脑中某些元素对精细的细节有较好的反应,另外一些对细节较少的部分起反应,而其他元素则对空间上的粗略变化起反应。你如果仅仅能看到后者,这世界就会模糊得像焦距没调准一般。心理学家常使用"空间频率"一词。高空间频率相应于精细的细节,低空间频率对图像在空间上的缓慢变化起反应。
正如格式塔学派已经认识到的那样,视觉中的一个重要操作就是图形背景分离。要识别的物体称为"图形",其周围环境称为"背景"。这种分离也许并不总是轻而易举的事,仔细观察图9你就会知道,如果你从来也没有看到过这幅图,你会很难看出有什么可识别的物体。但过了一会儿,你就有可能意识到,图画的一部分代表一只达尔马提亚(Dalmatia,南斯拉夫地名)狗。在这种情形,图形背景的分离被有意复杂化了。
这就是对为什么我们能看颜色所作的基本解释。但它还需要进行某些修正。在此,我仅想提一下所谓兰德效应(因偏振片的发明者埃德温·兰德(Edwin Land)而得名)。兰德以戏剧性的方式向我们演示,视野内某斑块的颜色并不仅仅依赖于从该斑块进入眼睛的光的波长,它还与从视场其他部分进入眼睛的光的波长有关。
"当我们追溯心理学发展的历史时,我们就会陷入空想、矛盾和谬误与某些真理交织在一起的迷宫之中。"
大脑的运动知觉由两种主要过程进行处理。它们可以粗略地被称为"短程系统"和"长程系统"。前者发生在比后者较早的加工阶段。短程系统并不能识别物体,而仅能识别由视网膜接收并传递到大脑的光模式的变化。它可以抽提运动的"基元",但并不知道是什么物体在运动。换句话说,作为初级的感觉,这种简单的运动信息是有用的。它是自动操作的,即不受注意的影响。
良好的连续性定律可以由图7加以说明。该图的上部分显示两条相互交叉的曲线。我们的确把它看成是两条线,而不是像该图的下部分所显示的那种交汇于一点的四条线或是两个靠近的V型。我们同样倾向于把中断的线段看成是被某个物体遮挡一部分的连续直线。
格式塔学派还有一个被称为"简洁"(Pragnanz)的普遍原理,它可以近似地被译为"优良性"。它的基本思想就是视觉系统对输入的视觉信息作出最简单、最规则和具有对称性的解释。大脑如何判断哪个解释"最简单"呢?现代的观点认为,最好的解释往往只需要很少的信息(在技术意义上)进行描述,而坏的解释往往需要更多的信息。①
对输入光子流的平均响应可能对应于敏感波段的少数几个光子,也可能对应于非敏感波段的许多光子;感受器无法分辨它们。初读这些内容时,这一切似乎相当复杂,但已有的经验告诉我们,如果眼睛只有一种类型的光感受器,你的大脑就会失去光的波长信息,因而只能看见黑白的世界。这种情况出现在特别昏暗的时候,这时,被称作"视锥"的一类光感受器不活动,只有"视杆"感受器起作用。这些全是一种类型的光感受器,对所有波长反应相同。这就是为什么在夜晚很暗的情况下,你在花园内看不到花的颜色的原因。
格式塔知觉定律不能看作是严格的定律,而只能算是一种实用的启发式研究。因此,它们可以作为视觉问题的合适的人门知识。真正哪些操作过程导致了这些"定律"的出现,这正是众多视觉心理学家试图发现的东西。
请看图8a所表示的一组八个奇形怪状的物体。中间两个与字母Y类似,另外六个为扭曲的箭头。而在图8b,你大概会看到一个被三个斜条遮挡的三维立方体框架。现在,那些奇形怪状的物体已成为上下两图的组成部分。第二个图形中更容易看成是立方体,因为它似乎是一个被斜条遮挡的单一物体。而第一个图形,由于缺少任何遮挡线索,因而更容易被看成是八个独立的物体。
我希望我已经说服了你,看并非如你想像得那样简单。看是一个建构过程,在此过程中,大脑以并行的方式对景物的很多不同"特征"进行响应,并以以往的经验为指导,把这些特征组合成一个有意义的整体。看涉及大脑中的某些主动过程,它导致景物明晰的、多层次的符号化解释。
大家知道,大多数人具有三种视锥细胞(大致是短波、中波和长波锥细胞。它们常被称为蓝、绿、红视锥细胞)。但也有少数人缺少"红"视锥细胞,因此导致部分色盲。①他们在分辨红绿交通信号时可能会碰到困难。
①最近,加利福尼亚大学(伯克利)心理学家斯蒂芬·帕尔莫(Stephen Palmer)提出另外两条律:共同区域(commonregion)和联结性(connectedness)。共同区域(或称包容性)意味着相同的知觉区域组合在一起。联结性是指视觉系统把均匀的、联结在一起的区域知觉为单一单元的强烈倾向。
大脑面对的最为困难的问题之一,是从二维图像中抽提深度信息。我们需要深度信息,不仅是为了确定物体与观察者之间的距离,而且还要识别每个物体的三维形状,使用两只眼睛是有帮助的。但常可利用一只眼睛或看它的照片就能看出它的形状。大脑使用哪些线索从二维图像中获得三维信息呢?一个线索就是由入射光的角度产生的物体阴影。请看图13。你可能将其中的一排看成是平面上的四个凹陷物,而将另外一排看成四个突起物。这样的深度印象就来自人射光的阴影。
为什么会这样呢?进入眼内的信息不仅取决于表面的反射特性(颜色),还与落到该表面的光的波长有关。因此,在阳光下和在烛光下,妇女们色彩缤纷的服装会有很大区别。因此,大脑主要感兴趣的不是反射率和照明光的组合,而是物体表面的颜色特性。大脑试图通过比较眼睛对视野中若干不同区域的响应来抽提出这种信息。要做到这一点,大脑利用了如下约束(假设),即在某一时刻,在该景物的各处,照明光的颜色是相同的。尽管在其他场合,它们可能是明显不同的,如果照明光是粉红色,它就使所有的东西程度不同地变为粉红色。因此,大脑就力图校正它。这就是为什么阳光下的红色纤维在人工照明下看起来依然是红色的原因。但是,正如我们知道的,它看上去并不完全相同,因为校正机制并非工作得尽善尽美。
接近律说明,我们倾向于将那些相互靠得很近且离其他相似物体较远的东西组合在一起。这在图6中就看得很明显。该图由许多规则的矩形阵列小黑点组成。你的大脑既可能将它们组织成水平线也可能组合成垂直线。但实际上,你把它们看成是垂直线。这是因为,一个点到其最近点的距离,在垂直方向要比水平方向短。其他实验显示,接近律通常指"空间上接近",而非在视网膜上的接近性。
第一个线索是透视,它可以用埃姆斯变形房间(因发明者阿德尔伯特·埃姆斯(Adelbert Ames)而得名)进行生动的演示。这种房间只能用单眼从外部通过小孔去观察。这样,就可以排除任何立体视觉线索。这个房间看起来像个长方体,但在实际上它的一边很长。与正方形房间相比,它的一个墙角要高得多,也离我们远得多。当我在旧金山"探索者博物馆"(Exploratorium)通过小孔观看这样的房间时,我看见一些在房间内跑来跑去的小孩。在房子的一侧他们显得很高(因为这时他们离我很近),而在另一侧则显得很矮(这时他们离得很远)。当他们从一边跑到另一边时(实际上是从近处墙角跑到远处墙角,再跑回来),他们的大小会发生惊人的变化。我当然明白,孩子们是不可能通过这种方式改变身高的。但这一错觉是如此逼真,使我无法立刻摆脱它。每个孩子的表观大小是由墙的虚假透视作用产生的。与其他错觉类似,这一错觉很难通过"自上而下"(即大脑的最高水平对这一错觉形成基础的理解)的作用进行校正。
还有一些深度线索。一个是物体的表观大小。一个熟悉的物体,当它离我们较远时它在视网膜上的像就会变小。因此,如果该物体的表观尺寸较小,大脑就认为它离我们较远。另一个深度线索是远处的风景通常看起来比较蓝。所有这些线索都被艺术家们所利用,特别是在文艺复兴时期透视现象被发现以后。卡那来特(Canaletto)的威尼斯风景画便是很好的例子。
举个例子就会较清楚了。请看图5中的这张照片。你会毫不费力地立刻看出,这是一张正在注视窗外的年轻女子的面孔。但仔细观看就发现,窗户的木窗棂将该女子的面孔分成了四部分。但是,你并没有把它看成是四个不同人脸的四个分离的片断。你的大脑将它们组合在一起,解释为一个单一物体——被面前的木窗棂部分遮挡的一张面孔。这一组合是怎样完成的呢?
另一个有力的线索就是遮挡。即一个靠近你的物体部分地遮挡远处的物体。我们在图5中就已看到过这种情景。一个女孩的面孔位于窗玻璃的框架之后。利用这一线索,大脑就能推断出,被遮挡物的各个不同部分应当属于同一物体,就像本章开头我们讨论过的那样。
让我们转向讨论深度信息的主要来源(1)。它通常被称作"体视",依赖于双眼观察同一物体时景物图像的微小差异。19世纪中叶,物理学家查尔斯·惠特斯通爵士(Sir Charles Wheatstone)最早向人们清楚地演示,恰当呈现的双眼图像可以给人生动的深度印象。(怀特斯通还有一件趣事使人记忆犹新。有一次他在伦敦皇家学会等待发表星期五晚上演说时,因高度紧张而逃跑。从此以后,每个演讲者都要按惯例在演讲前被锁在一间小房子内等一刻钟。)怀特斯通还发明了体视镜(战后因设计简单而普及)。它使每只眼睛分别观察拍摄角度略有不同的照片成为可能。拍摄位置的差异就会产生并非严格相同的景观。大脑检测两个景观之间的差异(这在技术上称为"视差"),结果使照片上的场景显现出明显的深度感,似乎就出现在你的面前。
还可能构造一幅模棱两可的图形背景分离图像。请看图10。第一眼看来,它像一个花瓶,但继续观察就可能看成是两张脸的侧视图。本来花瓶是图形,而现在人脸的轮廓线成了图形,原先的花瓶就成为背景了。但是,这两种解释很难在同一时刻看到。
①正如我在第一章所解释过的,如果过于简单地理解"和"这个词,这当然是正确的。
①即使对于同一观察者,位于注视线上的物体与位于视场外围的物体,它们的平衡点也可能稍有不同。
离你较近的物体的体视最显著,因为此时双眼视差最大。显然,要使双眼看到同一物体的景象,物体差不多就要在你的正前方。它不能向一侧偏离太远,而使鼻子遮住一只眼的视线。靠捕食为生的动物如猫、狗等,通常双眼都在前方。这样它们就可以利用体视抓捕猎物。而对于其他动物,如兔子,双眼长在头的两侧更有好处,这样,它们就可以在宽广的视野内发现天敌。但与人类相比,它们的体视能力很有限,因为它们双眼的视野重叠很少。①
在盲点处看到的东西是不容易研究的,因为它偏离凝视中心15度。正如我前面说过的,那里的东西我们不能看得很清楚。拉马参准和英国心理学家理查德·格里高理(Richard Gregory)已经完成了一个称为"人造盲点"的实验。该盲点离凝视中心较近。(丹尼特曾在脚注中提到这一工作,但对他们的结果不甚满意。)更引人注目的是,拉马参准及其合作者对一个病人进行了检验。他的问题不是出在眼睛,而是在大脑的视区内有一小部分损伤。这样的病人不能如实看到视场中相应位置的东西。这一块区域是盲区。但毋庸置疑,只要放宽时间,他的大脑就会利用从周围得出的合理推测来填充它。
人们猜测,短程运动可以利用运动信息从背景中分离出图形①并与运动后效应(有时称为"瀑布效应")有关。(如果你注视瀑布一段时间,然后把注视点很快移到邻近的岩石,在很短的一段时间内,你就会看到岩石向上运动。)现在对此现象还有不同的看法。因为最近的实验显示,运动后效应可以受注意的影响。
要进行三维观察,只看三维空间中的每个物体是不够的。你还必须观看三维空间的整个场景,以便弄清楚哪些物体离你近,哪些物体离你远。即便是二维图像也存在两种很强的深度线索。
他们的实验结果可用图19说明。在阴极射线屏幕上有两条竖直的线段处于同一直线上。一条在盲斑之上,一条在下。几秒钟后,病人就会看到一条直线完全跨过间隙。一个病人还报告说,当屏幕上的线条去掉后,他"在线的填充部分看见一个非常生动的幻象",其持续时间有好几秒,更令人惊奇的是,如果呈现给两个病人的是两条错开的竖直线(图19c所示),开始,他们看到的是两条错开的直线,但后来两条线就会相互"漂移"靠近,最后两条直线完全对齐。然后,大脑填充上它们的间隙,形成一条连续的直线(如图19d)。报告称,这些线的水平移动(记住,它们实际上是完全静止不动的)栩栩如生。两位病人对此现象深感惊讶,并表现出极大的兴趣。
封闭性在线画图形中表现得最为明显。如果一条线形成了封闭的或几乎封闭的图形,那么我们就倾向于把它看成是被一条线包围起来的图形表面,而不仅仅是一条线。①
视觉运动系统的另一个作用是指导你在环境中运动的方式。当你向前行走时,你的眼睛看着前方,你上下左右的视觉场景就会从你身边掠过。这种视网膜图像的运动被称作"视觉流"(visual flow),在飞机着陆时它对飞行员帮助极大,一个没有体视的单眼飞行员可以借助视觉流信息使飞机安全着陆。没有视觉流的地方是你正朝它运动的那一点。所有围绕该点的物体似乎都向远离这一点的方向运动,尽管它们的速度有所不同(如图17)。这种视觉信息帮助飞行员找到跑道上正确的着陆点。
其他的一些实验表明,并非视觉每个方面的填充都是同时进行的。形状、运动、纹理和颜色的填充可以在不同时间内完成。例冤五章注意和记忆如,当视场由许多运动的随机红点组成时,一个病人将颜色"渗入"到盲区几乎是立刻完成的,而在5秒钟以后才会形成运动圆点的动态模式。
加利福尼亚州大学圣迭戈分校心理系的视觉心理学家拉马参准做了一个巧妙的实验来反驳丹尼特(每个人都喜欢证明哲学家是错的),他向被试者呈现一个类似油炸面包圈似的黄色环形图案(见图18b)。被试者必须使眼睛静止不动,并用单眼进行观察。拉马参准将黄色圆环放在被试者的视野内,使它的外沿落在盲斑之外(睁开的眼),而内侧则落在盲点之内(图18b)。此时被试者报告说,他看到的不是一个黄色圆环而是一个完全均匀的黄色回盘(图18c)。他的大脑填充了盲区,使一个粗的圆环变成一个均匀的圆盘。
填充可能并非是盲点所特有的过程。更可能的情况是,它以某种形式发生在正常大脑的多种水平。它使大脑能从仅有的部分信息中猜测出完整的图画。这是一种非常有用的能力。
我们现在要考虑的是,当我们观看物体、它与我们及其他物体的相对位置以及它的形状、颜色、运动等某一属性时,大脑必须执行的某些基本操作。也许,我们应该认识到的最重要的一点,就是视野中的物体并不像你看到的那样。每个物体并非以清楚和确定的方式做了标记,你的大脑必须使用各种线索,使景物中对应同一物体的各个部分整合在一起。在现实世界中,这并不是一件容易的事情。物体可能部分被遮挡或是呈现在易于混淆的背景之中。