电脑有意识吗?(1-2)

2020-07-25 浏览量:479
電腦有意識嗎?(1/2)

电脑的智能极限在哪里?它能和人类对答如流,但真的能够感知外界吗?用几张图考考它吧。


重点提要

电脑的智慧不断进步,但这些机器要能「意识」周遭世界,路途还远得很。计算机科学家和神经生物学家喜欢思索一个兼具技术性与形上学意味的问题:有办法分辨机器是否真正具有意识吗?在家拿把剪刀和几张照片做个简单测试,你就能确认人类是否已做出有意识的电脑。

电脑发展得更接近有智慧的人类了,瞧瞧IBM的华生是怎幺打败电视益智问答节目「危险边缘」(Jeopardy)的人类常胜军。然而,儘管电脑拥有以超人速度消化资料的优异能力,但是大多数人并不认为电脑真能「看到」摄影机前充满形状与色彩的视觉景象、真能从麦克风「听见」问题,真能像人类一样有感觉、拥有意识经验。

要如何知道机器已获得「意识」这种似乎难以言喻的特质呢?我们的策略是利用下述知识:有意识的机器才能主观了解某张普通照片里的景象是「对」是「错」。这种用一堆事实组合出合理的现实样貌的能力(例如知道大象不应高挂在巴黎铁塔顶端),是意识的决定性特质。相较之下,佔满整个房间的IBM超级电脑,仍然无法看出影像合不合理。

釐清有意识的机器具有哪些特性,不只能让人类了解自己的大脑如何运作,也能让我们预做準备,当科幻小说所预言的日子来临时,学习如何与我们所创造的另一种意识体共同生活。了解这些,或许还能帮我们解答一个困扰世世代代哲学家的根本问题:什幺是意识?

是人类还是魔像?

哲学家有个思索已久的问题:不管是传说里的魔像或装在盒子里的机器,这些人造的拟人产物真的能拥有感觉吗?后来,在第二次世界大战协助破解纳粹潜舰军队「谜码」(Enigma code)的英国数学家涂林(Alan Turing),于1950年发表一篇论文,开启了人工智慧的研究。涂林在《心智》(Mind )期刊发表的文章中提议,用一个比较可行的问题「是否能做出一部机器,以电报打字机和它进行问答时,其表现与真人无异?」取代模糊而无解的问题「机器能不能思考?」,能满足这个问题的机器,就等于通过涂林测试。

现代版的涂林测试方法是,找个人来判断:在电脑萤幕的另一端,以日常的「自然语言」与其互动的对象是人或软体程式?判断者和互动对象可以聊任何事,若经过一段合理的时间后,判断者仍无法确定对方是不是真人,对方起码就称得上具有和人一样的智慧,通过了涂林测试。这幺多年来,人们设计的聊天程式偶尔也能骗倒人,但瞒不了多久。

本文两位作者不是以计算机科学家的角度,而是基于神经生物学家对大脑如何产生主观感受的兴趣,来探讨机器意识的问题。我们检测志愿者或神经疾病患者的大脑,以核磁共振扫描或脑电图仪记录脑波;我们也用类似方式研究齧齿类及其他动物的脑。我们和许多同事就这样钻研意识的神经关联性,这是脑内机制的最小单位,任何意识知觉(例如橙色夕阳余辉的视觉)都是它们联手造就的。然而直到不久前,这个领域还一直缺少一个能让我们遵循、用以评估脑伤病人、胎儿、老鼠或硅晶片能否感受意识知觉的通用理论。

我们提出一套「意识的整合资讯理论」,来应付这项挑战,其中涉及一项意识判断的关键。许多人凭直觉知道,每个人对气味、景物、思维或回忆等日常感受,都有自己独特的感觉,而这些主观现象状态的形成,必定与大脑如何将它接收到的感觉讯号以及来自记忆的资讯,整合成世界的完整面貌,有某种关联。只是要怎幺把这种直觉讲得更精确?

整合资讯理论提出两个公设来解决这个问题。第一,意识具有高度资讯价值。这是因为当某个意识状态发生时,就排除了无数的其他状态,而它与其他状态的不同处也是它特有的。想想你在所有电影里看过的所有画面,每张画面的视觉都是独特的意识知觉,当你知觉到某个画面时,大脑就排除了亿万个其他可能的画面。即使是「在一个黑暗房间里醒来」这种最简单的视觉经验,漆黑一片的知觉也代表你所见的不是明亮的客厅、茂密的丛林,或心里可能出现的无数其他景色。

其次,意识资讯是整合的。当你意识到朋友的脸,就不可能没看到她在哭或戴着眼镜。无论你多努力去试,都不能把左视野和右视野分割开来,或把视觉切换成黑白模式。无论什幺景色进入意识,都会保持完整,不能切割为独立而不相关的成份,让人分别感受。意识的统合来自脑中相关脑区的大量互动,如果脑区彼此不相连结,就像麻醉或熟睡时的状况,意识就会衰减,甚至消失。

也就是说,你必须是一个拥有大量可区辨状态(亦即资讯)的整合单一个体,才会有意识。系统整合资讯的能力(亦即意识)可以这样评估:该系统所含的资讯,比组成它的各部份所拥有资讯的总和,多出了多少?这个数值就称为Φ(phi)。原则上,无论是人脑、机器人或手动调整的控温器,任何系统都能算出Φ值。Φ代表系统无法再化约为更小组成元件的部份,衡量的单位是位元。Φ和意识程度高的系统,必定由各有所司且整合良好的成份所组成,这些组成份整合后的能力超越个别能力的总和。

如果系统的组成份大多互相独立,就像数位相机的感光元件或电脑记忆体里的位元,Φ值就低。如果组成份没有分工、角色重複,全都做同样的事,Φ值也低。如果系统组成份是以随机方式互相连结,Φ值还是低。但在脑内特定区域(例如大脑皮质)内,神经元都拥有丰富而独特的连结方式,Φ值就高。这种系统整合性的评估也适用于金属盒子里的积体电路,只要电晶体和记忆单元间的连结够複杂,电脑就能像人脑一样,达到高度的资讯整合。

除了用机器内的线路来评估Φ(这可是苦差事),还能如何知道机器有没有感觉?可行的测试是什幺?有个办法能测试资讯整合度,就是问它六岁小孩也能轻易回答的问题:「这张图有什幺不对?」要解答这个简单问题,需要大量背景知识,远超过先进电脑用来辨识人脸或侦测信用卡盗刷的演算法。

物体或自然景物的图片中,画素与物体彼此有着错综複杂的大量关联性,俗话说得好:「一张图胜过千言万语。」视觉系统的演化、儿时的神经发育及生活的经验,让我们能即时认出图中各组成加在一起是否适当:那些纹路、深度、色彩、各部份的空间关係等,是否合理?

电脑分析影像、检查图片中资讯是否协调,所需处理的内容,远比用语言查询资料库更多。电脑或许能在複杂的比赛中打败人类,但拿一张照片随便问它里面的内容,电脑还是没有能力回答,箇中原因可以用资讯整合程度来解释。虽然现代电脑硬碟的容量超过人类一生的记忆量,但里面的资讯是未经整合的,系统里的每个元素大多彼此不相连结。

就以你电脑相簿里的一张书桌照片为例,电脑无法看出在乱糟糟的桌面中,左边有iMac而右边有iPad是否合理。更糟的是,电脑不但不知道iMac和iPad放在一起很搭,更不知道在放键盘的地方放个盆栽很怪;它不知道iPad不可能飘浮在桌面上方,或这张照片的左半边与右半边很合,但若搭上其他照片的右半边就不对劲。对电脑而言,所有画素只是一大堆三个数字的组合(分别代表三原色),彼此间互无连结,不具什幺意义。但对你而言,影像是有意义的,因为里面各层次(画素、物体,乃至于景色)的各部份彼此充满连结,而这些关联性决定了影像哪些部份合起来搭调或不搭调。根据我们的理论,这张由关联性知识组成的整合网,让每张影像不同于其他无数影像、具有独特性,也让你对这世界充满意识。

就连六岁小孩也能藉由这种整合性,看出溜冰选手站在客厅地毯上、透明的牛、猫追狗,这些不合理画面的荒谬之处,而其中潜藏的秘密就是判断电脑有无意识的关键。这些明显违反我们预期的事物,证明我们拥有非凡的知识,知道特定事件与物体会一起出现,而其他难以计数的组合则不会。(待续)

相关文章