为什么机器能够像人一样认知?这是当今智能科学难以回答而又必须回答的问题。
人类这个物种,经过几亿年漫长的自然进化,尤其是经历了最近300万年大脑皮质爆长的进化过程,已经成了认知能力最强的生物,正是认知成就了今天的人类。
2022年6月8日,韩国仁川国际机场内的智能机器人。图|视觉中国
理解人类认知的生物学本质在人类文明史中曾经被认为无法纳入科学研究的范畴,可如今正方兴未艾,科学已经发展到从人类认识客观世界到人类认识自身、特别是认识人脑认知的新阶段。令人惊异的是,这类研究主要不是出自宗教领袖、哲学家、思想家和教育家,而更多的是出自生命科学家和人工智能学家,可以从进化论、遗传学和细胞学说中寻找人类认知的生物学基础。
文 | 李德毅 中国工程院院士、国际欧亚科学院院士、少将
编辑| 李亚飞 瞭望智库
本文为瞭望智库原创文章,如需转载请在文前注明来源瞭望智库(zhczyj)及作者信息,否则将严格追究法律责任。
1
机器认知要和人相比
不是一件容易的事情
细胞是构成人体形态结构和功能的基本单位,形态相似和功能相关的细胞借助细胞间质构成起来的结构成为组织,几种组织结合起来,共同执行某一种特定功能,并具有一定形态特点,就构成了器官,若干个功能相关的器官联合起来,共同完成某一特定的连续性生理功能,即形成系统。
人体模型。图|图虫创意
人体由九大系统组成以维持生命,即运动系统、消化系统、呼吸系统、循环系统、泌尿系统、生殖系统、内分泌系统、神经系统、免疫系统。
这九大系统只是人类认知自身的一种划分方法,可称为视图。实际上人体未必是可以这样分开来谈的,这只是人们用不同视角更深刻地去认知一个整体而已。
很难区分这九大系统哪个重要不重要,关键不关键,它们也不构成从属关系。从生命科学的角度看,它们应该具有相同的复杂性,谈不上神经系统或者脑器官最复杂之说,抑或是人类自身的一个说辞而已。
还可以有太多种类的视图划分,例如,结构生物学把生命科学分为基因生物学、原子生物学、分子生物学、大分子生物学、蛋白质生物学、细胞生物学、神经生物学,等等,也未尝不可。
人体依靠新陈代谢为生,由循环系统供应人脑能量,有了源动力,人脑才能承担认知的任务。机器认知要和人相比,不是一件容易的事情。
要弄清楚智能机器能不能如同人一样,具有认知能力,我们首先关心的是机器的具身智能,图灵称之为“embodied intelligence”。
机器对应人体的运动系统,运动系统由骨、骨连结和骨骼肌三种器官组成,表面肌肉的外层还有皮肤。骨以不同形式连结在一起,构成骨骼,形成了人体的基本形态,并为肌肉提供附着,在神经支配下,肌肉收缩,牵拉其所附着的骨,以可动的骨连结为枢纽,产生杠杆运动。
运动系统主要的功能是运动。简单的移位和高级活动如语言、书写等,都是由骨、骨连结和骨骼肌实现的。
运动系统的第二个功能是支持,构成人体基本形态,头、颈、胸、腹、四肢,维持体姿。
运动系统的第三个功能是保护。由骨、骨连结和骨骼肌形成了多个体腔:颅腔、胸腔、腹腔和盆腔,保护脏器。
从运动角度看,骨是被动部分,骨骼肌是动力部分,关节是运动的枢纽。能在体表看到或摸到的一些骨的突起或肌的隆起,称为体表标志。它们对于定位体内的器官、结构等具有标志性意义。
运动系统由骨、关节和骨骼肌组成,约占成人体重的60%。全身各骨借关节相连形成骨骼,起支撑体重、保护内脏和维持人体基本形态的作用。骨骼肌附着于骨,在神经系统支配下收缩和舒张,收缩时以关节为支点牵引骨改变位置产生运动。
人体的具身动力学行为表现为具身智能。我们有时候希望机器具有类人一样的行为智能,可称为人型机器人,或者说有温度的机器人,外显情感,体现亲和力,尤其是数字虚拟人,如数字演员、电视节目数字主持人、数字医生和学校的数字教师。
更多的时候,我们用智能机器完成一些专门的脑力和体力工作,它们可能比人更有速度,如无人驾驶车辆;更有力量,如未来的智能盾构机;更加精巧,如纳米机器人;更加灵巧,如柔软操作手;更加适合野外恶劣地形环境里的运动和捉拿,如多足机器人,等等。
至于这些实体机器人,外形像不像人,并不重要,它们只是人类智能的体外延伸,图灵称之为“disembodiedintelligence”。智能时代人类正在把自己从繁重的体力和脑力劳动中解脱出来。
2
机器里一定要有一个最基本的时钟
我们更关心机器对应的人体的消化系统、呼吸系统和循环系统。这些体现人体的新陈代谢,也就是能量的供给。
人体心肺血管模型。图|视觉中国
其中,循环系统是生物体的细胞外液(包括血浆、淋巴和组织液)及其借以循环流动的管道组成的系统。人体形成心脏以后,循环系统分心脏和血管两大部分,叫做心血管系统。
循环系统是生物体内的运输系统,它将消化道吸收的营养物质和由肺吸进的氧输送到各组织器官,并将各组织器官的代谢产物,通过同样的途径输入血液,经肺、肾排出。它还输送热量到身体各部以保持体温,输送激素到靶器官以调节其功能,是整个人体的源动力来源。
诺贝尔奖获得者薛定谔告诉我们,人和所有生物一样都遵循最基本的物理定律,都会衰老,都赖负熵为生,机器也一样,需要依靠能量,形成秩序,产生负熵。
如果机器里的物质老化,结构破损,或者切断了能源,或者时钟出了故障,相当于心脏的机器时钟,一旦停止了跳动,机器的生命就停止了,人的认知活动也就难以为继。
以前人们常常说“心灵”“爱心” “心智”,不是很准确,心脏只是动力,是推动血液在体内循环的肌肉器官,不是用来产生情感、知识和智能的地方,脑才是信息处理的器官,智能源发于人脑,特别是难以计数的各类神经细胞相互作用所致的复杂性,大脑新皮质才是学习和记忆的思维器官,形成认知空间。
如果没有记忆,我们就永远活在当下,我们就不会有时间的概念,正是记忆让我们为过去和现在提供了连续性。
机器是由物质和能量构成的,物质是静止的能量,能量是运动的物质。结构寄生在物质和能量上,形成诸多硬构体,把各种硬构体按照结构设计组装到一起,就成为机器。
机器里一定要有一个最基本的时钟,时钟赖能量为生,时间寄生在时钟上,结构和时间寄生在硬构体上,还有很多软构体,它们或者寄生在硬构体上,或者寄生在软构体上,表达信息,与外界交互,自我复用实现认知的成长,只要机器的时钟不停,机器就有了源动力,依靠时间,机器表现出秩序和能力,就可以表达信息,实现知识和智能的积累,于是机器可以完成认知的任务。
精神寄生在物质上,把物质和精神、科技和人文分为二元,不够贴切。高性能计算机里的时钟精度,已经可达到飞秒,甚至亚飞秒。
这样,机器里无论是复杂机器指令或者精简机器指令的执行,以及寄生在机器语言上的各种软构体的执行,通过递归复用,表现出高超的秩序,可以实时地与人进行交互,完成自然语言对话,通过图灵测试。
3
把智能定义为:
学习的能力,解释解决问题的能力
从认知的角度看,我们最关心的是机器对应人体的神经系统。
神经系统是对机体内的生理、心理、思维功能活动的调节起作用的,由神经组织组成,分为中枢神经系统和周围神经系统。中枢神经系统又包括脑和脊髓,周围神经系统包括脑神经和脊神经,还有末梢神经。
神经系统控制和调节其他系统的活动,维持机体与外环境的交互。神经系统由神经细胞组成,对感知、认知起主导作用,通过和外界的信息交互获得负熵。
智能机器常常把神经系统比做认知系统。至于泌尿系统、生殖系统、内分泌系统、免疫系统,这四个系统在智能机器里暂时不考虑。
把生命看成机器,薛定谔称之为“活细胞的物理观”;如果把机器看成生命的话,我们可以称之为“机器的生命观”。
生命和机器里的物质都可以对应物理层,生命里的生化层,在机器里面我们把它对应为“能量和时钟”,生命里的生理层对应机器里面的电子电路和机器指令,这些是硬构体;心理层对应着操作系统和中间件,认知层对应高层次软件和数据,这些都是软构体。
因此生命赖负熵为生,机器有物质、能量、结构和时间,时钟依赖能量,时间依赖时钟,秩序依赖时间。
所以我们可以有两个“金句”:时间是人类认知的奠基石,数学是人类最抽象的语言。生命和机器都可以作为认知的载体,从物质到能量,从能量到信息,从概念到信息,从信息到知识,从知识到智能,越往上软构体越多,常常递归定义,依靠自我复用实现自成长。
我们认为,尽管研究大脑皮层发现有很多很多的任务分区,但是皮层组织存在着局部与整体的自相似性,记忆并不是存储在某一个神经元,而是存储在网络当中,可以用人工智痕细胞网络模型作为大脑皮层的长期修饰、修剪或重塑的通用表征,从而形成各智其智、智智与共的通用智能。
大脑的皮质上有很多沟沟回回,可以用分形技术把它产生出来,就像海岸线长度一样,看用什么尺度测量。大脑皮层的表面其实并不是只有那几千平方厘米,是可以足够大的,是用进废退的。思维的本质是抽象和联想,更多的就是软构体的创立、联结,以及迭代发展和递归执行。
人类的整个认知活动逻辑上可分为感知—认知—行为,对应三个区:瞬时记忆区、工作记忆区和长期记忆区。瞬时记忆区处理不同感觉器官获得的感知信息,完成跨模态融合;工作记忆区分析当前问题的态势,形成决策,控制机器的具身行为;而在长期记忆里则留下了我们认知的结果。
因此,对智能机器而言,怎样构建人工智痕细胞网络模型是一个很重要的问题,我们不妨假设,被当前问题注意力激活的人工智痕细胞组成的网络是一个幂律分布的复杂网络,具有小世界特征,可以分别在不同尺度上整体表现,完成记忆的提取。
我们讨论自然界生物的进化常用的时间尺度是万年,讨论人类生态文明现象和体外的人工智能常用的时间尺度是千年。讨论人类思维和认知的进步,也就是科学技术发展用的是百年,现在看10年都会大变样。
人类生命进化出来的本能相对稳定,后天认知是可以重塑的,科学技术和机器智能的发展却是天翻地覆的,这种迭代的智能导致了几何级指数增长的认知进步和知识爆炸,成就了人类。科学技术成为人类社会发展的第一生产力,已经是全世界不同价值观群体的共识。应该让人发挥人的智慧,机器发挥机器的智能。
我们把智能定义为“学习的能力,解释解决问题的能力”。解决问题之道,要么将问题减低一个维度,或者低一阶,要么将认知上升一个维度,或者高一阶。
随着智能研究在我国形成热潮,随着智能科学和技术学院在全国的普及,如果说上一代的人工智能可以叫做计算机智能,硬核是算力、算法和数据的话,那么新一代人工智能应该是有感知、有认知、有行为、可交互、会学习、自成长的机器智能,硬核则是交互、学习和记忆,而量子认知机则可能是下一代人工智能,也许百年之后了。