再思人机智能融合-人工智能的专栏

再思人机智能融合

2020-06-25 11:24:06栏目：默认栏目 IP属地：IP未知

作者：白驹来源：人机与认知实验室

只有利益/功能没有信任/理解，不会长久。 “事件的缺席和它的在场一样，能够提供同样多的信息”，对关键信息而言，的确如此。任何事物之间关系的正反向推理过程中所包含的信息也类似。我们通常在部分信息的基础上做出决策，当我们得到更完整的信息时，我们会犹豫不前。

塔塔科维尔说：“战术是当你有棋可走时知道如何走棋。战略是当你无棋可走时知道如何走棋。”

一、引言

人机融合智能是一种新型智能形式，它不同于人的智能、也不同于人工智能，是一种跨物种越属性结合的下一代智能科学体系。如果说真就是Being，善就是Should，美就是Being+Should的融合；假设机就是Being，人就是Should，那么人机就是Being+Should的融合。同时，人机融合智能也是东西方文明的共同结晶体现。

一般而言，东方文明对于智能的追求永远是“反求诸己”，企图打破人自身思维的界限而达到超越性的智慧；西方则是追求借助外力计算实现超越，计算即要求有穷，或者至少极限存在being，函数收敛。而针对无穷发散式的问题，也就是should的问题，人工智能很难跨出聚合这一步，而人机融合智能则能跨出这一步：人的意向性可以灵活自如地帮助人机协调各种智能问题中的矛盾和悖论。

表面上，人机融合智能问题是一个现代科学技术问题，同时也是一个古老的伦理问题。伦，有四种解释：1辈，类。2人与人之间的关系。3条理，次序。4姓；伦理，就是指的就是人与人以及人与自然的关系和处理这些关系的规则。人们往往把伦理看作是对道德标准的寻求。道德是后天养成的合乎行为规范和准则的东西。它是社会生活环境中的意识形态之一，它是做人做事和成人成事的底线。它要求我们且帮助我们，并在生活中自觉自我地约束着我们。假如没有道德或失去道德，人类就很难是美好的，甚至就是一个动物世界，人们也就无理性无智慧可言。伦理道德的最现实作用就是使人对事物产生价值观，而这价值观恰恰是产生意向（should）和存在（being）的主要源泉，意向性是意识的基础、存在是规律的反映，人类智能的根本就在于此：“德化情，情生意，意恒动。”“意恒动，识中择念，动机出矣。”

传统逻辑学规范的对象是一种可自控的推理活动。作为对于逻辑学奠基于伦理学之上的一个基本论证，皮尔士强调：“就其一般特征来看，推理现象类似于那些道德活动的现象。因为，推理本质上乃处于自控状态下的思想，正如道德活动乃处于自控状态下的活动一样。实际上，推理是受控活动的一种，因此必然带有受控活动的本质特征。虽然由于教士专门负责让你们记住，推理现象并非像道德现象那样为你们所熟知，但是，如果你们关注推理现象，你们可以很容易看到，一个得出理性结论的人不仅认为它是真的，而且认为每一类似情况下的推理同样正确。如果他没有这样认为，他的推断就不能称为推理。它不过是他心中出现的一个想法，他无法抗拒地认为它是真的。而由于没有经受任何检查或控制，它并不是被有意认可的，并不能称为推理。”这里核心的论证结构是：任何可判定好坏的行为都必须是可自控的，逻辑学以区分推理好坏为主要任务，所以作为逻辑规范对象的推理必须是可自控的活动。作为人造的机器、机制而言，其本质必然是可自控的活动结果，而人的则未必完全是逻辑自控的，人机融合智能更不是逻辑的自控推理活动。

二、认知不是计算

目前的人工智能仍然是以计算机为中心，并没有实现人们所希望的“以人为中心”之认知。如何把人类认知模型引入到人工智能中，让它能够在推理、决策、记忆等方面达到类人智能水平，是目前科学界讨论的热点、难点和焦点。

认知的核心是智能，是洞察事物，而智能和洞察的核心是心理，人工智能的核心是数理，心数不正（一致），何谈相似？！单纯的机器，无论是学习还是智能都是没有感情的，而人的理性表面上类似机器，其实这种理性是建立在情感意志等底层之上的，是一种知、情、意融合的心智体，例如人许多记忆一涉及到“我”就会变得又快又好，这种邻近性智能产生的机理就包含情感化。鉴于人机融合的是心理+数理的同理共情，因而能够实现认知与计算的可能结合。正如一位朋友所言：除非有人以确凿的证据向我们证明如何按照非定域原理把精神意识引入了某个人工系统，不管该系统的可观察行为与人类行为多么相似，我们都不能认为该系统真的具有了精神意识，没有了精神意识，再厉害的计算也产生不了认知和洞察。爱是人类一种独特的界面，可以无限地由内而外扩展自己与外部世界交互的界面，这也是机器还不能产生的一种界面。

世界上的事物本身是不能定义解释说明自己的，只能用其他事物去定义解释说明它，但是这些事物本身有不一致，既有相似之处，又有不同的地方，所以比喻、类比都不是精确的，而是近似的，正是由于这些近似性，构成了各种可用的概念、观念、习俗、常识、表征、交流和通讯，而当前计算的源泉----数学本身也是近似的，具体可参见那些公理、假设、条件、约束、边界、规定等，然而，现在的不少数学家或者人工智能学者们竟然忽略了这些数学的近似，人为视为精确、客观、绝对，用一个个有着先天局限性的公式、方程、范式、推理、计算去完成不可能完成的技术工作，进而造成自动化、智能化程度越高，人们的认知/心理负荷越重的悖论，究其因，是把不完美的有限错觉成了完美的无限之故吧！

人是在与人、物的交互中逐步形成自我的，包括亲人、声音、事物、纸笔、……交互、融合是智能的源泉，也是帮助我们思考的工具，从语言到手机，也许都是认知本身的一部分。一方面，我们的认知总是在与这个世界发生着融合；另一方面，被误用的计算有可能会影响我们的认知。1968年图灵奖获得者理查德·哈明说过：“计算的目的不在于数据，而在于洞察事物。”人们认知中的觉知／意识被延展到了外部世界，并时常与很多设备计算交织在了一起。冥冥中，也许真是各种生活体验塑造了我们对真实世界的期待和希望。

表面上，人工智能在搜索、计算、存储和优化领域比人类有更高效的优势，其实不然。例如，当一个或多个目标出现时，你会很难立刻形成正确或有效的态势感知的，只有态势演化进入到适当的时空、程度时，人才能形成良好的态势认知状态。据此，我们不妨把态势感知这一认知机制分为预启动期、发展期、实现期、深度期、衰退期、结束期……期间可视注意力集中程度为调节态势感知不同时期的主要手段。态势感知这种认知行为一般由两部分构成，一是无机部分，即对诸符号的形式化处理；二是有机部分，涉及理解、解释、思维等心灵方面的意向性分析。无机的部分可以用计算的方式优化，而有机的部分用认知处理比较理想，如下面这些情境，用计算很难表征而用认知则相对比较容易分析：态静势动、态动势静、感动知静、感静知动、态多势少、态少势多、感多知少、感少知多、态虚势实、态实势虚、感虚知实、感实知虚。态势的态势就是深度态势，感知的感知就是深度感知，态势感知的态势感知就是深度态势感知。所有的人机交互都是为了人人交流或自我认知而为，机就是一种媒介或一种工具，使得自己与他人互相作用的更有效便利舒适。人工智能模拟的是人的思维，而思维根本上就是各种交互中人的心理活动和过程，思维活动相对稳定了，就形成了某种思想。所以人工智能中的人之心理比起计算方法、计算能力、计算数据来更重要更本质更彻底，人工智能之源是人，而不是工，若说当前的人工智能界本末倒置，是一种工人智能、偷懒智能恐怕不为太过吧！

认知和计算之间的关系有时被抽象为事实与符号之间的描述刻画（描画）关系或映射关系，实际上是赋予命题符号以意义的过程的一个方面，即意指。一个命题符号，在我理解它之前，于我而言，它还是死的、没有生命的。理解与意指过程在某种意义上说是相反过程，意指是指从事实到思想，再到命题符号；理解则是从命题符号到思想，再到事实。计算机本质上是一种通过形式化手段来实现非形式化意向性的工具，即通过数理反映物理、心理规律。玻尔说过：“完备的物理解释应当绝对地高于数学形式体系。”

从哲学高度来看，认知是啥？感性的素质；计算是啥？理性的修养。一般而言，艺术是培养训练感性素质重要的手段，科学技术是发展延伸理性修养的主要途径。大多数现实世界的感性理性互动都涉及隐藏信息，而大多数的人工智能研发恰恰都忽视了这一点。”蒙特利尔大学的Yoshua Bengio是深度学习的先驱者之一，他在一封电子邮件中写道：“学习使用的估计模型与现实之间依然存在着巨大差异，尤其是现实情况很复杂的时候。”因此，以数理计算为核心的人工智能的进步之途依然漫长……就像有句话说的：只有计算才分对错，而认知则没有标准答案。本能就是在没有预见的情况下能够产生某种结果，并且也不需提前训练就能完成的行动能力。美国第一任心理学会会长威廉.詹姆斯似乎认为本能的结构方面是模块化的。各个本能之间都独立负责某种简单行为，但同时它们之间也协同工作。机器的计算到目前为止还远远没有本能，所以人与机在决策方面最大的差异在于有无压力及风险大小的认知。从长远看，人工智能们应该学会如何合作辅助人类，形成人机融合的新智能体。

有人认为：“目前人和机器之间的信息传递效率仍然非常低，远未能实现真正意义上的人机协同、互相促进。要实现人机协同的混合智能，需要解决的第一个难题就是人和机器之间的交互问题。”仔细想来，这并不能算是人机融合的主要矛盾和核心问题。人机融合的瓶颈不是简单的交互问题，而是认知与计算的结合问题，1972年图灵奖获得者埃德斯加·狄克斯特拉说过：“程序测试智能用来证明有错，决不能证明无措“。波兰尼也曾断言：“知识的取得，甚至于‘科学的知识’的取得，一步步都需要个人的意会的估计和评价。”物理学领域，量子论的创立，使人们对主客体关系的认识发生了根本性的变化。在量子世界中，科学主体与客体之间已经不像在宏观世界那样有着绝对分明的界限，而是像玻尔所说的那样：“我们既是演员，又是观众”。与此相关，海森堡也明确指出：几率函数运动方程中包括了量子运动与测量仪器（归根到底是人）相互作用的影响，这种影响也成了不确定性的重要因素。玻尔所说的演员和观众的关系，其含义是科学认识主体和客体之间，存在一个主体客体化，客体主体化的过程。主客体相互转化、相互包含的结果，也就具有了波兰尼所谓的“双向内居”的关系。在人机融合的智能时代到来前的黎明，计算也悄悄主动靠向了认知，正如1966图灵奖获得者艾伦·佩利所言：“任何名词都可以变为动词“。对此，1971图灵奖获得者约翰·麦卡锡也表现了积极的认同：“与所有专门化的理论一样，所有科学也都体现于常识中。当你试图证明这些理论时，你就回到了常识推理，因为常识指导着你的实验。“从中，我们不难看出：认知里的常识恰恰是被计算所过滤掉的精华。常识就是非结构化的多模态信息／知识的复合体，它远远超过了机器的理解。

人类在常规拓扑方面的直觉相对有限，高维情形很难建立起来具体的想像力，唯一能够把握的只有严格的数学推导计算加上活泼的心理抽象认知。只有这样逻辑和非逻辑空间才能相融共生，形成合力去破解大自然提出了一个比一个难以回答的诸多问题，才能处理那些“令我们深陷困境的不是那些我们不懂的事情，而是那些我们自以为理解的事情。”

简而言之，认知不是计算，计算却是一种认知。

三、机器学习不是人工智能，也不是人的智能

我们知道的远比我们说出来的要多得多，我们不知道的远比我们知道的要多得多，我们不知道我们不知道的远比我们不知道的要多得多……

人类的感觉刺激、信息是动态分类，聚类，不是一次完成的，而是多次弥聚变化的（这种轮回机制目前尚未搞清楚）。大道无形的道是碎片的、流性的……所以正是零碎的规则、概率、知识、数据、行为构成了人的智能，即在千奇百怪的日常异构活动情境中生成演化出来的。人智，从一开始就不是形式化、逻辑化的，而且人的逻辑是为非逻辑服务定制的，机器则相反，从一开始就是条理化了、程序化的，也是为人的非逻辑服务的。

本质上，数据的标记与信息的表征不同之处在于有无意义的出现，意义即是否理解了可能性。机涉及的表征体系虽然是人制定赋予的，但一诞生就已失去了本应的活性，即意向性参与下的各种属性、关系灵活连接和缝合，而人的诸多表征方式则常常让上帝都不知所措：一花一世界，一树一菩提。知识图谱的欠缺就在知识的分类，它僵化了原本灵活着的知识表征，使之失去了内涵与外延弥聚的弹性，就像职称评定一样……，用有限表现无限是美，把无限用有限诠释出来是智（真），连接两者的是善（应该、义）。

如果说机器的存储是实构化，那么人的记忆就是虚+实构化，并且随着时间的推移，虚越来越多，实越来越少，不仅能有中生无，甚至还可以无中生有，就像各种历史书中的传奇或各样的流言蜚语一样。更有意思的是人之记忆可以衍生出情感—--这种对机器而言匪夷所思的东东。

人的学习过程大多数不仅是为了获取一个明确的答案，更多的是寻找各种理解世界发现世界的可能方式。而机器的“学习”（如果有的话）“目的”不是为了发现联系，而就是为了寻求一个结果。

智能的根本不是算，是法，是理解之法、之道！理解是关键。NLP不先解决理解问题，只追求识别率，是不会有突破的。其实人对声音的识别率是很低的，经常要问别人说了啥。能问别人说了什么是最关键的能力，因为知道没有理解才能问出问题。很多系统的理解最终靠人，如果没有人参与，不管处理了多少文字，都没有任何理解出现。目前的人工智能缺失的是：对人感性层面的仿生不够完善，因此无法完全了解人做决策的生理与心理机制。言下之意，只有人工智能做到像人一样去感受外部的世界，并用处理器做人一样的理性思考，从内至外地模拟和学习人类，这样的人工智能才是完善的。

博弈理论家鲁宾斯坦发表了文集《语言与经济学》，其中一篇论文里，鲁宾斯坦用一个博弈模型说明“辩论”对不参与博弈的旁听者有非常大的好处，因为辩论使得双方不得不将“私有”的信息披露给旁听的人。他的数学推导大致上没有超出有些哲学论证的范围：“数学方法可能遮蔽了深刻洞察”，而人的直觉性统觉，其载体是有机体的感觉器官，已经包含着有机体对各种关系的理解。只是为了要把这种理解固定下来，形成“记忆”，人类才需要另一种能力的帮助，那就是“理性”能力。在理性能力的最初阶段，便是“概念”的形成。概念就是一种界限、约束、条件，在不同的情境下，这些界限、约束、条件会发生许多变化，甚至会走向它的对立面……这也是为什么智能难以定义，有人参与的活动里会出现各种意外的原因吧！曾几何时，叔本华曾指出：“在计算开始的地方，理解便终结了。”因为，计算者关注的仅仅是固定为概念的符号之间的关系，而不再是现实世界里发生着的不断变化着的因果过程。与“概念”思维的苍白相对立，关于“直觉性理解”的洞察力，叔本华也有如下精彩的论述： “每个简单的人都有理性，只要告诉他推理的前提是什么就行了。但是理解却不同，它提供的是原初性的东西，从而也是直觉性的知识，在这里出现了人与人之间天生的差别。事实上，每一个重大的发现，每一种具有历史意义的世界方案，都是这样的光辉时刻的产物，当思考者处于外界和内在的有利环境里时，各种复杂的和隐藏着的因果序列被审视了千百次，或者，前所未有的思路被阻断过千百次，突然，它们显现出来，显现给理解。”在这一意义上，目前的全部计算机智能，只要还不是基于“感官”的智能，在可看到的未来，就永远无法获得我们人类这样的创造力。这里，“感官”是指对“世界”做直接感知的器官，有能力直接呈现表征世界图景的器官，而不是像今天的计算机这样，需要我们人类的帮助才可以面对这个世界“再现”什么。钱学森说：“人体作为一个系统。首先，它是一个开放的系统，也就是说，这个系统与外界是有交往的。比如，通过呼吸、饮食、排泄等，进行物质交往；通过视觉、听觉、味觉、嗅觉、触觉等进行信息交往。此外，人体是由亿万个分子组成的，所以它不是一个小系统，也不是一个大系统，而是比大系统还大的巨系统。这个巨系统的组成部分又是各不相同的，它们之间的相互作用也是异常复杂的。所以是复杂的巨系统。”实际上，当前的人工智能只使用了人类理性中可程序化的一小部分，距离人类的理性差距还很大，更不要说初步接近人类更神奇的部分--感性了!

伽利略说过:数学是描述宇宙的语言。事实上，准确地说应该是:数学是描述宇宙的语言之一，除此之外，还要许许多多的描述方式存在着，这也是智能科学面临的问题:该如何有效地融合这些不同语言的语法语义语用呢？!对于多元认知体系来说，共性认知成分稀缺而重要，数学是这方面的一种尝试，用以描绘对象间的关系（但非仅有）。如果换了一种文明，它们的描绘方式不同，形式自然不同。数学不是究竟，只是对实相某个方面的陈述，类似盲人抚摸象腿的感受。数学和诗歌都是想像的产物。对一位纯粹数学家来说，他面临的材料好像是花边，好像是一棵树的叶子，好像是一片青草地或一个人脸上的明暗变化。也就是说，被柏拉图斥为“诗人的狂热”的“灵感”对数学家一样的重要。举例来说，当歌德听到耶路撒冷自杀的消息时，仿佛突然间见到一道光在眼前闪过，立刻他就把《少年维特之烦恼》一书的纲要想好，他回忆说：“这部小册子好像是在无意识中写成的。”而当“数学王子”高斯解决了一个困扰他多年的问题 (高斯和符号) 之后写信给友人说:“最后只是几天以前，成功了（我想说，不是由于我苦苦的探索，而是由于上帝的恩惠），就像是闪电轰击的一刹那，这个谜解开了；我以前的知识，我最后一次尝试的方法以及成功的原因，这三者究竟是如何联系起来的，我自己也未能理出头绪来。”再如奖惩是机器增强学习的核心机制，而人的学习在奖惩之间还有其他一些机制（适应，是主动要奖励／惩罚还是被动给奖励／惩罚），如同刺激——反应之间还有选择等过渡过程。另外，人类的奖惩机制远比机器简化版的奖惩机制复杂的多，不但有奖奖、惩惩机制，甚至可以有惩奖机制，给予某种惩罚来表达真实的奖励（如明降暗升），当然，明升暗降的更多。人类的那点小心思，除了二进制，机器们目前继承的还不太多。

在川流不息的车流中穿行而全身而退，就是人机态势协同的经典情境。仔细想想，态势与阴阳还有着相似关系:（状）态为阳——显性的being，（趋）势为阴——隐性的should；感（属性）为阳，知（关系）为阴，阴中有阳，阳中有阴。

人的学习与机器学习最大的不同在于是否是常识性的学习，人在教育或被教育时，是复合式认知，而不仅仅是规则化概率性输入。人的常识很复杂，扎堆的物理、心理、生理、伦理、文理…… 既包括时间空间的拓扑，也包括逻辑非逻辑的拓扑。人既是动物，也是静物。机也如此，但其动、静与人的还是有差异。人机融合学习、人机融合理解、人机融合决策、人机融合推理、人机融合感知、人机融合意图、人机融合智能才是未来发展的趋势和方向。

人有一种能把变量变成常量，把理性变成感性，把逻辑变成直觉，把非公理变成公理，把个性一变成共性多，把对抗生成妥协的能力。例如人不但可以把how用程序化知识表征，还可以把why用描述性知识表示，至于what、where、when这些问题让机器辅助检索即可。无论人的自然智能还是人工智能最后都涉及价值取向问题，可惜机器在未来可见的未来内远远不会有之。如果说价格是标量，价值是矢量，那么也可以说数据是标量，信息是矢量，机器是标量，人是矢量。若数据是标量，信息是矢量，知识就是矢量的矢量，究其因，数据终究是物理性的，本身没有价值性，信息是心理性的，具有丰富的价值取向。

目前主流人工智能理论丧失优势的原因在于，它所基于的理性选择假定暗示着决策个体或群体具有行为的同质性。这种假定由于忽略了真实世界普遍存在事物之间的差异特征和不同条件下人对世界认识的差异性，导致了主流理论的适用性大打折扣，这也是它不能将“异象”纳入解释范围的根本原因。为了解决该根本问题，历经多年发展，许多思想者已逐渐明晰了对主流智能科学进行解构和重组的基本方向，那就是把个体行为的异质性纳入智能科学的分析框架，并在理性假定下个体行为的同质性作为异质性行为的一种特例情形，从而在不失主流智能科学基本分析范式的前提下，增强其对新问题和新现象的解释和预测能力。即把行为的异质性浓缩为两个基本假定:一、个体是有限理性的，二、个体不完全是利己主义的，还具有一定的利他主义。心理学、经济学、神经科学、社会生态学、哲学等为智能科学实现其异质性行为分析提供了理论跳板和基础。简单可称之为人异机同现象，未来的智能应该在融合了诸多学科新一代数（信）息学基础上成长起来，而不是仅仅基础在当前有着诸多不完备性的数学基础之上。

新手对抽象枯燥的信息无感，而高手则能从中提炼出生动、鲜活、与众不同的信息异常敏感，即通理达情，看到别人看不到（从同质性提炼出异质性），觉察出别人觉察不了的信息，形成直觉（快）决策，这也就导致了不同寻常的非理性行为和信念不断地发生。“认知吝啬鬼”是指人类大脑为了节省认知资源，在做决定时，喜好寻找显而易见的表面信息进行处理，以求快速得出结论，而结果很可能是错的，所以以肤浅著称。与”认知吝啬鬼”不同，心理学中还有一个概念叫”完全析取推理”（fully disjunctive reasoning），指当面对多个选项需要做决策，或是要根据假设推理得出一个最佳解决方案时，会对所有的选项或者可能性的结果进行分析、评估，从而得出正确地答案。因为进行系统地分析，速度相对比较慢。

知识的默会已造成很多不确定性，规则的内隐更使得交互复杂加倍。其根源在于交互对象具有“自己能在不确定和非静态的环境中不断自我修正”。这就要求不但有知识更新的要求，而且更有组织机制挖潜强调。人机交互实质上是人的感性结构化与人的部分理性程序化之间的融合。“同情”很容易被理解为：我们在这种感受中以某种方式分有他人的情感。实际上，同情共感是一种情感秩序一致性的共现期望。我们在意识领域中至少可以发现以下六种互不相同的“共现”方式：映射的共现、同感的共现、流动的共现、图像化的共现、符号化的共现、观念化的共现。因此，“共现”虽然首先被胡塞尔用于他人经验，但它实际上是贯穿在所有意识体验结构中的基本要素。对于此，机器仍远远不能学习实现之。

霍金和穆洛迪诺都曾把光说成是“行为既像粒子又像波动”，智能也是如此弥聚，弥散如波动，聚合如粒子（注意机制的加入）。对象是静态的，分配匹配是动态的，是不断被刷新的，可谓此一时彼一时，如何把握不同时期的人机功能分析变化，这或许是一个非常有意思的问题。现在的许多无人系统或体系不是说真无人，而是没有了直接人，同时对间接人的要求会更高了。人机融合不同情境的自主机制不太一样，如个体的自主与系统、体系的自主不同。此外人机融合的一个重要问题如何平衡，能力的、时机的、方式的、研判的平衡等等，融合的不好，往往都是这些方面的失衡所造成的。例如人机交互分为自我内交互和与他外交互，许多表达或表征对其他对象仅出现逻辑上的意义，与真实发出者的心理意义往往是不一致的，这种情况体现在人机深层次沟通的不流畅和晦涩、难以为继上。比较而言，机器是擅长处理家族相似性事物的，人则是优于处理非家族相似性的，即人类可以从不相识／相似的事物中抽取相识／相似性，而人机融合是兼顾两者的。跨界交叉就是要找到非家族相似性进行有向关联。波粒二象性就是连续与离散的态势，态势与感知都有二象性，认知也有，离散时可以跨界交叉融合非家族相似性，连续时常常体现平行惯性保持家族相似性。人的非理性认知（离散）与机的理性认知（连续）结合是否符合正义（正确的应该）是衡量有效融合的主要指标之一。

人机融合智能有两大难点: 理解与反思。人是弱态强势，机是强态弱势，人是弱感强知，机是强感若知。人机之间目前还未达到相声界一逗一捧的程度，因为还没有单向理解机制出现，能够幽默的机器依旧遥遥无期。乒乓球比赛中运动员的算到做到、心理不影响技术（想赢不怕输）、如何调度自己的心理（气力）生出最佳状态、关键时刻之心理的坚强、信念的坚定等等，这都是机器难以产生出来的生命特征物。此外，人机之间配合必须有组合预期策略，尤其是合适的第二第三预期策略。自信心是匹配训练出来的，人机之间信任链的产生过程常常时：从陌生-不信任-弱信任-较信任-信任-较强信任-强信任，没有信任就不会产生期望，没有期望就会人机失调，而单纯的一次期望匹配很难达成融合，所以第二、第三预期的符合程度很可能是人机融合一致性的关键问题。人机信任链产生的前提是人要自信（这种自信心也是匹配训练出来的），其次才能产生他信和信他机制，信他与他信里就涉及到多阶预期问题。若being是语法，should就是语义，二者中和相加就是语用，人机融合是语法与语义、离散与连续、明晰与粗略、自组织与他组织、自学习与他学习、自适应与他适应、自主化与智能化相结合的无身认知+具身认知共同体、算+法混合体、形式系统+非形式系统的化合物。反应时与准确率是人机融合智能好坏的重要指标。人机融合就是机机融合，器机理+脑机制;人机融合也是人人融合，人情意+人理智。

人工智能相对是硬智，人的智能相对是软智，人机智能的融合则是软硬智。通用的、强的、超级的智能都是软硬智，所以人机融合智能是未来，但是融合机理机制还远未搞清楚，更令人恍惚的是一不留神，不但人进化了不少，机又变化的太快。个体与群体行为的异质性，不仅体现在经济学、心理学领域，而且还是智能领域最为重要的问题之一。现在主流的智能科学在犯一个以前经济学犯过的错误，即把人看成是理性人，殊不知，人是活的人，智是活的智，人有欲望有动机有信念有情感有意识，而数学性的人工智能目前对此还无能为力。如何融合这些元素，使之从冰冻的生硬的状态转化为温暖的柔性的情形，应该是衡量智能是否智能的主要标准和尺度，同时这也是目前人工智能很难跳出人工的瓶颈和痛点，只有钢筋没有混凝土。经济学融入心理学后即可使理性经济人变为感性经济人，而当前的智能科学仅仅融入心理学是不够的，还需要渗入社会学、哲学、人文学、艺术学等方能做到通情达理，进而实现由当前理性智能人的状态演进成自然智能人的形势。智能中的意向性是由事实和价值共同产生出来的，内隐时为意识，外显时叫关系。从这个意义上说，数学的形式化也许会害死智能，维特根斯坦认为:形式是结构的可能性。对象是稳定的东西，持续存在的东西；而配置则是变动的东西，非持久的东西。维特根斯坦还认为:我们不能从当前的事情推导出将来的事情。迷信恰恰是相信因果关系。也就是说，基本的事态或事实之间不存在因果关系。只有不具有任何结构的东西才可以永远稳定不灭、持续存在；而任何有结构的东西都必然是不稳定的，可以毁灭的。因为当组成它们的那些成分不再依原有的方式组合在一起的时候它们也就不复存在了。事实上，在每个传统的选择（匹配）背后都隐藏着两个假设:程序不变性和描述不变性。这两者也是造成期望效用描述不够深刻的原因之一。程序不变性表明对前景和行为的偏好并不依赖于推导出这些偏好的方式（如偏好反转），而描述不变性规定对被选事物的偏好并不依赖于对这些被选事物的描述。

最近，澳大利亚悉尼大学克里斯·雷德通过研究认为：“它们正在重新定义智能的性质。”一种被称为“海绵宝宝”的黄色多头绒泡菌（Physarum polycephalum），它们也能记忆、决策、预测变化，能解决迷宫问题、模拟人造运输网络设计、挑选最好的食物。它们能做到所有这些事，但它们却没有大脑，或者说神经系统。这一现象不得不让科学家重新思考，智能的本质究竟是什么？通过研究我们发现，智能就是人物环境系统之间的交互现象，就是智，就是慧，就是情，就是意，就是义，就是易，就是心……心理的心就是人机环境系统的交互，很难像物理还原一样进行心理还原，生／心理与物理最大的不同是:一个是生一个是物，一个是活的一个不是活的，一个不易还原，一个较易还原。人文艺术之所以比科学技术容易产生颠覆原创思想，不外乎在于跨域性的反身性——移情同感，超越自我，风马牛也相及，而人一般都不愿意因循守旧一生，所以人文艺术给人提供了更广阔的想象空间，正可谓人们看见什么并不重要，重要的是人们如何诠释看见的事物。

德里达有句名言“放弃一切深度，外表就是一切”，他隐藏的意思是：生活本身并不遵守逻辑，它是非逻辑的，无标准的，就像文字学，以一种陌生的逻辑在舞蹈。

愿上帝保佑机器学习，阿门！

四、人机融合智能

人类价值观的起源是伦理学，机器的起源是人类（它们的上帝）。现实中，人类的伦理道德困境就不少，而人类给机器人“装”进去价值，恐怕会有更多的伦理范式之间的对冲矛盾产生吧？！无论如何，从中不难看出，人机融合的未来必将会荆棘密布、困难重重。

伦理可以规范出道理，道理可以演化出物理，物理可以抽象出数理，数理可以泛化于管理、生理、心理……。正如生活中所常见的那样，一个自然数据一接触到一种自然数据或社会数据性质就会发生较大变化，尤其是那些在临界值／区的数据/数值变化，直接导致了价值的出现和信息的产生。（自然、社会、真实、虚拟）隐显混合信息／知识构成的概念“能指、所指”往往呈现出生态多样性，在理论中变得越发生动活泼跳跃。人机之间的理论、概念、知识、信息、数据之间是弥散膨胀关系，反之是聚合压缩关系，但为了不失真，它们相互之间的转换效率都需要某种方法来衡量，这些表征就是我们要寻找的关键和突破口。人机融合后，整个系统的输入、处理、输出会发生不少变化：首先通情达理（这里的“理”包括伦理和道理）就是should到being的信数（人的信息与机的数据可以通过信数这个新中介形式进行融合，这个中介信数是由一个矢量+一个标量或一组矢量+多组标量构成的矢标量（还是矢量）值，通过信数这个矢标量值进行人机融合关系程度优良好坏的初步判定，即输入阶段的评价指标。），即通过人的价值取向有选择地获取数据的过程，在这个输入过程中不但是客观数据与主观信息的融合，还应包括人的先验知识和条件；其次，在人机信息／数据融合处理过程中，人的非结构化信息架构（如自然语言）会渐变为结构化一些，而机的结构化数据据语法就会非结构化一些，在这种半结构化的情境中，不但要使用基于公理的推理，还要兼顾结合非公理性推理，使得整个推理过程更加缜密合理；最后，在决策输出阶段，人常常是由脑中若干记忆碎片，与五感接收到的信息，综合在一起，跳过逻辑层次，直接将这些信息中和的结果，反射到思维之中，形成所谓的“直觉”，其结果的准确程度，在很大方面取决于一个人的综合判断能力，而机器则是通过计算获得的结果--“间觉”进行间接评价，这种把直觉与“间觉”相结合的独特决策过程就是人机融合智能输出的一大特点。概而扩之，人机融合的关键应包括:一多与灵活弥聚的表征、公理与非公理混合推理、直觉与“间觉”交融的决策。

人的感觉常常是嵌套混合贯通联合的，视觉里包含着听觉触觉嗅觉和味觉，机器的信号采集／数据输入则是单纯唯一独立分离的，各种通道模态之间没有融合交叉。人与机的感觉秩序大相径庭，刺激与数据、信息与信号差异太大。对人而言，未感觉到的刺激往往被隐藏在感觉到时刺激里，进而形成无意识感觉或下意识感觉。不难相信，这种联觉或迁移觉在文字、词语中也有着相似的机理。机器的这种能力至今尚未被开发出来，这或许是人机融合智能方面中的一个瓶颈吧!如何打破“人擅计机长算”的基本架构，数据一多分有全息表征的输入至关重要，这里面不仅有显性的个别数值体现，还有默会的众多关系作用。人的看里包含了大量的其他感觉到的东西，如听觉、触觉、嗅觉、味觉，这些联觉都潜在在视觉里，机器的看没有联觉、统觉，机器听觉等莫不如此……另外，情境中每个东西都有众多属性和关系，当前的打标就是九牛一毛，往往打标后挂一漏十白白损失了大量的信息，所以现有的“人工”智能中数据标注工作值得商榷。深入下去，人对这类复合信息的加工也应该是复合并行的处理:既有逻辑清晰地推理过程，可谓之达理，更有感性丰富地动情发展，可谓之通情；既有基于公理地显性信息的分析，也有基于非公理地隐含信息的综合，慢慢形成显、隐理解的共存，进而演化为显、隐意向性，为下一步的规划决策做好准备。在完成情境任务目标的价值驱动下，显性的意向性可以变成理性决策，隐性的意向性可以演化成直觉决策。

在传统的人工智能研究中，联接主义的代表形式是人工神经网络，主要处理数据；行为主义的代表形式是强化学习方法，主要处理信息（奖惩后有价值的数据）；符号主义的代表形式是知识图谱和专家系统，主要处理知识和推理（有限的知识及推理）；三者有递进的味道，但距离人擅长的概念产生和理论建立相距甚远，尤其是在情感化表征、非公理性推理和直觉决策等方面机器更是望尘莫及!另外，机器学习中的反馈、迭代的生硬艰涩滞后与人的相比也是比较低级，这是因为人的态势感知能力不但来自科学技术还源于社会学、史学、哲学、文学、艺术等多方面的素养与思维技能，进而产生价值取向（态势感知的基本预设是:人可以发现未来的动向并影响它的进程）。机器的态势感知做不到，所以机器暂时还是单一领域的擅长者（如围棋、国际象棋等）。一般而言，机器在定义域（人为规则）里比人存储量大且准确、数据处理快，人在非定义域（自然情境）里比机智灵活且深刻、信息融合好。人的优势是划圈（划分领域/定义域），机的优势是画圆（精确执行），人机融合的优势则是既能划好圈又能画团圆（可跨域实现目标），正可谓：人心所想，机器所为。当前的人机融合产品还是共性的（谁都可以用，如手机、电脑），个性化服务的人机智能融合还未真正出现，但已有原始级别的系统悄悄暂露头角（如个人辅助决策系统等）。

学习，对人而言最重要的是忽略那些非关键的数据、忘记那些不重要的信息，从而在诸多事物及其之间发生的各种关系-事实中游刃有余地特征相关、关联存在、变化应该、统计概念、概率规则、把握因果，可惜的是，目前的机器学习不会忽略不懂忘记，人这种过滤的机理与价值取向判断有关，弱类似于决策机理，机器没有价值体系。从透视主义的角度来看，人的认知存在两类选择性透视，一是生理功能上的，如对可见光的感受；二是观念上的，如情境、理论和价值预设。生理功能上的意思就是说我们选择认识什么不认识什么取决于生理感受与反映乃至内在机制；观念上是指各种预设使人在认识中会放大、虚构和过滤。人的价值取向相应可分为生理性和社会性，两者都包含个性化与共性成分，并在不同的情境组合中转换、释放出来，形成风格各异的认知特点和规律。迄今为止，这些价值体系尚未赋予没有个性的机器们。人类意向性的背后就是价值取向，即价值观伦理性（伦就是类和次序），如何让形式化（数据化）的机器产生价值取向就是让它产生意向性，即形式化的意向性，可以有道德有伦理的机器或许可以由此实现，产生不了有价值取向的机器，这一切都难以起始。事实上如何产生有价值倾向的机器，就是人的伦理道德像理性逻辑一样可描述化程序化问题，即伦理如何变成道理再变成公理原理的进程。此外，人的深度学习也不同于机器的深度学习，人的深度学习是学校教育与社会教育的一致，在于理论与实践的统一，在于矛盾和悖论的协同……是一种内外共鸣同情的学与习；而机器的深度学习源于人工神经网络的研究，含多隐层的多层感知器就是一种深度学习结构，深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示。两种学习的机制根本不同：一个经过思考和实践，一个就是仿真和模拟。

为什么人类倾向于用概念、关系和属性做解释？这是因为任何解释都是在认知基本框架（常识）下进行的。人类认识世界理解事物的过程，其实就是在用概念、属性和关系去认知世界的过程。概念、属性、关系是理解和认知的基石，机器不能把不同性质的东西联系起来，人却可以相关表面上无关的事物。为什么“整体不同于其部件的总和”？因为构成整体的部件（属性）们产生了关系，有内在的也有外在的，语义的进化也许就是新关系的形成，知识的产生也是各种各样的新关系被发现的过程，关系有单向性（不是双向的）和依附性，如何建立起人机之间的双向关系至关重要，这也是一个突破口和切入点。其中，构造与功能的关系、特征属性与语义向量关系是当下科研的热点和难点。

为什么知识图谱和专家系统在实际应用中漏洞百出、问题层出不穷？其中最重要的原因是关系的梳理没有到位。其中对于主观参数和客观参数的不匹配不协同就是一个重要问题。正如维纳对智能控制的定义：“设有两个状态变量，其中一个是能由我们进行调节的，而另一个则不能控制。这时我们面临的问题是如何根据那个不可控制变量从过去到现在的信息来适当地确定可以调节的变量的最优值，以实现对于我们最为合适、最有利的状态。”如一个认知模型如何处理突出值、价值观、频率性、可信度等主客观融合特性，也许是评判其好坏的主要依据吧。早年Fechner在创立心理物理学时，提出过外部的心理物理学和内部的心理物理学等概念。外部物理世界各种物理刺激作用于人的感官，引起人的内部物理世界的活动，即脑的活动，从而产生内部心理世界的感觉体验。Fechner认为人的感觉过程既涉及外部物理世界的物理刺激，又涉及内部物理世界的脑活动过程，还有内部心理世界的感觉体验。他认为外部的心理物理学研究外部物理刺激强度和内部心理世界感觉体验强度之间的关系，而内部的心理物理学则研究内部物理世界即脑活动强度和内部心理世界感觉体验强度之间的关系。高级意识是什么呢，有人认为高级意识就是大量的基础意识的集成，把大量不同种类的基础意识有机地集成到一起，这种集成应该具有穿越性，能够把“无关”事物／事实有指向地相关起来，穿越比集成更迅捷。目前看来，单纯人的智慧在单个领域落后于人工智能已成为现实，对跨领域超级智能的期待仍无依无据，但是人机融合智能则可以更快更好更灵活地同化外来信息和顺应外部变化，是有机与无机的跨界混搭，是记忆与存储、算计与计算、直觉与间觉、自主与它主、慧与智的弥聚，也许这中融合智能正是未来的方向。

人机融合智能的一个核心问题是介入问题，这也是一个体验问题，即人与机相互之间何时何处以何种方式（或平滑或迅速）介入的问题，尤其是在歧义点或关键阈期间介入的反应时、准确率。例如，交互中机器出现的变形了的非自主“主观”对人机融合很重要，尤其是在特定定义域（如围棋）中，可以改变人的习惯和偏好，甚至是世界观。再如，在融合时彼此之间的接受、容忍、信任、匹配、调度、切换、说服、熟练程度，以及如何训练出个性化的伙伴关系等都是具体亟待解决的问题。例如未来的人机说服技术，就需要人机之间的通情达理，因势利导。由于人机融合在细节层面和人人之间的合作几乎同样复杂，或者说是有一些另类的复杂问题。因而可以认为，从技术角度讲，人机融合智能绝不仅是一个数学仿真建模问题，还应是一个实验统计体验拟合的问题。

一般来讲，对于一项技术的理解要从抽象的角度着手，抽象的角度越高，适应范围越广，用一层一层的抽象的方法去理解事物的本质，就能从思想上突破技术的局限性。比如一个简单的问题：计算机是什么？计算机的本质就是一个可编程的、用于计算的机器。任何问题只要能转换成计算问题，那计算机就能解决，如果不是计算问题，那计算机就解决不了。人处理的外部客观事物属性／关系本身就包含多重意义，再加上人本身的主观认知也丰富多彩，因而复杂性是不可避免的。相比之下，机器的数据分析倒是相对自然简单一些。信息的输入、处理、输出过程对人而言都是双向的，如“看想看的”、“听想听的”就是眼耳与大脑的双向流动，而弹奏想弹的曲子则是手脑之间的双向作用；数据的处理过程则是机器的单向使然，人为的反馈前馈仍难以掩盖其无机性。罗素认为，我们所说的每个事物都只由我们拥有的直观知识和理解的事物的说法（也许是合成的）构成——知识实质上凭的是感性知觉。例如，机器不会学不会问，所以没学问。你问人: 吃了吗？人理解!你问机: 充（电）了吗？机会理解吗?那种试图以现有形式化方法获取类人智能的思想也许确实是行不通的，因为从本质上讲，所有的仿真和模型都是错误的，只不过有些模型可参考性较大一点罢了。

人与人之间有人道，机与机之间有机道，人与机之间有人机道。数据、信息、知识，三者之间由于主体介入程度上的不同，而性质随之变化。例如：当你面对一堆数据时，数据与主体产生关联，你就发现或得到信息；当信息做为对象被主体思维运算后，形成认识时，信息就变成了知识；当知识从主体传播出来，面对其他接收主体，又转换成了信息；当信息存储在外，无主体对应或介入时，就变成了数据。在语法面，规则性的语法逐渐为概率性的语法所替代，语义/语用方面，则出现了可能（性）的价值是新型决策依据

人机融合智能科学要研究的是一个物理与生物混合的复杂系统。智能作为一种现象，就表现在个体与自然、社会群体的相互作用和行为过程中。系统科学的一个未曾言明的假设是，一切事物都是以系统方式存在和运行的，都可以用系统观点来认识，一切问题都需要用系统方式来处理。关于认知的一系列问题也不例外。基于信息技术的认知延展可以为延展认知的哲学假说进行辩护，而心灵的边界将变得更为模糊，身体、大脑、环境、技术、社会正在形成一种新的相互融合的智能体。这不仅仅会改变人的基本认知结构，也进一步改变了我们对人性以及对自身存在状态的理解。人与不同机融合表现出来的智能是不同的，与手机交互时的智能远远大于与自行车交互时的智能。或许这些行为和现象类似物理学一样必然有统一的力、相互作用、基本元素来描述。例如在图像识别中，真实的识别不是在图像中的位置（图像是一个平面）。而是要识别图像指向的空间中的位置。要建立空间概念，以及物体在空间中相互关系的概念。单纯基于概率统计的方法（先天智能）解决不了看图说话的问题，要建立一种基于当前图像个性反馈（后天智能）。人，有一种随时随地都可以“标注”的能力。“打”标,不管怎么标注都是终止于符号，而不是世界上的物体，应该做个能和环境世界打交道的东西，标注就是物体本身，物体的图像、声音、触觉、气味都可以通过训练映射到物体。不是说符号没用，符号本身也是物体对象，需要通过训练来认识它们。符号到其代表的物体的映射（或指向）关系也是通过训练形成。

对人类而言最最神秘的意识是如何产生的，这个问题一直受到学者们的关注。其中有两个主要问题，一是意识产生的基本结构，二是交互积累的经验。前者可以是生理的也可以是抽象的，是人类和机器的差异，后者对人或机器都是必须的。意识是人机环境系统交互的产物，目前的机器理论上没有人机环境系统的（主动）交互，所以没有你我他这些参照坐标系。有人说“当前的人工智能里面没有智能，时下的知识系统里面没有知识，一切都是人类跟自己玩，努力玩得似乎符合逻辑、自然、方便而且容易记忆和维护”,此话固然有些偏颇，但也反映出了一定的道理，即意识是人机环境系统交互的产物，目前的机器理论上没有人机环境系统的（主动）交互，所以没有你我他这些参照坐标系，从而很难反映出各种隐含着稳定和连续意义的某种秩序。还有，人处理信息的过程是变速的，有时是自动化的下意识习惯释放，有时是半自动化的有意识与无意识平衡，有时则是纯人工的慢条斯理，但是这个过程不是单纯的信息表达传输，还包括如何在知识向量空间中建构组织起相应的语法状态，以及重构出各种语义、语用体系。

而且自由调节的环境系统触发了自主体系的反向运动，由此形成了人机与环境之间的多向运动或多重运动，进而导致了矛盾和冲突。这种不一致甚至相反问题的解决常常不是单纯数学知识力所能及的，一个问题有边界、有条件、有约束的求解时是数学探讨，同一个问题无边界、无条件、无约束求解时往往变成了哲学研究。例如虚构如何修正真实，真实怎样反馈与虚构？这将是一个很有味道的问题！

五、发展与展望

人机融合智能就是由人、机、环境系统相互作用而产生的新型智能系统。之所以说它与人的智慧、人工智能不同，具体表现在三个方面:首先是在智能输入端，它是把设备传感器客观采集的数据与人主观感知到的信息结合起来，形成一种新的输入方式；其次是在智能的数据／信息中间处理过程，机器数据计算与人的信息认知融合起来，构建起一种独特的理解途径；最后是在智能输出端，它把机器运算结果与人的价值决策相互匹配，形成概率化与规则化有机协调的优化判断。人机融合智能也是一种广义上的“群体”智能形式，这里的人不仅包括个人还包括众人，机不但包括机器装备还涉及机制机理，除此之外，还关联自然和社会环境、真实和虚拟环境等。着重解决上述人机融合过程中产生的智能问题。比如诸多形式的数据/信息表征、各种逻辑/非逻辑推理和混合性的自主优化决策等方面。

在人类的历史长河中，古埃及的象形文字、古巴比伦的楔形文字、古印度河流域的印章文字和中国的甲骨文共同形成了世界四大古文字体系。唯有中国的甲骨文穿越时空，至今仍在使用并且充满活力。其根本原因在于西汉时期出现了隶书—这一表意性文字，自此，中文文字完成了由表形（图画）到表意的惊险一跳，成为世界上唯一一个连绵不断的文明！所谓会意字，它是把两个或者两个以上的不同构件放到一起，从而组成一个字，产生一个意思，这叫会意。简单地说，态势感知就是象形+会意，而态势感知又是智能科学的基础，所以不难看出，智能科学的核心和关键依旧是何时能够完成“得意忘形”这一惊险的一跳，目前科技进展的种种迹象也表明：人的意向性+机的形式化是完成智能最高形式——“得意忘形”可能性最大的方式。

总之，人机融合智能研究是智能技术发展到一定程度的产物，它既包括人工智能的技术研究，也包括机器与人、机器与环境及人、机、环境之间关系的探索。与很多新兴学科一致，它的历史不长，但发展速度很快。尤其是近些年，依托着深度学习的兴起，以及一些大事件（AlphaGo系列）的产生，人们对人工智能本身，以及人机融合智能研究的兴趣陡然上升，对其相关研究与著作也相对增多。但是，可以预期到的是，人机融合智能技术本身离我们设想的智能程度还相去甚远，且自发的将人的智能迁移到机器中的想法本身实现难度就极大。这是一个很难回避的问题。这些都需要目前的智能科学家们做进一步的研究。人机融合智能研究不仅仅要考虑机器技术的高速发展，更要考虑交互主体-人类的思维与认知方式，让机器与人类各司其职，互相促进，这才是人机融合智能研究的前景与趋势。

人机融合中有多个环节，有些适合人做，有些适合机做，有些适合人机共做，有些适合等待任务发生波动后再做，如何确定这些分工及匹配很重要，如何在态势中感知？或在一串感知中生成态势？从时间维度上如何态、势、感、知？从空间维度上如何态、势、感、知？