AI革命尚未到来！-人工智能的专栏

AI革命尚未到来！

2018-05-30 09:25:57栏目：默认栏目 IP属地：IP未知

来源：云头条

作者：Michael I. Jordan是加州大学伯克利分校电气工程和计算机科学系和统计系的教授

AI是当下这个时代的口号。这是技术人员、学者、记者和风险投资家都挂在嘴边的术语。与许多从技术学术领域跨越到公众领域的术语一样，这个术语的使用存在严重的误解。但这不是公众不了解科学家的典型情况――科学家常常与公众一样迷惑不解。我们这个时代在某种程度上看到芯片拥有与我们人类媲美的智能，这个想法让我们所有人饶有兴趣，我们既兴奋又害怕。而遗憾的是，这让我们分心了。

对于当下这个时代，有一种不同的描述。不妨听听下面这个故事，关于人类、计算机、数据和生死的故事，故事的重点是芯片智能这类幻想之外的东西。

14 年前我妻子怀孕时，我们做了超声检查。房间里有一位遗传学家，她指出胎儿心脏周围有几个白点。她指出：“这是唐氏综合症的标志，你的风险现已上升到了1/20。”她进一步告诉我们，可以做个羊膜穿刺，确定胎儿是否存在导致唐氏综合症的基因转变。但是羊膜穿刺有风险，穿刺过程中胎儿致死率约1/300。身为统计学家，我决定搞清楚这些数字来自哪里。长话短说，我发现十年前已在英国进行过一项统计分析，表明钙沉积的这些白点确实是表明唐氏综合症的指标。但我也注意到，检查中使用的那台影像仪器每平方英寸的像素比英国研究中使用的仪器多几百个。我回过头来告诉那位遗传学家，我认为白点可能是误诊，它们实际上是“白噪声”（white noise）。她说：“啊，这解释了为什么我们几年前开始看到诊断出唐氏综合征的病例增加，那时新仪器刚送来。”

我们没做羊膜穿刺，几个月后迎来了健康的女儿。但这件事让我备感困扰，尤其是我在大致计算后确信，全世界当天有成千上万的人被诊断出这种病，其中许多人选择了羊膜穿刺，导致许多婴儿不必要的死亡。除非得到解决，否则这一幕日复一日地上演。这件事所揭露的问题涉及的并非我个人的医疗护理，而是整个医疗系统：在不同地方和时间衡量变量和结果，进行统计分析，并在其他地方和时间利用这些结果。这个问题不仅与数据分析本身有关，还与数据库研究人员所说的数据“溯源”（provenance）有关――笼统地说，数据源自哪里，从数据得出了什么推理，那些推理与目前情况之间的相关性如何？虽然训练有素的人也许能逐一解决所有这些问题，但问题在于如何设计一个能做到这样的全球规模医疗系统，又无需这种事无巨细的人类监管。

我还是一名计算机科学家；我想到，构建这种全球规模的推理和决策系统所需的原则，融合计算机科学与统计学，并考虑人类的使用，这些在我所学的知识体系中根本未曾提及。我还想到，开发这类原则至少与构建玩游戏或感觉运动的技能令人眼花缭乱的AI系统一样重要――不仅医疗领域需要这类原则，商业、交通和教育等领域也需要。

无论我们是否很快逐渐理解“智能”，我们确实面临着一大挑战：结合计算机和人类，又能改善人类生活。虽然有些人认为克服这个挑战不如开发“AI”来得重要，但其实我们也可以把它看作开辟工程学的新分支。就像过去几十年的土木工程和化学工程一样，这门新学科旨在汇集几个重要思想的力量，在保证安全的前提下，为人们带来新的资源和能力。土木工程和化学工程建立在物理和化学的基础上，这门新的工程学科将建立在上个世纪赋予意义的概念的基础上，比如“信息”、“算法”、“数据”、“不确定性”、“计算”、“推理”和“优化”等概念。此外，由于新学科的重点主要放在来自人类的数据和人类方面的数上据，因此其发展将离不开社会科学和人文科学的视角。

虽然基本模块已开始出现，但结合这些模块的原则尚未出现，因此这些模块目前只是临时拼凑起来。

因此，就像土木工程出现之前人类造房和造桥一样，人类着手建造涉及机器、人类和环境的社会规模的推理和决策系统。但正如早期的建筑物和桥梁有时无法预见地倒塌，并酿成惨剧，我们许多早期的社会规模的推理和决策系统已经暴露出严重的概念缺陷。

而遗憾的是，我们不是非常善于预料下一个出现的严重缺陷会是什么。我们缺少一门有分析和设计原则的工程学科。

目前围绕这些问题的大讨论常常把“AI”用作含义百变的字眼，很难推断出这项新兴技术的范围和后果。不妨先更认真地考虑“AI”用来指什么，包括最近和过去。

今天所谓的“AI”（尤其是在公众圈）主要是过去几十年被称为“机器学习”的技术。机器学习属于算法领域，融合了统计学、计算机科学及另外许多学科的概念，从而设计处理数据、进行预测和帮助决策的算法。机器学习给现实世界带来了实实在在的影响，并非最近才有。的确，机器学习会给工业带来重大影响，这在 90 年代初就已经一目了然；本世纪初，像亚马逊这些高瞻远瞩的公司已经在整个公司中使用机器学习，解决欺诈检测和供应链预测等方面至关重要的后端问题，并构建面向消费者的创新服务，比如推荐系统等。在接下来的 20 年，随着数据集和计算资源迅速增加，机器学习显然很快不仅会助力亚马逊，实际上还会助力决策与大规模数据紧密相关的任何公司。新的商业模式会涌现。“数据科学”这个术语开始用来指代这个现象，体现了需要机器学习算法专家与数据库和分布式系统专家合作，共同构建可扩展的、健壮的机器学习系统，还体现了因此获得的系统带来了更大的社会和环境影响。

在过去的几年，概念和技术趋势的这种融合改头换面成了“AI”。而这种改头换面值得一番深究。

回顾历史，“AI”这个术语是上世纪50 年代末提出来的，指用软硬件创造拥有人类般智力的实体这个雄心勃勃的愿景。我们将使用“仿人类AI”（human-imitativeAI）这个术语指这个愿景，强调这个概念：这个人工智能实体应该似乎是我们中的一员，即便外观上不像人类，至少智力上像。这基本上一种学术性活动。

是如果不是身体上相似那么至少应该从精神上相似（先不管这意味着什么）。这主要是一种学术愿景。虽然运筹学、统计学、模式识别、信息论和控制论等相关的学术领域早已存在，而且常常受到人类智能（和动物智能）的启发，但这些领域大概专注于“低级”信号和决策上。比如说，松鼠能够感知它所生活的森林的三维结构，并在树枝间跳跃，这种能力对这些领域颇有启发性。“AI”旨在专注于不同的层面：人类“推理”和“思考”的“高级”或“认知”能力。然而60年后，高级推理和思考仍然难以搞定。现在被称为“AI”的发展成果主要出现在与低级模式识别和运动控制有关的工程领域，以及统计学领域――这门学科专注于找到数据中的模式，并专注于进行有凭有据的预测、检验假设和做出决策。

的确，上世纪五六十年代，著名的“反向传播”算法最初出现在控制理论领域；80 年代初大卫•鲁梅尔哈特（DavidRumelhart）重新发现了这种算法，现在它被认为是所谓的“AI革命”的核心。它的早期应用之一是优化阿波罗登月宇宙飞船的推力。

虽然自60年代以来已取得了很大的进展，但成果恐怕不是源自追求仿人类的AI。确切地说，以阿波罗宇宙飞船为例，这些概念常常隐藏在幕后，是专注于克服具体工程挑战的研究人员的杰作。虽然公众看不到，但许多方面的研究和系统构建取得了巨大成功，比如文档检索、文本分类、欺诈检测、推荐系统、个性化搜索、社交网络分析、规划、诊断和A/B测试等――这些进步推动了谷歌、Netflix、Facebook 和亚马逊等公司的发展。

人们可能完全同意将所有这些称为“AI”；的确，人们似乎就是这么做的。这种叫法可能让优化或统计研究人员颇感意外，他们一觉醒来发现自己突然被称为“AI研究人员”。但抛开这方面不谈，一个更大的问题是，使用这个定义不明确的缩略词让人们无法清楚地了解目前的一系列知识和商业问题。

过去二十年工业和学术界取得了重大的进展：常常被称为“智能增强”（IA）的技术是“仿人类AI”的一种补充。在这方面，计算和数据用来构建增强人类智力和创造力的服务。搜索引擎可以被看作是IA的一个例子（它增强人类记忆力和事实性知识），自然语言翻译也是如此（它增强人类的沟通能力）。基于计算生成声音和图像称得上是艺术家们的调色板和创意增强工具。虽然这种服务可能涉及高级推理和思考，但目前它们并不涉及――它们主要执行各种字符串匹配和数值运算，以获取人类可以利用的模式。

希望读者会容忍最后一个缩略词，不妨大致设想一下“智能基础设施”（II）学科：存在一个包含计算、数据和物理实体的网络，使得人类环境更稳定、更有趣、更安全。这种基础设施正开始出现在交通、医疗、商业和金融等领域，对个人和社会产生巨大影响。这个话题有时出现在围绕“物联网”的谈论中，但物联网通常仅仅指将“物件”放到互联网上这个问题，而不是指与这些“物件”有关的一系列极其重大的挑战，这些物件能够分析那些那些数据流以发现关于世界的事实，并且在比比特高得多的抽象级别与人类及其他“物件”进行交互。

比如说，回到我的个人经历，我们可以想象生活在一个“社会规模的医疗系统”中，在医生和植入在人体中的设备之间建立起了数据流和数据分析流，因而帮助人类进行诊断和提供护理。这个系统将把来自人体细胞、DNA、血液检测、周围环境和人群遗传学的信息与药物和治疗方面的大量科学文献结合起来，它将不仅专注于单个患者和医生，还专注于所有人类之间的关系――就像目前的医学检测让一群人（或动物）上所做的实验取得的成果可以用来治疗其他人。就像目前的银行体系专注于财务和支付领域的这类挑战，这将有助于保留相关性、溯源和可靠性这些概念。虽然人们可以预见到这种系统会出现许多问题，包括隐私问题、责任问题和安全问题等，但应该将这些问题视为挑战，而不是绊脚石。

我们现在遇到了一个关键问题：致力于开发传统的仿人类AI 是克服这些重大挑战的最佳或唯一的方法吗？事实上，机器学习最近的一些成功故事出现在与仿人类AI 有关的方面，比如计算机视觉、语音识别、游戏和机器人等方面。所以，也许我们应该等待这些领域的进一步发展。这里有两点要提一下。首先，虽然无法从报纸上获悉，但仿人类AI方面的成功实际上很有限――我们远未实现仿人类AI的愿景。遗憾的是，仿人类AI方面取得哪怕有限的进步让人既兴奋又害怕，这导致集体过于亢奋和媒体过于关注，工程界的其他领域并未出现这一幕。

其次，更重要的是，这些领域的成功不足以解决重要的IA和II问题，也不是解决这些问题所必需的。在效率方面，以自动驾驶汽车为例。要实现这种技术，就需要解决一系列工程问题，这些问题与人类能力（或人类缺乏的能力）可能没多大关系。整个交通系统（II系统）可能更像目前的空中交通管制系统，而不是像目前松耦合、向前看、疏忽大意的驾驶员群体。它将比目前的空中交通管制系统复杂得多，尤其是它使用大量数据和自适应统计建模为细化的决策提供依据。需要重视的正是那些挑战，专注于仿人类AI可能只会让人分心。

至于必要性，有时人们认为仿人类AI愿景包含IA愿景和II愿景，因为仿人类AI系统不仅能够解决AI的传统问题（比如图灵测试），还是我们解决IA和II问题的最佳选择。这种观点以前很少出现过。

一个相关的观点是，人类智力是我们知道的唯一智力，第一步我们应该模仿它。但人类其实并不擅长一些类别的推理――我们存在失误、偏见和局限。此外，重要的是，我们没有进化到执行现代II类系统必须面临的那种大规模决策这种地步，也没有进化到处理II环境下出现的那种不确定性这种地步。有人可能会说，AI系统不仅会模仿人类智力，还会“纠正”它，还会扩展、处理重大问题。但这是科幻小说中的场景，这种推测性的观点虽然饶有趣味，但面对开始出现的重大的IA和II问题，不应该是我们在将来的主要策略。我们需要根据事实真相来解决IA和II问题，而不是仅仅视作仿人类AI议程的结果。

不难确定II系统中算法和基础设施方面的挑战，这些挑战不是仿人类AI 研究的核心课题。II系统需要能够管理分布式知识库，这些知识库在不断变化，可能在全球范围内不连贯。这类系统在做出及时的分布式决策时必须处理云与边缘的交互，还要处理长尾现象：一些人方面的数据很多，大部分人方面的数据很少。它们必须克服跨管理和竞争边界来共享数据的困难。最后，尤为重要的是，II系统必须将激励和定价等经济概念纳入到统计和计算基础设施的领域，这些基础设施将人与人以及人与有价物品联系起来。这类II系统不仅提供服务，还在创建市场。音乐、文学和新闻等领域期盼这类市场出现，以便数据分析将生产者和消费者联系起来。这一切都必须在不断演变的社会、道德和法律规范的大背景下完成。

当然，传统的仿人类AI问题仍然同样值得关注。然而，目前我们专注于通过收集数据、部署“深度学习”基础设施以及演示模仿某些定义狭窄的人类技能的系统来开展AI研究，往往会使注意力偏离传统AI方面悬而未决的重大问题。这些问题包括：需要将意义和推理做入到执行自然语言处理的系统中，需要推理和表示因果关系，需要开发计算方面易于处理的机制来表示不确定性，以及需要开发制定并执行长期目标的系统。这些仿人类AI的典型目标，但在目前围绕“AI革命”的喧嚣中，很容易忘记这些问题尚未解决。

IA也将仍然相当重要，因为在可预见的将来，计算机对实际情形进行抽象推理的能力无法与人类相提并论。我们需要经过深思熟虑的人机交互，才能解决最紧迫的问题。我们还希望计算机帮助人类的创造力达到新的水平，而不是取代人类的创造力（无论这可能意味着什么）。

约翰·麦卡锡（John McCarthy，曾是达特茅斯大学的教授，后来任职于麻省理工学院）创造了“AI”这个术语，显然是为了区别于诺伯特·威纳（Norbert Wiener）（当时是麻省理工学院的资深教授）的研究工作。威纳首创了“控制论”，用来指他自己构想的智能系统――这个愿景与运筹学、统计学、模式识别、信息论和控制理论密切相关。另一方面，麦卡锡强调与逻辑之间的联系。有趣的是，在麦卡锡的术语这面旗帜下，逐渐在目前这个时代唱主角的却是威纳的理论。（然而，这种情形当然只是暂时的；轮流唱主角的现象在AI界比在大多数领域更常见）。

但我们需要超越麦卡锡和威纳的特定历史视角。

我们要认识到，目前围绕AI的大讨论（专注于行业的狭窄分支和学术的狭窄分支）让我们可能无视全方位的AI、IA和II带来的挑战和机遇。

重点不是实现科幻小说中幻想的超人类机器，而是人类需要了解和引导技术，因为技术在人们的日常生活中变得更有影响力。此外，还需要听到来自各行各业的不同声音，不仅仅是技术界的讨论。一味盯着仿人类AI会屏蔽掉广泛的声音。

虽然行业会继续推动发展，但学术界也将继续发挥重要作用，不仅提供一些最具创新的技术理念，还将计算和统计学领域的研究人员与其他领域的研究人员（尤其是社会科学、认知科学和人文科学）结合起来，亟需他们的贡献和视角。

另一方面，虽然人文科学和自然科学在将来很重要，但我们也不该假装谈论的是规模和范围空前的工程项目之外的东西――社会旨在构造全新种类的人工制品。我们不想构建这样的系统：帮助我们研发药物、促进交通便利和带来商业机会，结果事后却发现这些系统其实用不了――它们犯的错误反而了影响人类的生活和幸福。在这方面，正如我强调的那样，面向数据和面向学习的领域还没有出现一门工程学科。尽管面向学习的领域似乎激动人心，但还无法认为它们形成一门工程学科。

此外，我们应欣然接受这个事实：我们目睹工程的一个新分支出现。在学术及其他领域，提到的“工程”这个术语常常有狭窄的定义――暗示冷冰冰、无表情的机器，人类失去控制。但是工程学科应该是我们希望它成为的那个样子。

在当下，我们有大好的机会来构想历史上全新的东西：一门以人为本的工程学科。

我拒绝给这门新兴的学科命名，但如果将来“AI”这个缩略词继续用作一个暂定术语，我们应意识到这个术语的限制性。我们应拓宽范围，少一点炒作，认识到前方的重大挑战。