AI英雄|对话Gregory:机器智能和人类智力的不同就像飞机和鸟的区别-人工智能的专栏

AI英雄|对话Gregory:机器智能和人类智力的不同就像飞机和鸟的区别

2017-12-11 16:10:21栏目：默认栏目 IP属地：IP未知

来源：网易智能

本文系网易智能工作室出品

聚焦AI，读懂下一个大时代

第52期AI英雄栏目对话嘉宾为数据挖掘领域的专家Gregory Piatetsky-Shapiro，他谈论了意识、工作、数据科学和迁移学习等话题。

＊
人物观点：
机器智能将会和人类的智力大不相同，就像飞机的飞行和鸟是不一样的。飞机并没有模仿鸟类，而是受到鸟类的启发。
相比担心人工智能取代人类工作，我更担心由此导致财富和社会利益的分配越来越不平等。

Gigaom｜选自

网易见外翻译机器人｜翻译

李擎｜审校

Gregory Piatetsky-Shapiro是数据科学家，数据挖掘和机器学习网站KDnuggets的总裁，KDD（知识发现和数据挖掘会议）联合创始人。作为商业分析、数据挖掘和数据科学领域的领军人物，Gregory如何看待人工智能与数据科学的发展？

谈人工智能定义：它的目标是不断变化的

问：如何定义人工智能？

Gregory：人工智能指的是机器去做那些人类认为需要智能的事情，所以从这个定义来讲人工智能的目标是不断变化的。在20世纪50年代，人们认为玩西洋跳棋是需要智能的，紧接着就有了一个程序。后来象棋取代西洋跳棋成为讨论对象，但后来电脑也完成了。后来，人们认为玩围棋将是非常困难的，或者是驾驶汽车。通用人工智能是指一个领域，在这个领域人们试图开发智能机器。那么什么是智能呢？我相信我们会讨论这个问题，但通常人们会各持己见。

问：我认为从人工智能这个词中产生的很多问题在于，人们对于“智能”并没有统一的定义。所以，你是在说，如果我们一直在改变人工智能的目标，那听起来就像是你在说，我们今天没有那么智能的系统。

Gregory：不是的。我们今天的很多系统，在20年甚至10年前都被认为是非常智能的。我们的进步非常大，所以我认为这些系统很有可能会在许多领域超越我们的智慧，可能并不是所有领域，但在许多狭窄的、明确的领域，它们已经超出了我们的智力。我们现在拥有的很多系统都发挥着各自的作用。但我们没有任何系统是完全智能的，也就是现在的新术语AGI（Artificial General Intelligence），即通用人工智能。这些系统在未来仍将处于领先地位。

谈通用人工智能：
可以实现，但需要更多突破

问：让我们来谈谈AGI。现在我们拥有一套技术,能够构建我们今天所使用的“不完全的”或者“狭窄”的人工智能。你认为实现“AGI”只是继续应用更快的芯片，更好的算法，更大的数据集，等等这些吗？或者你认为一个AGI真的是一个性质完全不同的东西吗？

Gregory：我认为从本质上讲，AGI是一种不同的东西，但我认为它不仅是可以实现的，而且是不可避免的。人类也可以被认为是生物学机器，所以除非我们拥有一些不同寻常的、不能转移到机器上的技能，否则我认为那些最聪明的人很有可能会开发出一些最智能的算法，并且机器最终可以实现AGI。而且我相信这将需要更多的突破。比如，深度学习就是一项重大突破，它对艺术领域的进步做出了巨大的贡献，我想我们将会看到在实现AGI这一目标之前有其他重大的突破。

问：你会看到人们对实现AGI的时间的预测范围大概是5年到500年，就我的经验来讲，这是一个很有说服力的事实，大概就是这样一个时间范围。你会将目标对准这一领域吗？你认为你会活到它出现的时候吗？

Gregory：作为一名数据科学家，我的专长就是做出预测，所以我知道我们现在并没有足够的信息。我觉得没人真正知道这一时间。我并没有能作出预测的根据。我希望这个时间不是5年，而且我认为，我们作为一个社会人的经历表明，我们并不知道如何从现在起对100年内的事情做出预测。那些所谓的“未来学”文章很能说明问题——人们在50年前写了这些文章来预测50年后会发生什么，但是看看50年前那些人的想法是多么天真。我认为我们不会对50年内会发生的事情做出很好的预测。我不知道这个时间到底是多久，但我想可能会超过5年。

问：有些人认为，是我们的意识使我们变得智慧，并且意识是组成我们智力的不可或缺的一部分。你认为一台机器需要具备意识才能实现“AGI”吗？

Gregory：我们并不真正了解什么是意识。我认为机器智能将会和人类的智力大不相同，就像飞机的飞行和鸟是不一样的。飞机和鸟类都能够飞行，飞机飞行所用到的空气动力学和物理学原理与鸟类相同，但它们的工作原理却截然不同。飞机并没有模仿鸟类，而是受到鸟类的启发。我认为，同样地，我们可能会看到，机器智能不会复制人类的智慧或人类的意识。“意识到底是什么？”这更像是一个哲学问题，但它可能涉及某种形式的自我意识。我们当然可以看到，机器和机器人已经可以发展自我意识。

大家都知道，自动驾驶汽车已经需要做一些这样的事情了。它们需要知道自己的确切位置。它们需要预测未来会发生什么。它们需要知道，如果它们做某件事情，其他汽车会怎么做。他们有一种被称为思维模式的形式，即镜像智能。关于这个话题，一个有趣的轶闻是，当谷歌的自动驾驶汽车最初开始试验时，它无法穿过十字路口，因为它总是向其他车辆屈服。它遵循的是提前设定的规则，但不是人们实际执行的规则。所以它被困在那个十字路口大概一个小时左右。然后工程师们调整了算法，这样它就能更好地预测人们会做什么，以及它会做什么，现在它已经可以顺利通过十字路口了。它就具备某种形式的自我意识。我认为其他机器人和机器智能会发展出某种形式的自我意识，它是否会被称为意识，将会是我们的后代讨论的。

问：你认为电脑真的能体验到像意识这样的东西吗？它难道不需要先体验世界才能变得真正聪明吗？

Gregory：如果电脑有传感器，实际上他们已经体验过这个世界。自动驾驶汽车正在通过它的雷达和激光雷达和其他各种传感器来感受这个世界，所以他们确实有这种体验，而且他们确实有传感器。我认为讨论计算机的意识是没有意义的，讨论这个问题就像去讨论“针的针脚上能够容纳多少个天使”。我认为我们可以讨论的是它们能做什么或者不能做什么。至于它们是如何经历的，这更像是哲学家应该讨论的问题。

问：在AGI领域有两个不同的阵营。其中一个阵营认为，人类有100、200或300种不同的技能，把它们放在一起，就组成了人类。另一个是，我们在节目中请到过佩德罗·多明戈斯，他有一本书叫做《主算法》，这本书假设，存在一种算法可以以人类的方式解决任何问题，或者说任何能够解决的问题。你赞成哪种观点？你认为存在一种简单的方法来实现AGI吗？

Gregory：我不认为有简单的方法存在。实际上，我是佩德罗的好朋友，去年我在他的书中主持了他的网络直播。但我认为他寻找的主算法可能存在，但这并不排除有很多额外的专门技能。我认为有很好的证据表明，人类存在一般意义上的“智力”，例如，人们在SAT和数学上的得分是不同的。我知道我的语文分数比我的数学分数低得多。但通常如果你的某项成绩高于平均水平，那么你的另一项成绩也会超过平均水平。同样地，如果你的某项成绩低于平均水平，你的其他成绩也会低于平均水平。人们似乎也有一些“通用技能”，此外还有很多专业技能。比如，你可以成为一名伟大的棋手，却不知道如何演奏音乐，反之亦然。我认为有一些通用的算法，其他很多专门的算法可以利用这个领域的特殊结构。你可以这样想，当人们在开发国际象棋程序时，他们最初会应用一些一般的算法，但后来他们发现，他们可以通过建立专门的硬件来加速这些程序，而这些硬件只针对国际象棋。同样地，当人们学习一项新技能时，他们通常会以一种一般化的方式作为开始，然后逐渐发展专业技能，加速他们的工作。我认为人工智能领域也是同样的道理。可能会有一些通用的算法，但也会有办法开发很多特殊技能，这些技能可以利用任何具体或特定的任务。

谈AI取代人类工作：更担心AI
导致财富和社会利益分配不平等

问：人们关于人工智能有两大担忧。第一个担忧就是，人工智能将会取代人类的工作，所以他们将会有大量的失业，许多反乌托邦电影都在上演这一场景。然后其他人说，不是这样的，随之而来的每一项技术，即使是破坏性的技术，比如电力，机械动力取代动物力量等等，只是被人类用来提高他们的生产力，而这也是人类生活水平提高的原因。在这个问题上，你怎么看？

Gregory：相比于乐观的想法来说，我的担心更多一点。我乐观的地方在于，我相信技术会进步。但是我担心，这将导致财富和社会利益的分配越来越不平等。在马萨诸塞州，曾经有很多收费员。收费并不是一项非常复杂的工作，但是最近他们被淘汰了。而淘汰它们的机器不需要完全的智能，基本上只是一个射频识别传感器。因此，我们已经看到许多工作被一种更简单的自动化方式所淘汰。而社会对此该做些什么，目前没有人知道。我认为之前像这样的中断有更长的时间跨度。但是现在，当像这样的收费员被裁员时，他们没有足够的时间来重新学习新的技能，比如成为计算机程序员或医生。我也不确定我能为之做些什么。但我喜欢来自斯坦福大学Coursera的吴恩达的提议。他提出了“基本收入”的修改版，即失业和找不到工作的人可以获得某种形式的基本收入。但他们不能坐以待毙，他们必须学习新的技能，学习一些新的和有用的东西。所以也许这是一个可能的解决办法。

问：除去大萧条时期，美国230年来的失业率一直在5%到9%之间，并没有超出过这个范围。当这些具有高度颠覆性的技术出现时，它们出现的很快，并且消除了大量的就业岗位，但它们并没有导致总体失业率上升。为什么你认为这次的情况会有不同？

Gregory：我认为这次情况不同的主要原因是它在性质上跟以往是不同的。以前，像蒸汽和电力驱动的机器，它会消除一些手工工作，所以人们可以爬到金字塔的顶端，去做更复杂的工作。但如今，人工智能在某种程度上已经掌握了这种技能金字塔，现在它与人们的竞争是认知技能上的。它最终会爬到金字塔的顶端，所以没有地方可以超越它。而且一旦人们制造出某种通用人工智能，它是很容易被复制的，所以就会有一个非常大的数字，也就是说，智能机器人会做很多事情。他们会和人竞争去做其他的事情。比如说，一个煤矿工人是很难被重新训练为YouTube视频制作者的。

问：但这并没有真正发生，是吗？我的意思是，这两种工作之间相差太远了，不是吗？重要的是，是不是每个人都可以去做一份比现有工作稍微复杂一些的工作呢？你永远不会带着一群人去训练他们去做一件完全不同的事情，对吧？

Gregory：回到你的类比，你提到美国200年来的模式是这样的。但是，你知道，美国并不是世界上唯一的国家，而且200年只是我们历史上很小的一部分。我们回顾了几千年的历史，观察了北方发生的事情，我们看到的是非常复杂的过程。中世纪时的失业率远高于5%或10%。

问：我用200年来举例是因为这是我们所经历的工业化和自动化时期。我的意思是，人工智能将会使人类工作自动化，所以你只需要观察过去那些出现过工作自动化的时间，然后就得出“大量工作被自动化取代时会发生什么”的结论吗？我的意思是，根据你的类比，计算器的发明难道不会让数学家们失去工作吗？我的意思是，就像ATM机一样，从理论上讲，ATM机取代了银行柜员。然而，现在的银行柜员比ATM机刚刚推出时还要多，因为ATM机的出现也使得银行能够开设更多的分行，雇佣更多的柜员。我的意思是，其中的逻辑真的就这么简单吗，“嗯，你已经建好了一个工具，所以现在有一台机器正在做人类的工作，所以就有一个人会失业。”这个人只能提供一种工作吗？

Gregory：这并没有那么简单，有很多因素在起作用。正如我们在18世纪的卢德派所看到的那样，有一些力量可以抵抗变革。现在有一些人，比如煤矿矿区，他们想要回到煤矿开采。当然，事情并没有那么简单。我想说的是，我们只有几个工业革命的例子，而且正如数据科学家所说，很难从少数几个例子中归纳出结论。过去的技术确实带来了更多的工作，这是事实。这并不意味着这项与以往不同的新技术将为所有人带来更多的工作。情况很有可能是非常不同的。我们不能依靠三四个过去的例子来概括未来。

谈数据科学领域：
数据科学家生活在黄金时代

问：你会如何度过你在数据科学领域的每一天？你认为哪些最近的进步能实质性地改变数据科学家的工作？存在这样的进步吗？你是否看到有一些其他的东西即将改变并且已经开始改变？比如，随着技术的变化，数据科学领域的工作是如何演进的？

Gregory：数据科学家现在生活在这个领域的黄金时代。现在有了更强大的工具，可以让数据科学变得更容易，像Python、R这样的工具。Python和R都有非常庞大的工具生态系统，比如在Python中的scikit-learn，或者哈德利?韦翰在R中提到的理论。还有一些像Spark这样的工具，让数据科学家可以访问大量的数据。因此现在的数据科学家建立模型要容易得多，也要快得多。数据科学家面临的危险同样也是自动化，因为这些工具让他们的工作变得更加容易，而且很快自动化也将取代他们工作中的一大部分。

实际上，已经有像DataRobot这样的公司，那些不是数据科学家的企业用户可以利用DataRobot或者他们的竞争对手的工具插入数据并生成结果。他们不再需要数据科学家。这种情况在许多领域已经发生了。例如，互联网上的广告是自动放置的，现有的算法可以每秒做出数百万个决策，并建立大量的模型。同样，没有人参与其中，因为人类无法每秒完成数百万个模型。在许多领域，这种自动化已经在发生了。最近我在KDnuggets上进行了一项民意调查，“你认为什么时候数据科学的工作将会自动化”？然后，人们给出答案的中位数大约是20到25年后。因此，虽然这是数据科学家的黄金时代，但我认为他们应该享受这一过程，因为没有人知道未来8到10年将会发生什么。

问：所以，马克·库班在今年早些时候做的演讲中谈论到，第一批亿万富翁将会是利用人工智能的企业。但是他还说了一些很有趣的事情，他说如果他再上大学，他会学习哲学。这会是最后一件会被自动化的事情。你会对今天的年轻人说些什么呢？认知领域有可能会开花结果，也可能会逐渐消失，你认为他们应该在这一领域学习什么呢？

Gregory：我认为现在需要学习的很大程度上是人文和科技的交叉点。如果我还年轻，我还是会选择学习机器学习和数据库，也就是我30年前攻读博士学位的时候所学的。但我可能会学习更多的数学。深度学习算法正在取得巨大的进步，这与数学密切联系。另一方面，可能最难实现自动化的是人类的直觉和同理心，理解他人的需要和想要的东西，以及如何最好地与他们建立联系。我不知道这能被研究多少，但如果哲学、社会研究或诗歌是通往成功的途径，那么我就鼓励年轻人去学习它。我认为我们需要一个平衡的办法，不仅仅包括技术，还有人文学科。

问：广泛地来讲，我觉得数据科学依赖于三件事：它依赖于硬件，越来越快的硬件，越来越好的数据以及更好的标签；然后是越来越好的算法。如果你不得不把这三件事放在一起比较，我们在哪里效率最高？如果你能把其中的一件事放大，你会选择什么呢？

Gregory：在现有的算法中，似乎更多的数据会比更智能的算法产生更好的结果，特别如果它是相关数据的话。例如，对于图像识别，当深度学习在数百万张图像上进行训练而不是在数千张图像上训练时，就会产生一个巨大的量化跳跃。但我认为，我们需要的下一个重大进展是拥有更智能的算法。深度学习的一大缺点是，它所要求的数据量太大了。人类似乎能够利用很少的例子学习，但我们现有的算法还无法做到这一点。站在对算法有利的立场上，我不得不说，当我说人们可以利用很少的例子学习时，我们假设他们是成年人，并且已经花了30或40年的时间与世界进行互动。因此，如果算法可以花几年时间来训练和与世界互动，它们就会获得足够的知识，这样它们就可以利用有限的例子来推广到其他类似的例子了。是的，我认为可能先是数据，然后是算法，然后是硬件。这就是我的排序。

谈迁移学习：人类本身并不完美

问：你如何看待计算机的迁移学习？你是否认为我们将能够使用我们已经非常成熟的数据集，比如图像1，或者手写识别，或者语音翻译，我们将能够使用这些数据来解决那些与之完全无关的问题吗？在我们现在做得很好的东西中，有没有什么是可以应用到那些我们没有掌握很好的数据的东西上的？

Gregory：我觉得有。因为世界本身就是最好的代表。最近我读了一篇论文，将反向迁移应用在ImageNet上，结果发现，一个已经被训练去识别，我不记得具体是什么了，比如说猫的深度学习系统，并不能识别反向转移的猫，因为它不具备这种反向迁移的能力。但如果你只是在训练时加入反面词汇，这是很容易纠正的。我认为可能有大量的迁移行为是人类所熟悉的，比如反向迁移、旋转迁移和其他形式。很有可能的是，通过对非常大的现有数据库进行这种转换，我们可以教这些机器学习系统达到并超越人类的水平。因为人类本身并不完美。

问：刚才我们谈到了人类的知识，以及人类是如何完成事情的，并且我们将要把它应用到计算机当中。你认为人工智能研究人员能从大脑科学中学到很多东西吗？他们能从心理学中学到很多东西吗？还是说它更便于讲故事或帮助人们理解事物？

Gregory：我认为一些人工智能研究人员受到了人类如何做事的启发，最主要的例子是Geoff Hinton，他是一个了不起的研究人员，不仅因为他所取得的成就，而且他对计算机和人类意识都有非常好的理解。我曾经跟他对话过几次，他说，他利用自己的知识所了解到的人类大脑的工作原理，是新算法的灵感来源。同样，不是复制它们，而是作为算法的灵感。关于你的问题，是的，我认为人类意识与理解智力是如何实现的很相关，正如Geoff Hinton所说，这是我们目前唯一的例子。

问：我们可以轻松地让人工智能下棋，因为有很多人努力地完成了一些并不容易的工作，但也因为有很多保存完好的游戏记录，可以训练数据。我们可以很好地进行手写识别，因为我们有很多手写的字迹，而且已经被转录。我们的机器翻译很好，因为有大量的训练数据。如果我们没有提供这些数据，或者没有很好的办法能得到这些数据，那么这些问题是可以解决的吗？比如，如果我们唯一的障碍是没有数据，有什么问题是可以解决的呢？

Gregory：我认为处在这类问题的前沿的是医学诊断，因为有很多的疾病数据已经存在，只是可能不是以电子形式收集的。有很多遗传信息可以被收集并与疾病和治疗相关联，这是行得通的。同样的，这些数据还没有被收集，但谷歌和23andMe以及其他许多公司正在研究这个问题。医学放射学最近在一家名为“Enlitic”的创业公司取得了巨大的成功，在那里，他们能够利用深度学习来识别肿瘤，准确度几乎和人类放射科医生一样。因此，我认为在医药和医疗领域，我们将看到巨大的进步。在其他许多有大量数据的领域，我们也可以看到巨大的进步。但数据的另一面，或者说我们能触及到的是，至少在某些政治派别中，人们正在失去对它的真实性的信任。去年的选举中，大量虚假新闻报道似乎造成了重大影响。因此，虽然我们正在训练机器，让它们能够更好地识别什么是真的，但是很多人也正在失去判断什么是真的，以及什么正在发生的能力。可以去看看这个国家有多少人否认气候变化。（完）