人工智能时代的降临

时间：2017/01/23 14:08 浏览次数：641

去年以来关于人工智能（AI）的讨论非常火热，最近读到一篇这个主题的文章觉得非常不错，翻译过来分享下。这不是一篇烧脑的关于人工智能技术文，而是一篇开阔的思辨性文章。

下面是原文：

是的，数百万低报酬、低技能的工作岗位将面临风险，但人工智能革命还是会带来很多好处的。

1

周二，白宫发布了一份关于人工智能与经济的令人寒心的报告。报告以如下推断开头：“可以预计机器将在越来越多的任务上达到甚至超越人类的表现。”，之后它警告了大量人工岗位的消失。

然而，为了应对这种威胁，政府做出了一个可能听起来很荒谬的建议：我们必须加大对人工智能的投资。美国生产力和竞争优势的风险实在太高，以至我们不得不加倍投入。

这个方法不仅有意义，而且是唯一有意义的方法。担忧数百万的工作职位，像小车或卡车司机，将会被自动驾驶革新，这是有道理的，但我们也有巨大的需求鸿沟需要机器学习来帮助填平。我们的医疗系统是有深度缺陷的，智能终端可以在更多的地方向更广的人群传播更实惠的、支付得起的更高质量医疗服务。我们的基础教育设施还不足以覆盖以让学生准备好面对阴然逼近的经济动荡。在这方面，人工智能系统可以切入到教师力量薄弱的地区。我们也可能通过开发更智能的基础设施来获得能源独立性，就像 Google 子公司 DeepMind 为其母公司的电力使用所做的事一样（译注：DeepMind 利用人工智能技术使得 Google 数据中心制冷消耗的电力账单降低了 40%）。这里面的机会实在大到不能忽视。

更重要的是，我们必须超越这种狭隘的思考方式 —— 受到人工智能威胁的工作岗位。因为今天的人工智能领导者（在 Google 这样的公司或其他地方）已经为一个更加雄心勃勃的愿景（曾经幻想的通用人工智能）奠定了基础。

要探访人工智能降临的前沿阵地，那就去观察机器学习系统在狭窄的受限领域是如何完败人类的。今年，最瞩目的人工智能与人类的对决就来自 Google。三月份，世界级围棋选手（李世乭九段）对决 DeepMind 的 AlphaGo 遭遇屈辱的惨败。DeepMind 的研究人员还制作了一个可以针对视频读唇的系统，其精确度相对人类而言一骑绝尘。几周前，Google 的计算机科学家和医学研究人员合作推出了一个算法，该算法可以像眼科医生一样通过眼睛图像检测发现糖尿病性视网膜病变。这是许多公司目前正在追逐的目标 —— 通过自动分析医疗扫描来帮助医生 —— 的一个早期步骤。

也是在今年秋天，微软公布了一个可以转录人类语音的系统，相比专业的速记员它的准确度高的多。语音识别是 Cortana（微软）、Alexa（亚马逊）和 Siri（苹果）这些语音助手系统的基础，并且在这项任务中达到人类的表现水准已是数十年的目标。对于微软首席语音科学家黄学东（XD Huang）来说：“这本身就像一个梦，在三十年后变成了现实。”

然而，人工智能在 2016 年碾压人类的一系列胜利仅仅是个开始。最新研究表明，我们很快将从这些“狭义”（受限于特定领域，应用范围相对窄）人工智能转变到“广义”（更丰富和复杂的应用领域）的人工智能。虽然离一个真正的通用人工智能至少还有几十年，但因为这些人工智能系统不断扩张的应用领域，社会仍将见证巨变。这就是为什么白宫（好吧，至少奥巴马还在位时）没有缩减投入人工智能的预算。我们正在发展一种强大的力量来彻底改变曾经我们创造的一切。

忽略这种趋势，而非积极投身其中去理解、塑造和监控它，很可能是一个国家所能犯的最大错误。

2

之前提及的那些成功的人工智能产品选择的工具都是深度学习。人工智能技术的竞争进入白热化，它的特殊性体现了我们为什么处在通用人工智能的边缘。（译注：深度学习模拟的是人脑的思维过程，所以作者才特别提及它和过去方法相比的特殊性）

虽然我们已经能够训练人工智能来完成任务数十年了，但是专家们不得不煞费苦心的为每一个应用手工打造许多定制组件。例如，在让人工智能识别图像中的物体这件事上，人类耗费了数年的工作积累，但在面对解析转录声音的问题时这些积累却毫无用处。换句话说，我们不得不预先咀嚼喂给人工智能的食物，一次，又一次，再一次。（译注：形象的形容过去训练人工智能的工作过程）

过去四年的教训是，这类枯燥乏味的“预咀嚼”过程，从目前来看在很大程度上是不相关的。取而代之的是，本质上存在一个算法（包含很多微变量）可以直接从你喂给它的任意大小数据集开始，通过调整自身的结构来解决问题。结果带来的不仅是表现更好的系统，而且能更快的进行实验。“许许多多曾经让我们竭尽全力但却困顿不前的问题，如今，六个月内将迎刃而解。” Google 副总裁与工程师 Fernando Pereira 如是说。

然而，与人类相仿的语音识别，唇读和图像标记质量一样令人印象深刻，深度学习是否是伟大而全能的人工智能的基石，这在目前并非显而易见。它稍微有点像你的孩子带回家的成绩单，其中涉及了像英语（母语课）、织袜子（手工课）、闪避球（体育课）和计算三角斜边（数学）的各类科目。你可能想知道这个聪明的孩子是否能够在这些领域之间建立联系，并成为一个批判性的思想家吗？那么，深度学习确定走在能够挑战真正人类智能的道路上吗？（译注：作者这段把人工智能比作小孩，其应用的各种领域就像孩子上学的各个科目）

OpenAI 联合创始人兼研究主管 Ilya Sutskever 说：“我们目前所见的人工智能系统，之所以应用在非常窄的领域，是因为它们非常有用。良好的翻译是非常有用的，良好的癌症筛查是非常有用的，这正是人们所追求的。”

但他补充说道：“尽管今天的人工智能系统看起来应用领域狭窄，但我们已经开始看到了通用智能的种子。原因是底层技术本质上是同一概念在不同应用领域上略有差异的反复重演。这些想法就像粘土一样可揉捏组合，你只需去混合和搭配它们就能工作起来。”

通过揉捏组合今天这些狭窄领域的系统，我们将会登陆更宽广的明天 —— 一种更明显的智能。

3

一个早期的诱人例子，更高级的智能看起来可能最终会出自 Google 的翻译研究。九月 Google 宣称，通过使用其神经机器翻译系统（GNMT：Google Neural Machine Translation，后文将使用这个英文简写），翻译的效果取得了巨大提升。Google 的 Pereira 称：“翻译质量获得了飞跃，我从未想过会在此生的工作中得以见到。”（译注：Pereira 就是前文提及的 Google 副总裁，另外，至少目前在中文翻译上貌似也还是不行，要不我也不用这么辛苦的手打翻译了，嘿嘿:-)）

他补充道：“曾经我们一直在稳步的前进，但现在这不再是稳步前进，而是突飞猛进。”。

新的翻译系统在从一门语言到另一门语言之间逐步铺开，一些「谷歌人」决定更进一步。他们想知道是否可以构建一个单一的翻译系统来同时应对许多语言，并潜在的展现出人类智能的标志性能力 —— 转移学习。转移学习是一种应用一种技能（比如，弹钢琴）来加速习得另一种技能（比如，指导学习管弦乐或另一种乐器）的能力。

通晓音乐基础可以帮助一个钢琴家弹起尤克里里琴（一种四弦琴），这似乎是显然的，但对于语言的翻译而言却并非如此。在 GNMT（Google 神经机器翻译系统）中，一种深度学习系统必须吸收数百万从德语到英语的翻译，教会自己如何吃进 “der rote Hund”（这句是德语）并吐出「红狗」。一个孤立的系统独立学习如何在另一个方向上翻译，如从英语到德语。同样，从法语到英语，英语到法语，韩语到日语等等，每对语言都使用自己的独立系统，这就像翻译行为每次都被重新发明一样。为了支持 100 种语言之间的翻译，你最终可能得训练近 10,000 个独立的系统。这很费时。

这些研究人员想知道是否他们可以针对多语言构建一个单一的模型，相对那些孤立的一次性系统保留自己的模型。首先，这样可能更有效率。而且把所有这些语言和词汇放在一个单一架构的内部相互碰撞，也许一些更有趣的事便会发生。

上一篇：下拉菜单

下一篇：阿里云应用实践征文大赛