尽管斯蒂芬·霍金(Stephen Hawking)和埃伦·穆斯克(Elon Musk)都曾经发出警告,但是与人类为敌的人工智能并不会很快出现并毁灭世界。不过,有一点是可以肯定的,那就是人工智能,即深度学习和机器智能的实际应用将继续取得进展。科技行业的每个角落都在流传,大数据的最大组成部分(也是非结构化的那部分)拥有可学习模式,而我们现在拥有计算能力和算法可对其进行识别——并且是在很短的时间内完成。
这项技术带来的影响将会改变每个行业的经济状况。此外,虽然机器学习和数据科学相关人才的市场价值迅速攀升,但大多数人力资源的价值将会急剧下降。这种变化标志着一种真正的颠覆,可以创造财富。而这也会带来巨大的社会效应,更多快速实现盈利的深度学习创业公司在世界各地(尤其是在旧金山)涌现,它们需要的创造型人才和投资也水涨船高。
旧金山创投基金BloombergBETA的投资者希凡·泽莉斯(Shivon Zilis)制作了下面的图表,她将之称为机器智能版图。BloombergBETA特别专注于“那些改变职场大环境的公司”,因此这类自动化技术是其关注的重要领域。泽莉斯解释说:“我制作这幅版图是为了把创业公司放到环境中审视。我是一名以理论为导向的投资者,在版图经过分类整理后,我们就更加容易看出公司扎堆的领域以及空白地带。”
希凡·泽莉斯制作的机器智能版图
这幅版图的特别之处在于它的排布方式。位于顶部的核心技术,它们为下面的应用提供驱动。诸如谷歌(Google)、IBM、微软(Microsoft)以及Facebook等美国大公司以及中国的百度,它们都是核心技术的代表。这些公司(尤其是谷歌)同样也是核心创业公司的主要收购者。很多自称从事人工智能、深度学习或机器学习的公司,它们致力于研发能够支持多种类型应用的通用算法。而其他一些公司则擅长自然语言处理、预测、图像识别以及语音识别。
对那些正在重新思考企业流程(比如销售、营销、安全或是招聘)的公司来说,或者是对其他正在改造行业垂直市场的公司而言,可供选择授权使用的技术令人目不暇接。就像开源数据科学工具包(Data Science Toolkit)创造者皮特·沃登(Pete Warden)在最近一篇关于深度学习的文章中所说的,“我们用来开发……以及训练网络的工具没有理由在生产中被用来执行它们。”进入2015年之后,我们会看到这些研究成果被转化为实际应用,进一步在普通人中得到使用。“我还认为,最终,开发模型的研究导向人群只是少数,”沃登继续说,“更多的是对这些模型进行应用的开发者,他们对暗箱之中的工作原理并不怎么了解。”
这些公司将需要更多的人才,他们要能创建、迭代和调试深度学习以及其他类型的机器学习模型。这些公司还将需要规模更大的开发者和设计师队伍,在屏幕设备上创建可用的体验,让所有这些人工智能得以执行。大公司有望成为这里的大赢家,它们显然拥有吸引和获取这些人才的资源。更关键的是,大公司拥有大数据,并跟大量用户建立起了长期关系。在机器学习当中,限制性因素往往是数据的质量和数量,而不是算法的智能程度。
那么包括苹果、谷歌、微软和IBM在内的大公司,它们最关注什么呢?没错,是移动领域,正如泽莉斯指出的,“在移动领域胜出将需要大量的机器智能。”如今,Siri和Google Now能够在移动端对高度情境化的语音交互做出响应。像亚马逊(Amazon)FireFly那样的可视化搜索包含基于地理位置的模式识别来创建一种良好的使用体验。目前,深度学习之所以能引起人们的热情,是因为这类问题现在可以用数分钟或数天得到解决,而不是过去的数年时间。
杰里米·霍华德(Jeremy Howard)是深度学习最热情的支持者之一,他现在是医疗诊断创业公司Enlitic的创始人兼首席执行官。霍华德之前曾担任Kaggle的总裁兼首席科学家,这是一个面向机器学习竞赛的开放平台。值得注意的是,霍华德声称之前并没有医疗行业的从业经验。深度学习的一大卖点就是,它是一种通用技术,创建有效的解决方案并不需要广泛的相关领域知识。在最近TEDxBrussels活动上发表的演讲中(参见视频),霍华德讲述了机器学习的发展历史。他还解释了目前机器学习如何能够提供各种各样的服务,发达国家80%的就业人口都从事与此相关的工作。
不要觉得霍华德和其他深度学习从业者是一心想统治世界的无情技术控,这个领域其实也有着积极的人性化的一面。吸引霍华德进入医疗诊断领域的原因之一就是这类服务存在巨大的市场需求。目前,在向大多数人口提供足够的医疗保健服务方面,发展中国家经过培训的医生只有所需数量的不到十分之一。而使用目前的方法来培训所需数量的医生则要耗时300年!
从广义上讲,机器智能是一组将会解决一些问题并引发其他一些问题的技术。在如今所开发的所有企业流程和行业应用当中,我们并不清楚真正的“杀手级应用”会是什么。就像杰夫·霍金斯(Jeff Hawkins)最近在接受科技博客记者GigaOM德里克·哈里斯(Derrick Harris)采访时所说的,“从历史经验来看,那些显眼的应用成不了杀手级应用……杀手级应用往往是出人意料的,没有人预见它们的到来。”霍金斯是Palm Pilot的创造者,他现在是人工智能公司Numenta的首席执行官。
Numenta本身就与深度学习热形成了一个对比,可以帮助我们理解。虽然深度学习使用了神经网络,但霍金斯表示,Numenta的方法更接近于大脑的运作方式。区别在于,Numenta的方法使用了分层式即时记忆(Hierarchical Temporal Memory),可以识别时间模式以及计算空间。该公司使用这种技术的第一款商业产品是Gork,它被用于检测服务器以及亚马逊网络服务(AWS)上应用的异常现象。
当霍金斯谈到大脑时,他在更精确地描述大脑皮质,这是高层次人类能力的核心。而自上世纪40年代以来一直在开发的神经网络只是跟大脑的实际工作方式松散相关。事实上,机器智能从业者开发的皮质架构和人类进化得到的更复杂大脑系统之间还存在着巨大的鸿沟。
机器智能根本就不需要模仿人类的大脑。就像杰里米·霍华德在最近Reddit的一场问答活动(Ask Me Anything)上所说的,“更有趣的问题是:机器可以做什么?而不是‘它们是不是真的智能?’机器‘智能’跟人类智能存在很大的区别,我并不认为这样的类比有助于事。”通过神经科学和认知心理学,我们可以了解到大脑哪部分系统和回路负责执行哪类任务。
举例来说,深度学习非常适合于进行问题的分拣和分类,而人类做这些事情的时候根本就意识不到。这类功能就是丹尼尔·卡尼曼(Danial Kahneman)所谓的“系统1”,即思考较快的那部分(直觉判断系统——译注)。Numenta的方法强调基于时间的异常现象,它可以说更接近于大脑的威胁检测系统,即“系统2”,是思考中较慢的那部分(逻辑思维系统——译注),它负责对新皮层的迅速判断提出质疑。但这也无妨,它可以在大脑的语言系统中拥有一个更加皮质性的指涉。神经学家丹尼尔·列维京(Daniel Levitin)发现,位于太阳穴边上的布罗德曼47区(Brodmann area 47)是我们处理对语言和音乐的暂时感知的地方。就像他在《迷恋音乐的脑》(This is Your Brain on Music)这本书中写到的,音乐带来的大部分快感跟它处理这些感知的方式有关,音乐常常使用异常让我们感到欢愉或是让我们感到暂时沮丧。
需要强调的是,尽管最近机器智能所做的一些展示令人印象深刻,但是要把这项技术转化为对人们有用的产品,我们还有很多的工作要做。在很大程度上,这与人们对哪些事情可以轻易做到(快速思维)或需要更多的时间(慢速思维)的认识有关。在图片分类上面,深度学习甚至已经做到比人类更精确(你可以在霍华德的演讲视频中看到有多出色),但它还是无法处理特定的语言任务。很多预测性算法现在已经十分擅长一般情感分析,但是在讽刺以及某些类型的否定和模棱两可的表达上面仍然力有不逮。
机器智能,尤其是深度学习,将对未来一年的科技行业产生显著影响。掌握大量数据的大型科技公司将有极大的动力去挖掘这些数据当中蕴藏的价值,因为目前已经有了一种可扩展的方法来做这件事。在另一端,应用开发者将通过吸引人们使用智能手机应用来收集大量数据,因为这些数据现在具有了明显的价值。机器学习和数据科学人才将继续从学术机构向谷歌那样的大公司流动,目的就是为了能使用所有这些数据。在2015年,机器智能不会夺走发达世界国家80%劳动者的饭碗,但它会很快开始弄清如何能实现这个目标。这些技术能够帮助我们重新定义和使用人类的价值,而实现那些价值我们也将需要用到机器智能。
问鼎云学习
移动客户端扫码下载
关注微信公众号
获取更多培训干货