万维获客 2018-07-03 15:27 上期小维给各位看官讲述了人工智能的发展简史,这一期咱们就来说一说人工智能到底是如何崛起的呢?
人工智能行业产业链明晰,可以分为基础层、技术层和应用层。

图 1:人工智能产业链
(一)数据与运算力是人工智能的基础
基础层主要涉及数据的收集以及运算。其中传感器以及数据服务机构主要负责收集数据,而 AI 芯片(GPU、FPGA、ASIC、类脑芯片)和云计算负责运算。
1.1 芯片的快速发展带动运算力的提升
GPU 和云计算的兴起,为人工智能带来了质的飞跃。其中 GPU 等芯片性能的快速提升,为人工智能的快速发展提供了可能性。与此同时,分布式计算(云计算)的兴起,大大降低计算的时间、硬件成本,也为人工智能的快速发展提供了契机。

图 2:NVIDIA GPU 3 年把深度学习效率提升了 50 倍
国外知名 GPU 制造商 NVIDIA 已经将传统 PC GPU 业务进行了转型,并推出了专门运用与人工智能、深度学习、大数据研究和分析 GPU 芯片,如 Tesla 系列运算卡,并取得令人瞩目的成绩。人工智能的客户在 2 年内提升了 33 倍,并在 17 年 1 月的 FY 2017 年报指出相关AI、深度学习以及云计算的 GPU 芯片收入的年增长率高达 145% 并预测到 FY 2018 第一季度这个数字会继续增长到 186%。

图 3: NVIDIA 人工智能客户数

图 4: NVIDIA 同期年增长率
然而国内目前专注于人工智能芯片开发的企业有限,且总体技术水平与发达国家存在较大的差距,高端芯片严重依赖国外进口。中国是人工智能芯片制造的后起之秀,目前已推出中科院“寒武纪”、中星微“星光智能一号”等多款人工智能芯片,华为也表示将在年内推出人工智能芯片产品。国产人工智能芯片的崛起不仅带来计算能力的提升,同样也可以起到降低成本的作用。
表 1:国内人工智能芯片

资料来源:淘数科技(北京)有限公司

图 5:寒武纪芯片

图 6:中星微“星光智能一号”
1.2大数据与云服务的热潮奠定数据基础
互联网与移动互联网的迅猛发展使得人们的生活中产生海量数据,并得益于大数据概念的爆发,国内对数据积累与标注十分重视,从数据收集、数据分析、数据管理到数据应用,已经形成了完整的产业链,这也为国内人工智能输入海量数据进行训练提供了坚实的基础。
企业与政府共同致力于实现数据共享与开放。相比于国外公司对数据的严密保护,国内公司对数据保持着较为开放的态度。谷歌旗下的 Waymo 以及特斯拉对其数据进行严格保密, 而国内方面百度不仅对软件进行开源,而且打算进一步分享数据,创造一个无人驾驶汽车的开放数据平台。手握巨量数据的政府也已制定好数据共享与开放计划,到 2018 年底前,中央政府层面实现数据统一共享交换平台的全覆,建成国家政府数据统一开放平台;2020 年底前,逐步实现多个民生保障服务相关领域的政府数据集向社会开放。数据的开放共享使得数据能够大范围内的流动,并衍生出各类对数据处理与应用,做出更可靠的标注,从长期看给人工智能带来更大的市场价值。

图 7:国内大数据产业图谱
在云服务领域,亚马逊由于起步较早,占据了最大的云计算市场份额。据 synergy research group 的数据,在 16 年年底,亚马逊占据了公有云市场的 40%份额。而且据亚马逊2017年 4 月公布的一季度财报中,AWS 的营业收入同比上涨了 42%,达到了 36.6 亿美元。微软已将云计算列入自己的重点战略方向,2016 年上边年,微软智能云营业收入占比已经高达 26.32%。
(二)人工智能技术逐渐成熟,驱动未来发展
在收集到数据之后,技术层所做的事就是模拟人脑,对数据进行有效的处理和分析。算法是技术层的一项核心内容,而在人工智能算法里最出名的,也是将人工智能推向发展高潮的,就是深度学习算法。
2.1 深度学习引领智能热潮
假设一个系统 S 有 N 层,S1,……,,它的输入是 I,输出是 O,如果输出的 O 正好等于 I,那么输入 I 进入系统后没有变化,这意味着输入 I 经过每一层 S,都没有任何信息损失, 或者损失的信息都是多余的,也就是说在任何一层S的输出都输入 I 的另一种表达形式,深度学习的基本思想就是堆叠多个层,把上一层的输出作为下一层的输入,通过这种方式实现了对输入信息的分级表达。如图 1 就形象说明了深度学习是如何从一副图像中提取简单的特征。先输入图片的像素信息,然后经过一个映射,先得到图片的边缘信息,然后在第二层我们从第一层的边缘信息中总结出轮廓和拐角的信息,接着在第三层,我们继续对第二层的信息进行映射, 提炼出目标部分的信息,最后在对第三层中的信息进行一次映射,我们就可以得到了我们的输出结果完成对图像的识别。
从这个例子,我们可以看出这种分层的无监督的特征学习是深度学习的重要基础,它通过逐层的特征变换,将样本在原空间的特征表示映射到一个新的特征空间中,用大量简单的特征构建复杂的表示,消除输入数据中与学习任务无关因素的改变对学习性能的影响,保留对学习任务有用的信息。

图 8:深度学习的例子
2.2 蒙特卡洛树搜索运用于 AlphaGo
2016 年 Alphago 战胜李世石,17 年战胜柯洁,正是因为它成功将深度学习算法和蒙特卡洛树搜索算法的结合在了一起。
蒙特卡洛树搜索的每个循环包括四个步骤:
1.选择(Selection):从根结点 R 开始,选择连续的子结点向下至叶子结点 L。下面的结点有更多选择子结点的方法,使游戏树向最优点扩展移动,这是蒙特卡洛树搜索的本质。
扩展(Expansion):除非任意一方的输赢导致游戏结束,否则 L 会创建一个或多个子结点或从结点 C 中选择。
仿真(Simulation):在结点 C 中进行随机布局。
反向传播(Backpropagation):使用布局结果更新从 C 到 R 的路径上的结点信息。
下列图中每一个节点的内容代表胜利次数/游戏次数

图 9:蒙特卡洛树搜索四个步骤
最终,通过大量数据模拟后,每个节点上的数字,就是我们估计的移动到该节点的平均胜率。一般情况下,我们在移动时,选择平均获胜概率最高的子节点进行移动。同时,我们也可以选择一个包含其他因素的决策函数,把除了平均胜率以外的因素放到我们的决策之中。

图 10:Alphago 的运作机理
AI 技术的门槛较高,但国外巨头先后发力,在人工智能领域进行布局,形成了百花齐放的场面。与此同时,他们普遍看好人工智能的市场,加大了对 AI 科技人才的争夺,AI 新兴公司的收购以及建立 AI 实验室的力度,旨在提高自己人工智能技术的实力。他们大多数都将围绕自己的主业打造 AI 生态,并进行了相关领域的技术研究。
表 2:国外五大公司人工智能发展状况

国内人工智能技术层方面的研究主要集中在计算机视觉、自然语言处理、以及机器学习等方面,计算机视觉方面更是占据半壁江山达到 55%,自然语言处理和机器学习分别占据 13%以及 9%,资源的集中也使国内在这三个方面处于国际领先地位。

图 11:国内人工智能技术层研究占比
国内从事计算机视觉的公司数量较多,维持着较高的热度,据 36 氪研究院不完全统计, 目前国内从事计算机视觉的公司有 104 家,但大部分公司的发展道路仍不清晰,其中人脸识别领域的公司竞争激烈。
国内人脸识别准确率达到世界领先水平。国际权威人脸识别供应商测试 FRVT(Face Recognition Vendor Test)公布了最新测试报告,报告显示国内企业在本次评测中取得了四项第一名,这也是国内企业首次在 FRVT 中获得第一名,超过长期盘踞全球人脸识别算法第一名的公司 Vocord。
表 3:国内企业人脸识别技术测试表现

国内企业在自然语言处理领域同样处于世界领先地位,目前研究并取得了一定成果的公司有科大讯飞、百度、思必驰、云知声等。科大讯飞是国内自然语言处理以及语音识别方面的领军者,在语音识别、语音合成、口语评测等方面代表国际最高水平,在多次国际竞赛中拔得头筹,目前已占有中文语音技术市场 70%以上的市场份额。
表 4:国内研究语音识别与自然语言处理的企业

(三)人工智能产品与服务不断推出,得到市场的广泛认可
随着基础层和技术层的快速发展和逐渐成熟,AI 产业红利将传导至应用层。
AI 应用层主要是 AI 算法在传统行业的渗透和改造。
在国外,已推出多款人工智能产品与服务,并取得了十分成功的成绩。亚马逊 Echo 智能音箱的销量暴涨,2015 年 Q2 的销量仅为 20 万台,2016 年 Q2 销量已经较去年增加了 5 倍, 预计 2017 年底销量会突破 1 千万台,为亚马逊贡献 10 亿美元的营收。
全球最大社交网络网站 Facebook,充分利用 AI 分析社交网络大数据,来提升用户体验, 持续扩大用户流量,2016 年,Facebook 越活跃用户达 18.6 亿,同比增长 17%。同时 Facebook 将巨大的用户流量进一步变现为广告收入。2016 年,Facebook 实现营业收入 268.85 亿美元, 同比上年增长 57%,实现净利润 102.17 亿美元,同比上年增长 177%。
在国内人工智能的应用中,BAT 手握大量资源,无疑是其中的第一梯队,而三家之中的百度更是行业中的领军者;阿里巴巴与腾讯也在积极推进人工智能项目,凭借公司规模优势奋起直追,虽然目前落后于百度,但发展后劲不可小觑;而像地平线机器人这样独立人工智能企业,以及互联网细分领域取得成绩的京东、搜狗、滴滴、今日头条等垂直优势同样值得关注。
中国巨大的消费市场可以衍生出无数的细分领域,互联网对各行业各领域的渗透给人工智能应用提供了最真切的参考,并且相比于互联网,人工智能的应用场景只会更广阔。

图 12:国内人工智能产业图谱
讲到这,各位看官了解了人工智能产业链的基础层、技术层、应用层,如何成因、如何发展、如何达到高。关于人工智能,小维还没有讲完哦,下期敬请期待,关于人工智能的故事!本周四,我们不见不散!
当然,没有看到上期内容的看官不要着急,下面就是上期文章哦,请您点击阅读:
厉害了,人工智能——人工智能发展简史(一)