AI极客如何唤醒机器之心_家居_资讯

AI极客如何唤醒机器之心

卢华磊

极客创造并掀起新的商业浪潮。但AI极客敲出的每一行代码，“唤醒”的每一台机器却有可能改变人类未来的路径。

AlphaGo的出现加速了人们对人工智能（Artificial Intelligence以下简称AI）的理解，但AI极客们的野心远非19行的棋盘可以局囿，他们拥有酷炫的技术和非凡自信，并想以此来改变世界。

美国畅销书作者、发明家雷.库兹韦尔（Ray.Kurzweil）在《奇点临近》一书中为人工智能的出现设定了三个条件：强大的计算能力、海量的知识储备，最后还需要教会计算机拥有认知能力，通过机器学习技术让计算机不断的自行进化。

前两者已经实现。第三点，如何让机器拥有认知能力是AI极客们关注的重点。

机器学习是人工智能的核心。机器学习将教会计算机认识现实世界，知道自然界的日升日落、阴晴圆缺，并能理解人类的行为和语言。机器学习的常用领域包括数据挖掘、视觉理解、语音识别和自然语言处理等方面。我们采访了数位科技公司高层、新锐创业者，他们有一个共同的身份—国内从事机器学习的应用和研发的专家。他们讲述了中国人工智能发展的现状，而一旦科技出现新突破，也预示着新一轮的商业变革。

先知

坐在记者对面，脸庞消瘦的陈运文笑得有些腼腆，言语却充满自信，“很多事情都是可以预测的”。

陈运文是国内大数据方面的专家，曾任百度核心技术研发工程师和盛大文学首席数据官。现在他是个创业者，达观数据创始人兼CEO。他为公司新入职的同事下发了一套题——如何预测泰坦尼克号上的幸存者。整套题通过获取泰坦尼克号上所有乘客的真实信息，包括性别、年龄、职业、票价、舱位等，然后编写程序来预测这2000余名乘员中哪些人最终得以生还。

在陈运文眼里，将所有信息加以综合挖掘，就能够推演出最终的答案—“705名生还者都可以准确预测。”

预测这样的事件只是数据挖掘的一个案例，对于极客而言，只要给他们足够的信息，这个世界就没有意外和偶然。

现在，陈运文用自己的技术帮助企业进行商业决策。虽然只成立不到半年，但这个隐藏在张江天之骄子公寓里的创业公司已经获得真格基金和盛大网络创始人陈大年的投资。

陈运文将第一批客户瞄准为自媒体人，通过数据分析，为自媒体提供可以引发热议的话题，并告诉这些作者，什么人喜爱看他们的文章、会关注什么话题。

让机器自己学会分析信息早就在商业行为中广泛存在。在百度工作期间，陈运文负责搜索引擎的核心算法研究，主要“为用户提供最有价值的信息”。工作的难点不在于搜索信息，而在于让机器认知用户的搜索意图。

用户经常会在搜索框中输入“口语词汇或者模糊的语句”，服务器要从人们的搜索语句中判断真正的需求。陈运文就需要设计算法让搜索引擎理解用户的语义，从数百亿的网页中迅速找到对用户最有价值的结果。这种“算法”就属于人工智能。百度每天的搜索有数十亿次，每当陈运文改进了算法都能看到用户点击的满意度在上升。

今天这种依靠数据挖掘技术来提高企业运作效率的方法变得更常见，业内将其称为“商业智能”（Business Intelligence）技术。陈运文计划将这种技术在云端运用，另一些同类公司则将这种技术直接运用在软件上。2010年在美国纳斯达克上市的Qlik公司就是商业智能软件的代表企业。他们的QlikView软件为用户提供“可视化”的大数据服务。

“我们的软件可以理解数据，挖掘数据并将其用更直观的方式展现给客户，以帮助管理层做出决策。” Qlik亚太区制造业和高科技市场开发总监Jeremy Sim对《财经天下》周刊表述。

这些带有“预测”功能的软件已经在服务并改变人们的生活，比如根据顾客的购买信息QlikView会提示便利店店长，售货架上的麦片不应该和面包摆在一起，虽然它们都是早餐食品，但如果将麦片和酸奶摆在一起，销售数字会更好看。此类预测还进一步提醒物流部门，尽量地在头天晚上补足麦片和酸奶货源。这类商业智能的应用渗入所有人的生活，以这家公司为例，他们已经在全球100多个国家招徕了3.8万企业客户，间接服务人群上千万。

未来这些带有“智力”的系统将会更多的出现在电商、医疗、教育、金融等领域。“比如随着智能手环的增加，会有更多的健康数据被采集，那么我们会提供健康预警、治疗方案推荐等服务。”陈运文说。现在只是大数据挖掘的初级阶段，人工智能时代也才刚刚开启。

视觉理解，打造机器之目

2014年6月，比尔·盖茨访华，除了见政商要员外，他还专门造访了一家刚成立一年的创业公司—格灵深瞳。对于这家初创公司，比尔盖茨留下了两句后来被广泛引用的评语“This is very cool”和“IT界的下一个大事件是计算机视觉（computer vision）与深度学习（deep learning）的结合”。

格灵深瞳就是这样一个结合了计算机视觉和深度学习为一身的酷公司。创始人赵勇是致力于视觉理解的知名极客，虽然他本人并不喜欢这个称谓。

“极客（Geek）在英文里形容书呆子，只会做技术不通世事，但我觉得我是一个懂技术的正常人。”他对《财经天下》周刊说。

赵勇专攻计算机视觉和运算影像学，2009年入职谷歌总部研究院任资深研究员，是谷歌眼镜项目的骨干。“我们团队负责谷歌眼镜的场景识别技术，利用谷歌街景来判断使用者所处的位置。”简单地说就是将谷歌眼镜捕获的图像和谷歌街景做比对，然后快速地定位用户所处位置和周边信息。谷歌眼镜可以在500毫米之内将用户的位置精确到米级别。赵勇说谷歌眼镜并不是“进化的产品，而是从无到有的突破”。

2013年初，赵勇回国创业成立格灵深瞳，并在三个月后拿到真格基金和联创策源的联合天使投资，同年6月格灵深瞳又拿到红杉资本 A 轮高达数千万美元的投资。

业内传播着投资人争论其未来估值的段子，据说某次饭局上真格基金的徐小平、红杉资本的沈南鹏和联创策源的冯波讨论格灵深瞳的未来估值，徐小平认为起码5000亿美元，而沈南鹏认为1000亿美元，最后冯波折中地认为3000亿美元。而现在中国电商巨头阿里巴巴的市值还不到1900亿美元。

受到比尔·盖茨和投资人如此追捧的原因在于赵勇的研究方向—计算机视觉，这是机器学习中极为复杂的领域。

将赵勇和陈运文做一个对比就可以看出他们研究方向的不同。赵勇认为数据挖掘是让计算机理解“结构化信息”，结构化指那些人工制作的成型的信息数据，例如一句话一段文字或者一份表格。但计算机视觉需要让机器理解飘过镜头的一片树叶，或者悄悄走过的一只猫。

陈运文对此也做了比较，他认为数据挖掘更多的是处理文本信息，而文字是具象的表达，机器看到汉字“猫”或者英文“cat”就可以理解这是一种动物，但图片是抽象信息，给计算机看一张猫的图片，让它去理解猫的概念非常困难。

所以当2012年6月谷歌X实验室宣布他们研发的“谷歌大脑”通过百万张图片的学习后可以识别“猫”的时候，全世界都为之震惊。这意味着谷歌培养的这个“孩子”具备视觉理解的能力可以“看图说话”了。而参与“谷歌大脑”研发的吴恩达博士（Andrew Ng）也因为这个项目被誉为“谷歌大脑之父”，成为机器学习领域最权威的学者。

为了建造“谷歌大脑”，吴恩达使用了神经网络系统，他们连接了1.6万片处理器创造了一个拥有10亿多条连接的神经网络，并逐步地培训这个系统，直到它拥有识图的能力。

现在，赵勇做的事情与此类似。

他通过影像设备捕捉实时画面，让计算机识别这个真实世界，更为直接的说法或许是—赵勇正在研制“机器人之眼”。

像谷歌一样，想让计算机能识别图像，赵勇也需要制作一个“深度神经网络”系统。

在人脑中有大约1000亿个神经元，神经元通过神经突出连接在一起就变成了一个神经网络，人们思考问题的时候这些神经网络相互激发，最终产生决策。现在极客们用计算机来模拟这个过程，用计算程序建立起庞大的计算元素，这些程序运算的结果通过网络互为交换互相影响，最终产生结果，这就是初级的人工神经网络。人工神经网络层级越多规模越大，其“聪明程度”就越高，学习的能力就越强。

要培养这样一个会“识图的孩子”，赵勇除了要建立这样一套庞大的神经网络之外，还需要不停训练这个网络。

“可以将神经网络当成一个黑盒子，我在里面设定了一些基本参数，随后不停的往里面输入数据、图片来训练它，通过这种大量的训练，黑盒子里面参数的连接会越来越紧密，整个网络也会越来越聪明，最终变成一个可以识别图片的智能系统。”

严格地说，人工智能不是人类设计出来的，而是人类训练出来的。即便是赵勇这样的创建者也无法知道这些神经网络到底如何相互作用相互影响，并最终形成自己的智能系统。他能做的只是“选择输入数据，控制训练方向”。

依旧以老师教育孩子做比喻，虽然赵勇这个老师不知道孩子是怎么理解图片，识别这个世界的，但他可以控制教学的内容，让这个孩子朝某个方面学习。

赵勇花费了两年时间才为格灵深瞳培养出自己的“孩子”，并将这些有“识图能力”的人工智能设备应用到安防监控和汽车识别方面。

去年格灵深瞳推出了名为“晧目”的行为分析仪，这是一个包含软硬件于一体的智能监控产品。“晧目”会实时监控场景内的情况，发觉异常就立刻报警或者提醒工作人员注意。而在另一个名为“威目”的产品中，格灵深瞳做到了车辆识别，他们训练系统辨识超过5000种车辆，这几乎涵盖了地球上所有的汽车类型。这种能力为警方办案提供了帮助，警方可以用“以图搜图”的方式让“威目”提供他们需要的视频资料。“警方提供一张汽车照片，威目在识别照片之后可以从交通录像中找出该车的行动轨迹。”除此之外，该系统还可以搜索“结构化信息”，例如在系统中输入2004年生产车牌中含有5这个数字的红色奥迪A4汽车，“威目”就会在资料中截取相关的图像或者视频，而此前这些工作都需要人工完成。

如果计算机视觉技术以这样的速度继续，或许用不了几年，当我们站在摄像头前时，计算机会在屏幕上敲出那句让人激动的言语—“I see you .”

造物者

“谷歌大脑之父”吴恩达在完成了“认猫”创举两年后离开了谷歌，加盟了百度，任职百度首席科学家并负责“百度大脑”的研发。

说服吴恩达做此决定的是他的好友，现任地平线机器人技术CEO的余凯。

余凯是国际知名的机器学习专家，他牵头成立的百度深度学习研究院是国内第一个研究深度神经网络的研究机构，加盟百度时被李彦宏称为“镇院之宝”。

“深度网络学习大概起始于2006年，当时主要有5个机构从事这方面的研究，分别是多伦多大学、纽约大学、美国的NEC实验室、斯坦福大学和蒙特利尔大学，而我当时在NEC实验室工作。”余凯说。有段时间他还在斯坦福大学执教《人工智能概论》。他领导的团队在深度学习、图像识别、文本挖掘、多媒体检索、视频监控，人机交互等机器学习领域都有建树。

去年余凯离开百度，在中关村的创富大厦租赁办公室成立地平线机器人技术。成立仅4个月，这家公司就迎来了首轮投资，投资方包括晨兴资本、高瓴资本、红杉资本、金沙江创投等多家机构。

比起商业上的追求，余凯更想用技术改变世界—为万物装上人工智能的大脑，让它们变成拥有智能思维的机器人。

在余凯看来，他在百度的工作主要是在“云端”搭建人工智能深度神经网络，其服务主要体现在“为用户提供更智能的互联网服务”，他希望通过人工智能技术应用到物理世界中，让人们的生活变得更方便和简单。“现在很多电器都采用软件结合互联网操控，我希望未来都可以实现本地人工智能操控。”

他准备让汽车、空调、冰箱、微波炉等上千种产品或设备都具有从感知到决策的能力。比如用户进入房间时空调就可以感知人的位置和体温自动开机送风，并追随人的移动而改变送风方向；冰箱则会读取存储食物的信息，及时提醒用户食用或补充。

余凯利用深度神经网络算法来搭建他的人工智能框架。他将这种人工智能系统描述成“类似于安卓的智能硬件的大脑平台”，这个系统可以安装在不同的产品中。

他“改造万物”的计划先从家居产品和汽车两个方面着手。地平线机器人技术研发了针对这两个行业的人工智能操作系统。家居方面的基于深度神经网络的操作系统名为“安徒生”，汽车的则称为“雨果”。

现在 “安徒生”已经入驻家电产品，在刚刚过去的上海家博会展上，地平线机器人和某国内知名家电厂商合作的两款智能产品面世参展。“现在业界最大的智能家居厂商都是我们的客户，我们向他们提供算法操作系统，并告诉他们如何配置硬件设备，就像安卓向手机厂商提供参考设计一样。”

下一步余凯准备让“雨果”进入汽车自动驾驶领域，在安装了传感器、处理器和雨果大脑平台后，汽车可以成为提供无人驾驶或智能驾驶的新型交通工具。

“定义万物智能的大脑，这还要花很长时间，但是我觉得一步一步往那边靠近。” 余凯知道地平线机器人的征程漫漫，但对于AlphaGo对战李世石这样的人机大战新闻他却无比笃定。“赛前几乎所有专家都说这次机器赢不了，但我在接受网易采访的时候就公开预测机器会赢，因为我了解AlphaGo的算法。”

陈运文也表达了相同的猜测。3月9日下午，陈运文就兴奋地预测AlphaGo能够获胜，那时首尔的李世石刚在棋盘上落下自己的第一枚黑子。

3个小时后，对弈到186手时李世石投子推枰宣告认输。

“机器赢了”，记者给陈运文发了一条。

“未来已来”，他这样回复。