
一篇通俗易懂的人工智能介绍文章.doc
12页一篇通俗易懂的人工智能介绍文章人工智能现在火得不行但是对一般人来说,大家也就是看看热闹而已什么是人工智能?人工智能是怎么发展的?又有哪些类型?其机制是怎样的?为什么到现在才取得突破?这些东西恐怕是不少人不知道的所幸英国的VC David Kelnar写了一篇通俗易懂的AI介绍性文章,把过去60年人工智能所取得的进展给解释清楚了,值得一看过去10年我们一直在做一件事,那就是打造移动优先的世界而在接下来的10年时间里,我们将转到一个AI优先的世界——Google CEO Sundar Pichai,2016年10月从Amazon和Facebook,到Google和微软,全球大部分最有影响力的技术公司都在表现出自己对人工智能(AI)的狂热但什么是人工智能?为什么人工智能重要?为什么是现在?尽管对AI的兴趣与日俱增,但目前能理解该领域的主要还只是专业人士而已这篇初级读物的目标是让更广大的受众能够理解这一重要领域我们会先从解释“AI”的含义以及包括“机器学习”在内的关键术语开始我们将举例说明AI最有生产力的领域之一,所谓的“深度学习”是如何工作的我们还会探讨AI解决的问题,以及为什么这些问题的解决那么重要。
然后我们还将弄清楚一个问题:为什么早在1950年代就已经诞生的AI,直到今天才崛起作为VC,我们要寻找能为消费者和公司创造价值的新兴趋势我们相信,AI是计算的一次演进,其重要性不亚于甚至甚于向移动和云计算的转移Amazon CEO 贝索斯说:“AI在未来20年对社会产生的影响之大怎么评估都不为过我们希望这一指南可以穿越炒作,解释清楚为什么这一新兴趋势对我们所有人——无论你是消费者还是高管或者创业者、投资者都很重要什么是AI?1、人工智能:智能程序的科学“人工智能(AI)”这个词是达特茅斯大学助理教授John McCarthy在1956年发明的一个词,这个一般性术语是指展现出看似具有智能的行为的硬件或者软件用McCarthy教授的话来说,它是“制造智能机器、尤其是智能计算机程序的科学和工程基础“AI”出现已经有几十年的时间了,一开始为基于规则的程序,可在特定上下文环境下提供初步的 “智能”显示但是所取得的进展较为有限——因为处理许多现实世界问题的算法对于靠人工编程来处理来说太过复杂复杂的活动包括做出医疗诊断、预测机器什么时候失效,或者评估特定资产的市值等,这些都牵涉到成千上万的数据集,以及变量之间非线性的关系。
在这些情况下,是很难利用我们手头的数据来取得最好效果的——也就是“优化”我们的预测在其他一些情况下,包括识别图像中的对象以及翻译语言等,我们甚至都无法制定规则来描述我们要寻找的特征我们如何能编写出一套规则,在所有情况下都能描述一条狗的样子呢?如果我们能够把做出复杂预测——也就是数据优化和特征描述的难题从程序员转移给程序会怎样呢?这个就是现代人工智能带来的希望2、机器学习:卸下优化的负担图1:人工智能的演进机器学习(ML)是AI的子集所有的机器学习都是AI,但并非所有的AI都是机器学习(见上图)今天对“AI”的兴趣反映的是对机器学习的狂热,因为这方面取得的进展较为迅速和重大机器学习让我们可以处理对于人来说太过复杂的问题,其手段是把其中一些负担交给了算法正如AI先驱Arthur Samuel在1959年所述,机器学习是“让计算机有能力在不需要明确编程的情况下自己学习的研究领域大多数机器学习的目标都是针对特定用例开发一个预测引擎一个算法会接收有关某个领域的信息(比如某人过去看过的电影),然后给出输入的权重来做出有用的预测(此人将来喜欢另一部不同电影的可能性)所谓的赋予“计算机学习的能力”,意思是指把优化(对现有数据的变量赋予权重以做出对未来的精确预测)的任务交给了算法。
有时候我们还可以更进一步,把指定首先要考虑的特征这项任务也交给程序机器学习算法是通过训练来学习的算法一开始会接收输出已知的例子,然后留意其预测与正确输出之间的不同,再对输入的权重进行调整,从而改进预测的精确度,直到完成优化这样一来,机器学习算法的定义性特征就是通过经验来改善预测的质量我们提供的数据越多(往往要到达一定的点),我们能创建的预测引擎就越好(下面的图2、3注意所需的数据集规模是高度上下文相关的——以下的例子无法一般化)图2图3机器学习有超过15种方案,每一种都采用不同的算法结构来优化基于所接收数据的预测其中一种方法叫做“深度学习”,这种方法在新领域取得了突破性的结果,我们会在下面进一步探讨但是除此以外还有很多种方法,尽管这些方案受到的关注略低,但仍然很有价值,因为它们适用于很广范围的使用案例除了深度徐诶以外,其他一些最有效的机器学习算法包括:“随机森林”,可创建众多决策树来优化预测;“贝叶斯网络”,可利用概率法来分析变量和变量之间的关系;“支持向量机”,提供分类的实例给它,它就能创建模型,然后分配新的输入给其中一个类别每一种方法都有各自的优势和劣势,而且结合使用也是可以的(“集成”法)。
选定用于解决特定问题的算法要取决于包括现有数据集性质在内的因素实际上,开发者往往会进行试验来看看哪种有效机器学习的用例视我们的需求和想象不同而不同有了合适的数据,我们就能针对无数目的开发算法,这包括:根据某人此前购买历史推荐其可能喜欢的产品;预测某机器人或者汽车装配线什么时候会失效;预测电子邮件是否寄错;估计信用卡交易属于欺诈的可能性,等等3、深度学习:卸载特征定义的麻烦即便有了一般机器学习——比如随机森林、贝叶斯网络、支持向量机等,编写能很好地执行特定任务,比如语音识别号图像识别等的程序仍然很困难为什么?因为我们不能用实用、可靠的方式来指定需优化的特征比方说,如果我们想写一个程序来识别汽车图片,我们不能为算法处理指定汽车的特征,能让它在任何情况下都能正确识别汽车的形状、大小、颜色都各不一样位置、方位和造型也各异还有背景、光线等大量的其他因素影响着该对象的样子写一套规则涉及到的变化太多了(多到几乎无法穷举)而且即便我们能写出这样的规则,那也不会是可扩充的解决方案因为我们得为每一种我们希望识别的对象都编写一套程序于是就引出了深度学习(DL),这个东西彻底改变了人工智能世界深度学习是机器学习的子集——是后者超过15种方法的一种。
所有的深度学习都是机器学习,但并非所有的机器学习都是深度学习(见下图4)图4深度学习是有用的,因为它避免了程序员必须承担特征定义(定义特征来对数据进行分析)或者优化(如何赋予数据权重以提供精确预测)的任务——这两件事情都由算法包办了这是如何实现的呢?深度学习的突破是对大脑而不是世界建模我们的大脑学习做复杂的事情——包括理解原因和识别对象等,靠的不只是处理详尽的规则,还包括练习和反馈小时候我们体验这个世界(比方说我们看汽车的图片),做出预测(“汽车!”)然后收到反馈(“是的!”)在没有掌握详尽规则集的情况下,我们通过训练来学习深度学习采用相同的办法把近似于大脑神经元功能的,人工的、基于软件的计算器连接到一起它们组成了一个“神经网络”,这个网络接收输入(比如前面我们提到的汽车照片);分析它;对它做出判断然后再接收自己判断是否正确的信息如果输出错误,算法就会对神经元之间的连接进行调整,而这将改变未来的预测一开始神经网络会发生很多的错误但随着我们提供了上百万的例子,神经元之间的连接就会不断得到调整,最终使得这个网络几乎在所有情况下都能得出正确决定熟能生巧(几乎)通过之一过程,随着效率不断增加,我们现在可以:识别图片的元素;实时进行语言翻译;用语音来控制设备(苹果的Siri、Google Now、Amazon Alexa以及Microsoft Cortana);预测遗传变异如何影响DNA转录;分析客户评论的情绪;检测医疗影像中的肿瘤等。
当然,深度学习并不是适合于每一个问题它通常需要用庞大数据集来进行训练训练和运行神经网络还还需要庞大的计算能力它还有一个“可解释性”的问题——究竟神经网络是如何形成预测是很难知道的但通过解放程序员让后者不需要进行复杂的特征定义,深度学习为一系列重要问题提供了一个成功的预测引擎因此,它成为了AI开发者工具包当中的一项强大的工具深度学习是如何工作的?鉴于深度学习的重要性,了解一些深度学习的基本原理是很有价值的深度学习牵涉到对人工的“神经网络”——一组相互连接的“神经元(基于软件的计算器)”的利用一个人工神经元有一到多个输入它会根据这些输入执行数学运算然后产生输出输出要取决于每一项输入的“权重”,以及神经元中的“输入—输出函数”的配置(见下图5)输入—输出函数会各有不同神经元可以是:线性单元(输出与输入总权重成正比关系);阈值单元(输出设定为两级中的一级,具体取决于总输入是否超过特定值);Sigmoid单元(输出不断变化,但不是随输入变化而线性改变)当神经元相互连接到一起时,神经网络就被创建出来了,而一个神经元的输出就会变成另一个神经元的输入(见下图6)图5、6神经网络被组织为若干层神经元(“深度”学习就是这么出来的)。
输入层”接收网络要处理的信息——比方说,一组图片输出层”则提供结果在输入和输出层之间的是“隐藏层”,大部分活动都在这里发生一般而言,神经网络每一级的每一个神经元的输出都会充当下一层每一个神经元的输入(见下图7)图7我们可以看看下面这个图像识别算法的例子——假设我们要识别图片中的人脸当数据被提供给神经网络时,第一层仙湖识别局部反差模式——也即是像轮廓这样的“底层”特征随着图像横穿网络,“更高层”特征逐步被解析出来——从轮廓到鼻子,然后从鼻子到脸部(见下图8)图8在它的输出层,根据训练神经网络会给出该图片属于特定类型的概率(人脸:97%;气球2%;叶子1%)通常,神经网络的训练是通过给它提供大量打上标签的例子来进行的错误可以被检测到,而算法会调整神经元之间连接的权重来改善结果在部署好系统并对未打标签的图像进行评估后,优化的过程还会重复进行很多次上面是一个简单的神经网络例子,但是它们的结构可以是各不相同的,而且大部分都会更加复杂变化可以是同一层神经元之间的连接;每层神经元数量的不一样;以及返回给上一级网络的神经元输出数(“递归”神经网络)设计和改进神经网络需要可观的技能步骤包括对针对特定应用的网络架构设计,提供合适的数据训练集,根据进展情况调整网络结构,以及多种方法的结合等。
AI为什么重要?AI之所以重要是因为他解决了极其复杂的问题,而这些问题的解决方案可以应用到对人类福祉重要的领域——从健康、教育,到商业、交通,乃至于公用事业和娱乐等等自1950年代以来,AI的研究主要集中在以下5个领域:推理:通过逻辑推理解决问题的能力知识:展示有关世界知识的能力(理解这个世界有特定的实体、事件以及情况;知道那些元素有属性;并且那些元素可以分类)规划:设置和实现目标的能力(这个世界有一个特定的未来状态,这个状态是令人满意的,可以采取一系列动作来影响朝着这个状态发展沟通:理解书面和口头语言的能力感知:通过可视化图像、声音等感觉输入推断事物的能力AI是有价值的,因为在许多上下文环境下,这些能力的进步是革命性而不是渐进性的能力以下是AI的一些应用例子,但远不止这些推理:法律评估;金融资产管理;金融应用处理;游戏;无人武器系统知识:医疗诊断;药物创新;媒体推荐;购买预测;金融市场交易;防欺诈规划:物流;调度;导航;物理和数字网络优化;预测性维护;需求预测;存货管理沟通:语音控制;智能代理;虚拟助手和客户支持;书写与口头语言的实时翻译;实时抄写。
