1、零基础蜕变产品经理目录零基础成长为AI产品经理1一、AI是什么11. AI的定义12. AI的根基13. 机器学习理论详解及算法模型介绍24.重要的关键词解释115. 基础技术166. 技术分层177. AI的常用语言及框架178. AI的价值17二、AI的边界18三、AI的市场情况181. AI应用分类182. AI的市场化183. 硬件&软件194. AI市场的人才需求19四、AI项目中的分工191. AI科学家192. AI工程师193. AI训练师204. AI产品经理215. 数据标注员22五、PM对互联网产品AI升级221. 用AI解决方案代替传统的算法解决方案232. 在原app上添加AI功能23六、AI产品经理需要参与、推动的重要流程24AI产品经理入门手册(上)25一、AI通识251.1 AI产业结构251.2 AI产品经理的分类261.3 AI产品经理的能力模型28二、AI应用领域302.1计算机视觉(CV)302.2语音交互322.3自然语言理解(NLP)34小结36AI产品经理入门手册(下)37三、AI技术373.1 机器学习373.2 监督学习373.3 非监
2、督学习412.4 半监督学习412.5 强化学习412.6 迁移学习422.7 深度学习42四、小结43参考资料43AI产品经理能力模型和常见AI概念梳理45一、AI产品经理能力模型451、AI产品经理能力模型概述452、AI产品经理AI科学家,应用实现门槛不高473、非互联网行业转型的新机会48二、人工智能发展史49人工智能的黄金时代(20世纪5070年代)49人工智能的第一次低谷(20世纪7080年代)49人工智能的繁荣期(1980年1987年)50人工智能的冬天(1987年1993年)50人工智能的新春(1993现在)50三、看待人工智能的几个视角511、从连接主义学习来看512、从智能水平来看523、从技术分层来看534、从技术分类来看535、从应用场景来看53四、学习资料和方法541、推荐书542、推荐学习网站543、推荐公众号544、读paper网站54AI产品经理,如何面对数据挖掘?58一、数据挖掘用于AI产品需求发现58二、数据挖掘用于AI产品设计制造61三、大数据挖掘方法案例解析64四、大数据挖掘的数据获取方法66五、AI产品大数据观67零基础成长为AI产品经理首先我
3、们必须要掌握的是AI的专业知识框架,然后了解AI的市场情况,最后要明白AI产品经理的工作流程及在项目的价值体现。本文致力于让完全没有学习过AI的朋友可以轻松读懂,获取干货。即使你不能完整理解AI也没关系,最起码看完本文之后你可以完美装13,文末会有特别的装13技巧送给你。一、AI是什么1. AI的定义凡是通过机器学习,实现机器替代人力的技术,就是AI。机器学习是什么呢?机器学习是由AI科学家研发的算法模型,通过数据灌输,学习数据中的规律并总结,即模型内自动生成能表达(输入、输出)数据之间映射关系的特定算法。这整个过程就是机器学习。AI模型是个“中间件”,不能直接与用户完成交互,所以AI还是需要借助传统的应用程序,应用程序直接与用户进行交互,同时提交输入数据给模型,模型处理后返回输出数据给应用程序,应用程序再转化为合适的呈现方式反馈给用户。AI解决方案比互联网解决方案有什么优势:再也不需要去归纳总结知识和规律,然后进行越来越复杂的编程,只需要用数据喂养机器,让机器完成所有工作。而且传统的互联网解决方案遇到需要求变时,是个头痛的事,因为直接让工程师对程序、算法进行修改的过程中会需要考虑很多
4、既有程序带来的限制及改动后的未知风险(同时也容易造成人力成本更高),而AI模型是可以迁移、叠加利用的,所以需求变化时,少了很多既有积累的东西带来的问题。2. AI的根基AI的根基从数学理论开始,数学理论(包括:线性代数、概率论、统计学、微积分)的基础上我们得以有机器学习理论,机器学习理论(包括:监督学习、无监督学习、强化学习、迁移学习、深度学习)的基础上我们得以有基础技术,基础技术(包括:机器学习ML、深度学习DL、语音识别ASR、语音合成TTS、计算机视觉CV、机器视觉MV、自然语言理解NLU、自然语言处理NLP、专家系统)的基础上AI应用得以实现。特别提醒:不仅是数学理论,物理理论也是AI的根基。在更深度的AI建模等理论需求中,很多所谓的“数学理论”其实原型来自于“物理理论”。比如熵的概念,比如多维空间的概念,都是出于物理学中的概念。3. 机器学习理论详解及算法模型介绍关于模型算法的结果导向理解: 对数据进行分类; 找到输入数据与输出数据之间的规律。机器学习方式有多种,每种机器学习方式又有多种算法。机器学习方式可以配合利用,且各种算法模型也可以结合利用。机器学习的抽象流程是: 训练
5、机器阶段,让模型对输入数据进行分类,且找到规律; 测试阶段,数据进入模型时,模型对数据进行分类,每一个测试数据都归类到训练数据类别中对应的一个类别,然后根据训练找到的规律计算出输出值(即答案); 欠拟合或者过拟合的情况下,要清洗训练数据、调整参数以及重复训练;达到最佳拟合后,机器学习完成。3.1 监督学习通俗解释:准备好许多组问题和对应答案,然后对机器说:当你看到这个问题的时候,你就告诉人家这个答案。多次重复这样的训练,然后机器从每一次的训练问题和对应答案中找到了其中的规律(即算法)。然后你跟你朋友吹嘘说,我的机器机灵得跟猴似的,不信你问它问题。你这位朋友开始提一大堆问题,提的问题大可以跟你训练的问题不同,机器人只是根据自己之前总结的规律推测出答案给对方。如果发现机器人说出的答案中错误太多,那你就要修理修理它,再重新用更丰富的有标记答案的问题训练一番,直到你的机器被人提问时回答准确率特别高,达到你的期望了。这时候你就可以放心的跟你朋友炫耀:我的机器机灵得跟猴似的。专业解释:准备样本(样本通常准备两组:训练数据和测试数据),先将训练数据(即标记样本)给到机器,同时提供标准答案(有答案的样
6、本数据属于“标记样本”),机器尽量从训练数据中找到因变量和自变量之间的关系,让自己推测的答案尽量跟标准答案靠近。训练过程中机器尝试生成我们需要的算法,这个算法就是我们要机器学习出来的结果。然后我们给机器测试样本(测试数据),不提供标准答案,看机器推理出答案的准确率怎么样,如果准确率太低(欠拟合),那我们就要调整模型的参数,并且再训练机器,接着又用测试数据测试,直到机器达到了我们期望的准确率。抽象一个最简单的逻辑公式:线性代数y=kx。我们提供n组x值及对应y值作为训练数据,模型经过计算推测出k值(推测出k值这个过程我们叫做“回归”),然后我们再用m组测试数据,但是此时只输入x值,看机器得出的y值是否跟我们已知的正确答案y值是否相同。当有多个纬度的特征时,应该抽象公式应该是y=kx1+kx2+kx3,或者y=k1x1+k2x2+k3x3。当然还有可能要考虑其他一些参数,此时公式应该为y=kx1+kx2+kx3+b,或y=k1x1+k2x2+k3x3+b。参数b是我们的AI工程师可以直接调整的,以便让机器训练的结果最接近我们想要的结果。监督学习的算法分类:(1)KNN临近算法在训练阶段时,
7、机器将训练数据进行分类(根据数据的feature,即数据的特征)。(逻辑推理出,在某些情况下模型可以找出来的数据之间的映射不止一条,即可能每一类数据会有一个映射关系。)当测试数据输入时,机器会根据输入数据的特征判断该输入数据跟哪一类的训练数据为同一类,在此判断基础上,机器便决定用哪一个映射关系来推测当下输入测试数据对应的输出数据(即答案)。机器是如何判断测试时的输入数据更接近哪一类训练数据的呢?用数学逻辑解释就是,模型内是一个多维空间,有一个多维坐标,每一纬是一个特征,当一个训练数据输入时,该数据坐落在坐标上某一点,训练数据量大了之后,模型里的坐标上有无数点。当测试数据输入后,根据测试数据的特征在坐标上为它找到一个点,机器会找与该点欧式距离最近的点(训练数据的点)是哪一个,并且将该点视为与找到的距离最近的训练数据的点为同一类。举个栗子:Mary喜欢玩探探,在她眼里,探探里的男银分3类。第一类是不喜欢,左划;第二类是喜欢,右划;第三类是超级喜欢,点星星。第一类男银的共同点是单眼皮、低鼻梁、秃顶、穿安踏;第二类的共同点是双眼皮、高鼻梁、茂密的头发,穿西装;第三类的共同点是带名牌手表,照片旁
8、边有一辆跑车。AI了解Mary后,开始为Mary把关。当AI看到一个男银上探探,就会看这个男银是否单眼皮,鼻梁接近于高还是低,头发多少,着装幼稚还是成熟,然后将这个男银为第一类或者第二类,第一类的直接帮Mary划掉,第二类的直接帮Mary点喜欢。还有,当AI看到一个男银带名牌表,有豪车,直接帮Mary点一个超级喜欢。然后Mary不用那么累地全部都要点一遍,AI帮她选的人她都挺满意,她一脸的满足。(2)决策树ID3算法基于“决策树”的理论的一种算法。根据数据特征进行分支,直到不可再分支,此时决策树成形,数据也被分出一类来,成形的一个决策树表现了这一类数据的所有特征。示意图(Jennifer去相亲):该决策树形成后(一条分枝将特征消化完之后),我们视满足该条分枝上所有特征的为同一类人(即我们分出了一类数据)。凭经验推测,这类人就是Jennifer最后选择的结婚对象。(如果你不知道我指的是哪一条,那你这辈子一定都找不到老婆)决策树ID3算法与KNN算法的区别在于:KNN算法需要始终保存并持续使用所有训练数据,决策树ID3算法完成决策树之后,可以不再保存所有的训练数据了(可以清清内存),只需要
9、将决策树模型保留下来,便可以对新数据进行高准确率地分类。(3)logistic逻辑回归算法当特征和结果不满足线性时(函数大于一次方时),就可以用逻辑回归算法。逻辑回归是一个非线性模型,它的因变量(x)跟线性回归函数不相同。逻辑回归同样用来解决分类问题,呈二项分布(示意图1),它只输出两种结果,0或1(实际情况是输出为00.5,或0.51,小于0.5取值0,大于等于0.5取值1),0和1分别代表两个类别。作为产品经理,我们不需要去理解模型内部是怎么回事(反正我目前也没看懂模型内部到底怎么回事),我们只需要了解,当特征和结果,即X与Y之间的关系不满足线性关系(函数大于一次方),就可以利用逻辑回归算法,算法得出的值约等于1或约等于0,约等于1时该输入数据属于一类,约等于0时该输入数据属于另一类。或许以后在实战中,你的AI工程师搭档会跟你讲解,看了这篇文章,你在听你的AI工程师解释的时候不会茫然吧。逻辑回归的基础公式:示意图1:(4)支持向量机SVM主要优势就是可以判断到分类是否正确。先给大家举一个例,当我们要分割一个平面,会用一条线,即分割二维数据用一维数据;如果我们要分割一个立体空间,会用一个面,即分割三维数据用二维数据。理解例子后,就可以理解SVM的原理了。SVM的原理就是用一个N-1维的“分割超平面”线性分开N维空间,而所有数据都在这个空间内各为一点。每一次分割超平面开始切分,都在将空间内的数据分为两部分(假设为A、B两边),模型的目的就是让分出来的两部分数据是两个类别,我们要理解在A这边的每个数据点到分
《零基础蜕变--通向人工智能产品经理之路》由会员l**分享,可在线阅读,更多相关《零基础蜕变--通向人工智能产品经理之路》请在金锄头文库上搜索。