
大数据分析师认证考试大纲.docx
9页大数据分析师认证考试大纲 阿里云行业认证:大数据分析师专业认证考试(ACP级)大纲阿里云大数据行业认证-大数据分析师专业认证介绍:阿里云大数据行业认证-大数据分析师专业认证(ACP-AlibabaCloud Certified Professional)是大数据行业认证体系中的技能认证,同时也是一个跨平台、通用型专业技术认证主要包括数据分析相关的知识体系,如数据库知识、数据质量控制、数据编程、机器学习、数据分析工具、机器学习、数据可视化,主流大数据技术等;介绍了数据分析在行业中的实际应用与项目管理方法,及相关的数据技术和技能,包括8个知识与技能模块:大数据基础知识、大数据存储技术、数据分析工具、数据可视化、数据编程、数据项目质量控制、数据项目设计与执行、机器学习通过该行业技术认证可以有效证明持证者具备以下能力:具备大数据相关的基础知识了解大数据分析职业的特点及行业对大数据分析人员的职业要求了解大数据存储技术的特点,能够熟练使用传统关系型数据库,了解数据仓库的基本知识,能够使用开源大数据技术、阿里云数加等管理和使用数据掌握SQL语言编程技能,能够根据项目需要进行数据库管理和数据编程熟练掌握数据可视化相关工具,如Tableau、Quick BI、DataV,并且能设计与开发可视化大屏和商业报表掌握数据质量管理的特点和要求,能够在数据分析中判断数据质量对项目的影响并提供相应解决方案掌握数据分析的质量控制流程,利用数据预处理技术合理处理脏数据基于对数据分析项目的编程方法,保证程序的运行效率和数据分析结果的质量能够运用七何分析法针梳理数据项目的目标、范围,根据对业务要求的理解设计合理的数据分析方案掌握机器学习技术的使用和应用场景,如聚类分析、决策树、关联分析等能够独立撰写数据分析项目报告阿里云认证的报名方式:报名入口为阿里云大数据行业认证大数据分析师专业认证所需具备的前置知识:通用IT的知识:具备基础的IT知识,熟练使用Windows、MAC、Linux等操作系统中的至少一种了解大数据相关的基础知识,如定义、特征、实际应用案例等了解关系型数据库的基本概念:数据库,表,索引,视图,存储过程,函数等了解云计算、开源大数据Hadoop生态圈中的主要产品、阿里云数加主要产品和服务了解软件工程的基本流程阿里云大数据行业认证大数据分析师专业认证相关的学习方法、学习资料及培训课程:建议的学习方法:结合阿里云大学官网()的视频学习资料进行学习结合阿里云大数据行业认证培训课程进行学习认证考试形式和试卷结构:一、试卷满分及考试时间试卷满分为100分,考试时间为120分钟,通过分为70分二、考试形式考试三、答题方式闭卷四、试卷内容产品名称试题比例大数据基础知识10%大数据存储技术10%数据分析工具10%数据可视化10%数据编程25%数据项目质量控制15%数据项目设计与执行10%机器学习10%五、试卷题型题目类型题目数量分值单选题50题每题1分多选题30题每题1分判断题20题每题1分六、试卷内容范围大数据基础知识考试内容:了解大数据的定义、特点等了解数据的类型和不同的分析处理方法了解大数据相关的概念、实际的应用案例、适用的场景等了解云计算的特点、云计算与大数据的关系了解大数据相关的技术,如存储、计算、分析等了解大数据职业的特点与对人才的要求大数据存储技术考试内容了解分布式存储技术的概念与特点了解数据存储技术适用的不同场景,包括数据类型(如结构化、半结构化、非结构化数据)、数据容量、使用场景等了解数据库的基本概念与特点,包括可靠性、约束、三范式、适用场景等了解数据仓库的基本概念与特点,包括与数据库的区别、ETL等了解HDFS与MaxCompute的构成与特点了解文件存储、数据库存储、分布式存储之间的优缺点掌握大数据计算服务的数据上传和下载,可以熟练使用MySQL、HDFS、Maxcompute等进行数据存储了解Hadoop、MaxCompute等产品的基本概念与特点,包括应用场景和局限性数据分析工具考试内容掌握大数据计算服务的SQL命令,包括DDL、DML以及常见内置函数了解Mapreduce的基本概念与特点能够使用DataIDE的数据开发模块进行设计开发,包括建表、任务开发、数据上传等能够使用MySQL、Maxcompute、Hive平台进行数据分析数据可视化考试内容了解数据可视化的基本知识,如定义、特点、实现方式等了解 Quick BI、DataV的产品特点和使用场景了解常见图表类型的特点和适用场景能够使用 Quick BI 设计开发报表和门户了解可视化产品的分类和基本设计原则数据编程考试内容掌握数据预处理的基本方法了解描述性统计分析的概念和特点,包括常见统计量、概率分布、拟合与检验了解假设检验的概念和特点,能够根据应用场合真确使用正态分布单样本和双样本和二项分布假设检验能够基于项目的目标与范围规划数据分析方案,设计合理的指标了解数据分析编程的特点,包括编程手法、编程效率、编程规范和质量控制了解指标体系的概念,包括总量指标、结构指标和平均指标,并能够合理应用达到数据分析目的掌握数据分析报告撰写的规范数据项目质量控制考试内容了解数据质量的5个维度的概念和特点了解在数据质量的5个维度基础上,脏数据的种类、来源、造成的影响掌握处理脏数据的方法,包括对脏数据的检查、修复、清洗、转换等了解数据质量问题在数据编程过程中发生的原因,并能够利用质量检验的技术手段保证项目的顺利执行了解项目的目标是数据分析项目中衡量数据质量的主要标准,并能够判断数据中的质量问题是否对数据分析项目产生影响数据项目设计与执行考试内容了解项目工程管理方法论的定义、特点和实际应用场景能够理解数据分析项目的实施流程、重点环节、数据项目执行流程的重要性掌握项目设计的特点,包括业务问题数据化、明确项目的目的、范围、和分析维度等能够利用项目绩效分析实现项目后数据分析能够利用现状、原因、预测的分析方法实现项目前数据分析了解临时性项目与经常性项目之间的区别机器学习考试内容了解机器学习常见的算法,如聚类、决策树、关联分析等了解机器学习的常见使用流程,包括算法调优和效果评估能够使用聚类分析,包括K-means算法对相似的顾客分类能够使用决策树算法生成商业规则能够使用关联分析实现购物篮分析 -全文完-。












