「CDA 数据分析师人才行业标准」旨在为数据分析及大数据相关岗位打造一套系统化、规范化的人才评价体系。CDA 数据分析师认证考试作为衡量标准化人才的评估途径,明确了考生需掌握的知识范围和技能要求,助力考生通过系统学习,成长为行业精英。

CDA LEVELⅡ大数据分析师认证考试大纲详解

考试模式:采取线下统一考试,机考形式进行。

考试题型:包含客观题(选择题、多选题)和上机操作题两部分。

考试时长:总计210分钟,其中第一阶段90分钟为客观题机考,第二阶段120分钟为案例操作,考生需自备电脑,使用统一提供的案例数据CSV文件。

针对不同知识点,考核要求分为三个层次:【领会、【熟知】、【应用】,考生需按此标准进行深入学习。

1. 【领会】层次要求考生理解知识点的基本概念及其相互关系,能够准确阐述、解释和说明。

2. 【熟知】层次要求考生掌握知识的核心要点,进行逻辑严密的分析和阐述。

3. 【应用】层次要求考生将理论知识转化为实际操作能力,能够运用工具进行商业分析。

【PART 1 大数据基础理论】占比8%

- 大数据分析基础

- Python基础

- Linux & Ubuntu操作系统基础

【PART 2 Hadoop理论】占比12%

- Hadoop安装配置及运行机制

- HDFS分布式文件系统

- MapReduce理论及实战

- Hadoop生态其他常用组件

【PART 3 大数据分析之数据库理论及工具】占比16%

- 数据库导论

- MySQL理论及实战

- HBase安装及使用

- Hive安装及使用

- Sqoop安装及使用

【PART 4 大数据分析之数据挖掘理论基础】占比10%

- 数据挖掘基本思想

- 数据挖掘基本方法介绍

- 有监督学习算法

- 无监督学习算法

【PART 5 大数据分析之Spark工具及实战】占比35%

- Spark基础理论

- Spark RDD基本概念及常用操作

- Spark流式计算框架Spark Streaming、Structured Streaming

- Spark交互式数据查询框架Spark SQL

- Spark机器学习算法库Spark MLlib基本使用方法

- Spark图计算框架GraphX

【PART 6 大数据分析之数据可视化方法】占比4%

- 数据可视化入门基础

- Python数据可视化入门

- Python高级数据可视化方法

【PART 7 大数据分析实战】占比15%

- 利用HDFS Shell操作HDFS文件系统

- 利用Hive SQL进行数据清洗

- 利用Sqoop进行数据传输

- 利用Spark SQL进行数据读取

- 利用Spark MLlib进行机器学习建模

- 利用Python进行建模结果数据可视化

考生应根据自身需求选择学习内容,参考书目无需全部学完,只需针对考纲知识点进行针对性学习。