摘要:大數(shù)據(jù)分析師認證考試知識點有大數(shù)據(jù)基礎知識、大數(shù)據(jù)存儲技術、數(shù)據(jù)編程、數(shù)據(jù)質量控制等,其中數(shù)據(jù)編程部分占比較高,有25%的內容。大數(shù)據(jù)分析師認證考試知識點及占比詳見正文。
大數(shù)據(jù)分析師認證考試知識點及占比具體如下:
產品名稱 | 試題占比 |
大數(shù)據(jù)基礎知識 | 10% |
大數(shù)據(jù)存儲技術 | 10% |
數(shù)據(jù)分析工具 | 10% |
數(shù)據(jù)可視化 | 10% |
數(shù)據(jù)編程 | 25% |
數(shù)據(jù)質量控制 | 15% |
數(shù)據(jù)分析項目管理 | 10% |
機器學習 | 10% |
大數(shù)據(jù)分析師認證考試知識點詳細如下:
一、大數(shù)據(jù)基礎知識考試內容
(1)了解大數(shù)據(jù)的定義、特點等。
(2)了解數(shù)據(jù)的類型和不同的分析處理方法。
(3)了解大數(shù)據(jù)相關的概念、實際的應用案例、適用的場景等。
(4)了解云計算的特點、云計算與大數(shù)據(jù)的關系。
(5)了解大數(shù)據(jù)相關的技術,如存儲、計算、分析等。
(6)了解大數(shù)據(jù)職業(yè)的特點與對人才的要求。
二、大數(shù)據(jù)存儲技術考試內容
(1)了解分布式存儲技術的概念與特點
(2)了解數(shù)據(jù)存儲技術適用的不同場景,包括數(shù)據(jù)類型(如結構化、半結構化、非結構化數(shù)據(jù))、數(shù)據(jù)容量、使用場景等。
(3)了解數(shù)據(jù)庫的基本概念與特點,包括可靠性、約束、三范式、適用場景等。
(4)了解數(shù)據(jù)倉庫的基本概念與特點,包括與數(shù)據(jù)庫的區(qū)別、ETL 等。
(5)了解 HDFS 與 MaxCompute 的構成與特點。
(6)了解文件存儲、數(shù)據(jù)庫存儲、分布式存儲之間的優(yōu)缺點。
(7)掌握大數(shù)據(jù)計算服務的數(shù)據(jù)上傳和下載,可以熟練使用 MySQL、HDFS、MaxCompute 等進行數(shù)據(jù)存儲。
(8)了解 Hadoop、MaxCompute 等產品的基本概念與特點,包括應用場景和局限性。
三、數(shù)據(jù)分析工具考試內容
(1)掌握大數(shù)據(jù)計算服務的 SQL 命令,包括 DDL、DML 以及常見內置函數(shù)。
(2)了解 MapReduce 的基本概念與特點。
(3)能夠使用 DataWorks 的數(shù)據(jù)開發(fā)模塊進行設計開發(fā),包括建表、任務開發(fā)、數(shù)據(jù)上傳等。
(4)能夠使用 MySQL、MaxCompute、Hive 平臺進行數(shù)據(jù)分析。
四、數(shù)據(jù)可視化考試內容
(1)了解數(shù)據(jù)可視化的基本知識,如定義、特點、實現(xiàn)方式等。
(2)了解 Quick BI、DataV 的產品特點和使用場景。
(3)了解常見圖表類型的特點和適用場景。
(4)能夠使用 Quick BI 設計開發(fā)報表和門戶。
(5)了解可視化產品的分類和基本設計原則。
五、數(shù)據(jù)編程考試內容
(1)掌握數(shù)據(jù)預處理的基本方法。
(2)了解描述性統(tǒng)計分析的概念和特點,包括常見統(tǒng)計量、概率分布、擬合與檢驗。
(3)了解假設檢驗的概念和特點,能夠根據(jù)應用場合真確使用正態(tài)分布單樣本和雙樣本和二項分布假設檢驗。
(4)能夠基于項目的目標與范圍規(guī)劃數(shù)據(jù)分析方案,設計合理的指標。
(5)了解數(shù)據(jù)分析編程的特點,包括編程手法、編程效率、編程規(guī)范和質量控制。
(6)了解指標體系的概念,包括總量指標、結構指標和平均指標,并能夠合理應用達到數(shù)據(jù)分析目的。
(7)掌握數(shù)據(jù)分析報告撰寫的規(guī)范。
六、數(shù)據(jù)質量控制考試內容
(1)了解數(shù)據(jù)質量的 5 個維度的概念和特點。
(2)了解在數(shù)據(jù)質量的 5 個維度基礎上,臟數(shù)據(jù)的種類、來源、造成的影響。
(3)掌握處理臟數(shù)據(jù)的方法,包括對臟數(shù)據(jù)的檢查、修復、清洗、轉換等。
(4)了解數(shù)據(jù)質量問題在數(shù)據(jù)編程過程中發(fā)生的原因,并能夠利用質量檢驗的技術手段保證項目的順利執(zhí)行。
(5)了解項目的目標是數(shù)據(jù)分析項目中衡量數(shù)據(jù)質量的主要標準,并能夠判斷數(shù)據(jù)中的質量問題是否對數(shù)據(jù)分析項目產生影響。
七、數(shù)據(jù)分析項目管理考試內容
(1)了解項目工程管理方法論的定義、特點和實際應用場景。
(2)能夠理解數(shù)據(jù)分析項目的實施流程、重點環(huán)節(jié)、數(shù)據(jù)項目執(zhí)行流程的重要性。
(3)掌握項目設計的特點,包括業(yè)務問題數(shù)據(jù)化、明確項目的目的、范圍、和分析維度等。
(4)能夠利用項目績效分析實現(xiàn)項目后數(shù)據(jù)分析。
(5)能夠利用現(xiàn)狀、原因、預測的分析方法實現(xiàn)項目前數(shù)據(jù)分析。
(6)了解臨時性項目與經(jīng)常性項目之間的區(qū)別。
八、機器學習考試內容
(1)了解機器學習常見的算法,如聚類、決策樹、關聯(lián)分析等。
(2)了解機器學習的常見使用流程,包括算法調優(yōu)和效果評估。
(3)能夠使用聚類分析,包括 K-means 算法對相似的顧客分類。
(4)能夠使用決策樹算法生成商業(yè)規(guī)則。
(5)能夠使用關聯(lián)分析實現(xiàn)購物籃分析。
阿里云認證備考資料免費領取
去領取
阿里云認證