ABW501 (Analytics Edge) 期末终极复习:4大题型完整预测 (含扩展版)
6 min read
📚 考试信息
- 题型: 4道结构化题
- 范围: 第1、2、5、7章 + 数据分析核心
- 答题提示: 答案简短,善用表格/关键词,可使用计算器。
📸 图解速查:Henry复习资料
以下图片来自Henry甄选版复习资料。
ABW501复习资料第1页
ABW501复习资料第2页
ABW501复习资料第3页
✅ 4 大题型完整预测(Week 1/2/5/7)
📝 考试概况 (Exam Overview)
- 范围: Chapter 1, 2, 5, 7
- 结构: 4 道大题 (Structured Questions)
- 难度: 基础定义、表格对比 (Table Comparison)、简单解释为主
- 工具: 可带计算器(可能涉及简单距离/比例)
🟢 Question 1: Concepts of Analytics (Chapter 1)
核心考点:分析四种类型 + BA vs DS 技能对比(高频考点)
Q1(a): 四种分析类型定义与对比
题目预测:"Define the four types of analytics and provide one question each type answers."
👉 点击查看标准答案表格
| 分析类型 (Type) | 关键词 (Keywords) | 解决的问题 (Question Answered) | 例子 (Example) |
|---|---|---|---|
| Descriptive (描述性) | Past, Historical | "What happened?" (发生了什么?) | 销售月报 (Monthly Sales Report) |
| Diagnostic (诊断性) | Cause, Why | "Why did it happen?" (为什么发生?) | 客户流失原因分析 (Churn Reason) |
| Predictive (预测性) | Future, Probabilistic | "What will happen?" (将会发生什么?) | 下季度销量预测 (Sales Forecast) |
| Prescriptive (规范性) | Optimization, Best Action | "What should we do?" (我们该做什么?) | 最优定价策略 (Optimal Pricing) |
Q1(a) 补充概念题:四种分析类型简述(表格)
👉 点击查看补充答案
| 分析类型 | 核心问题 | 核心要点 | 例子 |
|---|---|---|---|
| Descriptive | What happened? | 历史数据/报表 | 月度销售报告 |
| Diagnostic | Why did it happen? | 相关性/根因 | 流失原因分析 |
| Predictive | What will happen? | 预测/概率 | 需求或销量预测 |
| Prescriptive | What should we do? | 优化/行动建议 | 最优定价/最优库存 |
答题提示:用表格写 “问题 + 要点 + 例子”,直观稳妥。
Q1(b): BA vs. DS 技能对比(重点版)
题目预测:"Compare Business Intelligence Analyst (BA) and Data Scientist (DS) based on their skill focus."
👉 点击查看标准答案表格
| 技能 (Skills) | 商业智能分析师 (BA) | 数据科学家 (DS) | 核心区别 (Key Difference) |
|---|---|---|---|
| Business Knowledge | Very High | High | BA 更懂业务逻辑 |
| Data Visualization | Very High | High | BA 侧重报表呈现 |
| Statistics/Math | Some | Very High | DS 需要深厚数学底子 |
| Machine Learning | None/Low | Very High | DS 核心是建模算法 |
| Data Wrangling | Some | Very High | DS 花大量时间清洗数据 |
Q1(b) 补充概念题:技能矩阵 (V/S/N)
👉 点击查看补充答案
| 技能 | BA | DS | 说明 |
|---|---|---|---|
| Data Visualization | V | S | BA 负责报表与故事表达 |
| Data Intuition | S | V | DS 对模型假设更敏感 |
| Statistics | S | V | DS 偏建模,BA偏解读 |
| Data Wrangling | S | V | DS 花时间清洗数据 |
| Machine Learning | N | V | DS 核心能力 |
结论:BA 偏业务沟通,DS 偏统计与建模。
示意图:分析类型与角色对比
🔵 Question 2: Analytics Lifecycle (Chapter 2)
核心考点:数据分析生命周期 6 阶段(顺序必背)
Q2(a): 六大阶段顺序与核心任务
题目预测:"List the 6 phases of the Data Analytics Lifecycle and briefly explain Phase 1 & 4."
👉 点击查看标准答案
The 6 Phases (顺序不能乱)
- Discovery(发现):Define business problem, assess resources.
- Data Preparation(数据准备):ETL, clean data, setup sandbox. (耗时最长)
- Model Planning(模型规划):Choose techniques (Regression, Trees), feature selection.
- Model Building(模型构建):Execute model, split training/testing sets.
- Communicate Results(结果沟通):Visualize findings, pass/fail decision.
- Operationalize(实施/落地):Deploy code, run pilot project.
Key Explanation
- Phase 1 (Discovery):最关键,先把业务问题定义清楚并确认数据来源。
- Phase 4 (Model Building):真正把算法跑在数据上得到结果。
Q2(a) 补充概念题:生命周期阶段(另一版本)
👉 点击查看补充答案
Phases:
- Discovery – Identify business problem and objectives.
- Planning – Decide success metrics and resources.
- Data Preparation – Collect, clean, and transform raw data.
- Model Building – Select algorithms (regression, classification, time-series).
- Model Communicate – Interpret results for stakeholders.
- Operationalize – Deploy models and monitor performance.
Example:Discover churn → Plan KPIs → Prepare CRM data → Build churn model → Communicate segments → Operationalize campaign.
Key Terms:life cycle, discovery, preparation, modeling, deployment
Q2(b): 七个关键角色(加分项)
👉 点击查看角色清单
- Business User – 提业务问题、验证结果
- Project Sponsor – 资源与预算支持
- Project Manager – 进度与沟通协调
- BI Analyst – 报表与可视化桥梁
- DBA – 数据可用性与治理
- Data Engineer – 数据管道与清洗
- Data Scientist – 模型与策略建议
示意图:生命周期与角色
🟠 Question 3: Regression Analysis (Chapter 5)
核心考点:线性回归方程解读 + $R^2$
Q3(补充): Regression types by shape
👉 点击查看补充答案
- Simple Linear Regression – 直线;连续型因变量。
- Logistic Regression – S 曲线;二分类概率输出。
- Polynomial / Non-linear Regression – 曲线;处理非线性关系。
答题提示:看图形状 + 对应用途(连续 / 分类 / 非线性)。
Key Terms:linear, logistic, polynomial, dependent variable, classification
示意图:回归模型形状
Q3(a): 线性回归方程解读
题目预测:Given $Sales = 100 + 5(Advertising)$
👉 点击查看标准答案
- Intercept (100):Advertising 为 0 时,预测 Sales = 100(基础销量)。
- Slope (5):Advertising 每增加 1 单位,Sales 增加 5 单位。
Q3(a) 补充:S = a + bX 答题结构
👉 点击查看补充答案
- a (intercept):X=0 时的预测值(基础销量)。
- b (slope):X 每增加 1 单位,Y 的增量。
- Answer structure:"a: estimated sales at zero input; b: incremental sales per unit of X."
Key Terms:intercept, slope, marginal change
Q3(b): $R^2$ 的含义
题目预测:"What does an $R^2$ of 0.85 mean in this context?"
👉 点击查看标准答案
- Definition:Coefficient of Determination(决定系数)。
- Meaning:Sales 变动中 85% 能被 Advertising 解释。
- 关键词:Explained variation(解释的变异)。
示意图:回归与 $R^2$
🔴 Question 4: Data Mining (Chapter 7)
核心考点:监督 vs 无监督 + 基础算法辨析
Q4(a): Supervised vs. Unsupervised
题目预测:"Compare Supervised Learning and Unsupervised Learning using a table."
👉 点击查看标准答案表格
| 比较维度 (Dimension) | Supervised Learning (有监督) | Unsupervised Learning (无监督) |
|---|---|---|
| Label | Has Labels (Target Variable known) | No Labels (No Target Variable) |
| Goal | Prediction (预测结果) | Description / Grouping (发现模式) |
| Typical Tasks | Classification, Regression | Clustering, Association Rules |
| Algorithms | Linear Regression, Decision Tree | K-Means, Apriori |
Q4(a) 补充:关键术语
👉 点击查看补充答案
Key Terms:labeled data, prediction, clustering, pattern discovery
Q4(a) 补充:监督 vs 无监督对比表(更直观)
👉 点击查看补充答案
| 维度 | 监督学习 (Supervised) | 无监督学习 (Unsupervised) |
|---|---|---|
| 是否有标签 | 有标签 | 无标签 |
| 目标 | 预测 | 发现模式/分组 |
| 任务 | 分类、回归 | 聚类、关联 |
| 例子 | 垃圾邮件识别 | 客户分群 |
Q4(b): Clustering vs. Classification
题目预测:"Briefly explain the difference between Classification and Clustering."
👉 点击查看标准答案
- Classification (分类):将数据分到预先定义的类别(有标签)。
- Clustering (聚类):没有预先类别,按相似性自动分组(无标签)。
Q4(b) 补充总结:监督 vs 无监督
👉 点击查看补充答案
- Supervised learning:用有标签数据做预测(regression/classification)。
- Unsupervised learning:无标签,发现模式(clustering/association)。
- 答题提示:强调是否有标签 + 给一个例子。
Key Terms:prediction, pattern recognition, labeled vs unlabeled
示意图:分类 vs 聚类(可视化题型)
⚠️ Calculator Alert(简单计算准备)
Chapter 7 可能出现 Euclidean Distance (欧氏距离):
$$\sqrt{(x_2-x_1)^2 + (y_2-y_1)^2}$$
例:点 A(1,2) 与点 B(4,6) 的距离 = $\sqrt{3^2+4^2}=5$。
✅ 复习策略
- 利用表格突出对比(分析类型、BA vs DS、监督 vs 无监督)。
- 每题4点内回答;关键词+短语呈现。
- 解释生命周期或模型时加入具体例子。
**祝考试顺利! 🎯