课程

课程介绍

数据仓库是一个面向主题的、集成的、随时间变化的、但信息本身相对稳定的数据集合,用于对管理决策过程的支持。

培训对象

学员需具备:
至少熟悉掌握一种关系型数据库使用;
开发工程、运维工程师、测试工程师。

课程收益

数据仓库就是整合多个数据源的历史数据进行细粒度的、多维的分析,帮助高层管理者或者业务分析人员做出商业战略决策或商业报表。

知识概要

-- 数据仓库建模设计方法;
-- 开发体系规范和开发。

课程大纲

模块

学习内容

第一天

数据仓库建模设计方法-1

为什么需要模型

模型的组织结构

模型实施方法

模型设计策略

数据仓库设计方法概述

DW设计与DB设计

DW设计的三级数据模型

性能问题

数据仓库中的元数据

数据仓库设计的原则

在实际工程中的设计方法

数据驱动系统设计方法的基本思路

数据仓库设计步骤

概念模型设计

逻辑模型设计

物理模型设计

数据仓库生成

数据仓库的使用和维护

数仓—主题域&&数据域

数仓—建模方法论

数仓—维度表概念及设计案例

数仓建模—宽表的设计

数仓建模分层理论

数仓建模方法论

第二天

数据仓库建模设计方法-2

数据仓库架构、分层和建模

为什么要分层

数仓命名规范

表命名/脚本命名/表字段类型

范式理论

范式概念/函数依赖/三范式区分

关系建模与维度建模

关系建模/维度建模

维度表和事实表(重点)

维度表/事实表

维度模型分类

数据仓库建模(绝对重点)

ODS层/DIM层和DWD层/DWS层与DWT层/ADS层

第三天

开发体系规范和开发

HIVE数据仓库开发规范

HIVE-sql开发及优化

Spark-sql开发及优化

认证过程

无认证考试

开班信息

暂无开班信息