课程介绍
数据仓库是一个面向主题的、集成的、随时间变化的、但信息本身相对稳定的数据集合,用于对管理决策过程的支持。
培训对象
学员需具备:
至少熟悉掌握一种关系型数据库使用;
开发工程、运维工程师、测试工程师。
课程收益
数据仓库就是整合多个数据源的历史数据进行细粒度的、多维的分析,帮助高层管理者或者业务分析人员做出商业战略决策或商业报表。
知识概要
-- 数据仓库建模设计方法;
-- 开发体系规范和开发。
课程大纲
数据仓库建模设计方法-1
为什么需要模型
模型的组织结构
模型实施方法
模型设计策略
数据仓库设计方法概述
DW设计与DB设计
DW设计的三级数据模型
性能问题
数据仓库中的元数据
数据仓库设计的原则
在实际工程中的设计方法
数据驱动系统设计方法的基本思路
数据仓库设计步骤
概念模型设计
逻辑模型设计
物理模型设计
数据仓库生成
数据仓库的使用和维护
数仓—主题域&&数据域
数仓—建模方法论
数仓—维度表概念及设计案例
数仓建模—宽表的设计
数仓建模分层理论
数仓建模方法论
数据仓库建模设计方法-2
数据仓库架构、分层和建模
为什么要分层
数仓命名规范
表命名/脚本命名/表字段类型
范式理论
范式概念/函数依赖/三范式区分
关系建模与维度建模
关系建模/维度建模
维度表和事实表(重点)
维度表/事实表
维度模型分类
数据仓库建模(绝对重点)
ODS层/DIM层和DWD层/DWS层与DWT层/ADS层
开发体系规范和开发
HIVE数据仓库开发规范
HIVE-sql开发及优化
Spark-sql开发及优化
认证过程
无认证考试
开班信息
暂无开班信息