8月3-4日成功为中国银联定制大数据平台搭建与高性能计算最佳实战培训

        8月3-5日再次成功为中国银联定制大数据平台搭建与高性能计算最佳实战培训。甫崎咨询一直是中国银联最为可靠的IT培训供应商。

       本次定制培训通过一个完整的大数据开发项目及一组实际项目训练案例,完全覆盖HadoopSpark生态系统平台的应用开发与运维实践。课堂实践项目以项目小组的形式进行沙盘实操练习,重点强化理解HadoopSpark大数据项目各个阶段的工作重点,同时掌握作为大数据项目管理者的基本技术与业务素养

      培训大纲如下: 

时间

知识模块

授课内容

第一天           上午

大数据技术基础

1. 大数据的产生背景与发展历程

2. 业界*新的大数据技术发展态势与应用趋势

业界主流的大数据技术方案

1. 大数据软硬件系统全栈与关键技术介绍

2. 主流的大数据解决方案介绍

3. 大数据解决方案与传统数据库方案比较

大数据存储系统与应用实践

1. 分布式文件系统HDFS产生背景与适用场景

2. HDFS master-slave系统架构与工作原理

3. HDFS核心组件技术讲解

4. HDFS高可用**机制

5. HDFS集群的安装、部署与配置,熟练HDFS shell命令操作

6. 分布式小文件存储系统的平台架构、核心技术与应用场景

7. 分布式对象存储系统的平台架构、核心技术与应用场景

第一天         下午

大数据计算模型(一)——批处理MapReduce

1. MapReduce产生背景与适用场景

2. MapReduce计算模型的基本原理

3. MapReduce作业执行流程

4. MapReduce基本组件,JobTrackerTaskTracker

5. MapReduce高级编程应用,CombinerPartitioner

6. MapReduce性能优化技巧

7. MapReduce案例分析与开发实践操作

Hadoop框架与生态发展,以及应用实践操作

1. Hadoop的发展历程

2. Hadoop大数据生态圈系统与工具全貌介绍

3. Hadoop 1.0的核心组件与适用范围

4. Hadoop 2.0的核心组件YARN工作原理,以及与Hadoop 1.0的区别

5. Hadoop资源管理与作业调度机制

6. Hadoop 常用性能优化技术

7. Hadoop集群安装与部署实践,以及MapReduce程序在YARN上执行

第二天         上午

大数据计算模型(二)——实时处理/内存计算 Spark

1. MapReduce计算模型的瓶颈

2. Spark产生动机、基本概念与适用场景

3. Spark编程模型与RDD弹性分布式数据集的工作原理与机制

4. Spark实时处理平台运行架构与核心组件

5. Spark容错机制、Spark作业调度机制、Scala开发介绍与实践

6. Spark集群部署与配置实践,Spark开发环境构建,Spark案例程序分析,Spark程序开发与运行,SparkHadoop集群集成实践

大数据仓库查询技术HiveSparkSQLImpala,以及应用实践

1. 基于MapReduce的大型分布式数据仓库Hive基础知识与应用场景

2. Hive数据仓库的平台架构与核心技术剖析

3. Hive metastore的工作机制与应用

4. Hive数据仓库实践:Hive集群安装部署,数据仓库表导入导出与分区操作,Hive SQL操作,Hive客户端操作

5. 基于Spark的大型分布式数据仓库SparkSQL基础知识与应用场景

6. Spark SQL实时数据仓库的实现原理与工作机制

7. SparkSQL应用分析与操作实践

8. 基于MPP的大型分布式数据仓库Impala基础知识与应用场景

9. Impala实时查询系统平台架构、关键技术剖析

第二天         下午

大数据计算模型(三)——流处理Storm, SparkStreaming

1. 流数据处理应用场景与流数据处理的特点

2. 流数据处理工具Spark Streaming基本概念与数据模型

3. Spark Streaming工作机制

大数据ETL操作工具,与大数据分布式采集系统

Kafka分布式消息订阅系统的应用介绍与平台架构,及其使用模式

面向OLTP型应用的NoSQL数据库及应用实践

1. 关系型数据库瓶颈,以及NoSQL数据库的发展,概念,分类,及其在半结构化和非结构化数据场景下的适用范围

2. 列存储NoSQL数据库HBase简介与数据模型剖析

3. HBase分布式集群系统架构与读写机制,ZooKeeper分布式协调服务系统的工作原理与应用

4. HBase分布式集群安装、部署与操作实践

5.键值型NoSQL数据库Redis简介与数据模型剖析

6.Redis多实例集群架构与关键技术

7.NewSQL数据库技术简介及其适用场景

大数据项目选型、实施、优化等问题交流讨论

大数据项目的需求分析、应用实施、系统优化,以及解决方案等咨询与交流讨论


    欢迎企事业单位来电咨询,咨询电话021-63530102吴老师