400-888-5228

课程介绍

目前Hadoop在很多企业应用越来越广泛,Hadoop人才也很稀缺和抢手,待遇也水涨船高。本系列课讲解目前主流的Hadoop版本Cloudera Hadoop 5(这里采用cdh5.1),该版本相比0.20.x,性能和稳定性上提高很多。CDH5环境搭建相比旧版本也复杂很多,但可以用Cloudera-Manager对集群进行管理和配置。CDH5默认集成了常用的所有组件如Hive、Sqoop、Hbase、Hue、Pig、Flume、Spark、Zookeeper等,从而形成一功能强大的分布式平台。

本课会分享一些本人所在团队研究的适用于企业级开发和应用的框架和工具,这些有效提高了开发效率,大大降低了维护成本,这些正是我们多年实战的结晶。

培训天数:

3天

培训对象:

  • 计算机相关专业本科以上学历或有一年以上软件开发经验的人员。
  • 有一定的英语基础,能阅读简单的英文文档。
  • 学习能力强,渴望从事云计算行业.
  • 拥有Linux 基本相关知识
  • 拥有SQL数据库相关知识
  • 具备Java开发技能(最佳)
  • 熟练使用一门编程语言:如C++,Java(最好是Java)
  • 对计算机基础有一定了解:如网络、数据结构、数据库等.

课程目标

  • Cloudera Hadoop 安装配置
  • Hadoop基本原理和理论知识
  • Cloudera Manager 管理监控维护
  • Hbase 基本使用方法以及实际项目中如何应用

预备知识

  • 拥有Linux 基本相关知识
  • 拥有SQL数据库相关知识
  • 具备Java开发技能(最佳)

适合对象

  • 具有Linux 和数据库操作技能,对Hadoop大数据处理感兴趣的IT人
  • 计算机相关专业本科以上学历或有一年以上软件开发经验的人员。
  • 有一定的英语基础,能阅读简单的英文文档。
  • 学习能力强,渴望从事云计算行业.
  • 拥有Linux 基本相关知识
  • 拥有SQL数据库相关知识
  • 具备Java开发技能(最佳)
  • 熟练使用一门编程语言:如C++,Java(最好是Java)
  • 对计算机基础有一定了解:如网络、数据结构、数据库等.

课程内容

第一天:Hadoop安装配置

  • Hadoop背景历史发展
  • Hadoop基本原理和架构
  • Cloudera Manager 介绍安装
  • 1介绍
  • 1安装
  • CDH组件安装配置
  • Cloudera Management Service介绍安装
  • 安装CM
  • Hadoop监控组件介绍
  • 如何监控Hadoop
  • 如何配置报警以及报警阀值

第二天 Hive,Impala实战解析

  • Hive,Impala原理安装
  • Hive原理
  • Hive安装
  • Impala原理
  • Impala安装
  • Hive元数据管理
  • Hive数据表和数据存储
  • Hive的Java扩展开发
  • Hive UDF开发
  • Hive JDBC/ODBC连接
  • Hive适用场景和实战演练

第三天 Hbase 实战解析

  • Hbase介绍及原理
  • Hbase系统架构
  • Hbase存储机制
  • Hbase基本使用
  • Hbase表设计思路和方案
  • 利用Hive,Impala实现Hbase数据查询
  • API访问
  • Hbase业务使用场景