文章

黑马hadoop初中高加项目培训视频教程

课程介绍

大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。

在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据进行分析处理。大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)、Veracity(真实性)。

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。

Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。

Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。

课程下载

下载地址:http://www.mukedaba.com/thread-2110-1-1.html

课程目录

云计算开发基础

1、什么是云
2、appengin
3、hadoop简介
4、安装cygwin
5、安装hadoop、配置hadoop的运行环境
6、查看hadoop的文件系统
7、hadoop命令执行、eclipse代码

初级班

初级班-1-linux使用
初级班-2-伪分布模式安装hadoop
初级班-3-HDFS的体系结构和操作
初级班-4-HDFS的java操作方式

中级班

中级班-1-MapReduce入门
中级班-2-MapReduce的源码简介和自定义类型
中级班-3-mapReduce的剩余核心环节讲解
中级班-4-MapReduce的自定义排序和分组
中级班-5-hadoop的集群安装和安全模式介绍

高级班

高级班-1-ZooKeeper的集群安装与操作
高级班-2-HBase基础知识
高级班-3-PIG基础知识
高级班-4-HIVE基础知识
高级班-5-SQOOP基础知识
高级班-6-Flume原理和使用

项目实战

项目实战-1.项目描述
项目实战-2.shell编程
项目实战-3.数据导入和清洗
项目实战-4.数据统计分析

hadoop2

1.体系结构、源码编译
2.HDFS部署安装
3.Yarn

包含超人学院的部分视频

0 0

发表评论