课程简介:
大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合,对大数据的分析已经成为一个非常重要且紧迫的需求。目前对大数据的分析工具,首选的是Hadoop/Yarn平台。Hadoop/Yarn在可伸缩性、健壮性、计算性能和成本上具有无可替代的优势。为解决广大系统设计人员深入研究与开发大数据技术的需要,解决广大系统设计人员深入研究与开发大数据技术的需要,培训中心特举办“大数据处理技术-基于Hadoop/Yarn的大数据技术实战”培训班。
培训要点:
Google发布的GFS和MapReduce等高可扩展、高性能的分布式大数据处理框架,证明了在处理海量网页数据时该框架的优越性。GFS/MapReduce框架实现了更高应用层次的抽象,使用户无需关注复杂的内部工作机制,无需具备丰富的分布式系统知识及开发经验,即可实现大规模分布式系统的部署与大数据的并行处理。Apache Hadoop开源项目开发团队,克隆了GFS/MapReduce框架,推出了Hadoop系统。该系统已受到学术界和工业界的广泛认可和采纳,并孵化出众多子项目(如Hive、Pig、HBase和Zookeeper等),日益形成一个易部署、易开发、功能齐全、性能优良的系统。
本课程从大数据技术以及Hadoop/Yarn实战的角度,结合理论和实践,全方位地介绍Hadoop/Yarn这一高性能处理大数据工具的开发技巧。本课程涉及的主题包括:Hadoop/Yarn分布式文件系统DFS;MapReduce的的工作机制、类型和格式;如何构建和管理Hadoop/Yarn集群;Pig Latin语言的使用技巧;Hive数据仓库工具介绍;HBase和Zookeeper工具的使用和管理;开源数据采集工具sqoop。
培训对象:
1、对IT系统设计有一定的理论与实践经验。
2、有一定的数据仓库与大数据处理的基础知识。
更多培训课程,学习资讯,课程优惠,课程开班,学校地址等学校信息,请进入北京中科院计算所培训中心网站详细了解,咨询电话:021-63301563,咨询QQ:
你也可以留下你的联系方式,让课程老师跟你详细解答:在线咨询
业界良好信誉
优秀专职教师队伍
成绩真实
名师规划
您感兴趣的课程有优惠啦 查看更多 >>