课程简介:
随着互联网、移动互联网和物联网的发展,我们已经切实地迎来了一个大数据的时代。如何对海量数据进行挖掘和分析,已经成为一个非常重要且紧迫的需求。
R是一个用于统计计算和统计制图的优秀工具,也是GNU的一个自由、免费、源代码开放的软件。R包括一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统,数组运算工具(其向量、矩阵运算方面功能尤其强大),完整连贯的统计分析工具,优秀的统计制图功能。
Python是一个数据分析和图形显示的程序设计环境,用于统计分析、绘图的语言和操作环境。Python有简便而强大的编程语言:可操纵数据的输入和输入,可实现分支、循环,用户可自定义功能。
本培训将对基于Python和R语言进行数据处理、数据探索的基本方法,利用R语言实现模型选择、Logistic回归及决策树算法,以及贝叶斯算法及支持向量机、神经网络等算法原理及实现进行讲解。
培训内容:
第一讲 数据挖掘,Python和R简介
第二讲 数据的导入与导出
第三讲 数据可视化展现
第四讲 决策树与随机森林
第五讲 回归分析
第六讲 聚类分析
第七讲 离群点检测
第八讲 时间序列分析
第九讲 关联规则
第十讲 社交网络分析
培训对象:
1、对IT系统设计有一定的理论与实践经验。
2、对数据挖掘和数据处理方法有一定的基础知识。
3、对Hadoop/Spark等大数据技术有一定的了解。
更多培训课程,学习资讯,课程优惠,课程开班,学校地址等学校信息,请进入北京中科院计算所培训中心网站详细了解,咨询电话:021-63301563,咨询QQ:
你也可以留下你的联系方式,让课程老师跟你详细解答:在线咨询
业界良好信誉
优秀专职教师队伍
成绩真实
名师规划
您感兴趣的课程有优惠啦 查看更多 >>