欢迎来到好培训网!
北京
切换城市
课程分类
    基于Python的Spark大数据挖掘技术培训(北京,6月1
    2018-04-16发布, 次浏览 收藏 置顶 举报
基于Python的Spark大数据挖掘技术培训(北京,6月1
  • 区域:
  • 上课班制:白天班
  • 课程类型:普通课程
  • 授课时间:2018年6月12-14日
  • 授课对象:1,对大数据的前沿技术非常感兴趣的人。
  • 网报价格:¥5800    课程原价:¥5800
  • 咨询热线:010-561****8 点击查看完整号码
  • 课程详情
  • 机构简介
  • 地图信息
  • 网上报名

课程关键词:大数据挖掘

基于Python的Spark大数据挖掘技术培训北京,6月12-14日)
【举办单位】北京曼顿培训网  ***mdpxb***   中国培训资讯网  ***e71edu***
咨询电话】4006820825   010-56133998  13810210257
培训日期】2018年6月12-14日
培训地点】北京
培训对象】
1,对大数据的前沿技术非常感兴趣的人。
2,有志于成为一名数据科学家的从业人员。
3,有一定算法和编程基础的技术爱好者。

【课程背景】
Python是数据分析最常用的语言之一,而Apache Spark是一个开源的强大的分布式查询和处理引擎。本培训用详尽的案例介绍如何使用Python来调用Spark的新特性,如何处理结构化和非结构化的数据,如何使用PySpark中一些基本的可用数据类型,如何生成机器学习模型、操作图像、阅读串流数据以及在云上部署模型。
培训结合实例来介绍PySpark大数据挖掘。内容包括对Apache Spark基础知识介绍,弹性分布式数据集RDD的内部运行方式讲解,分析利用DataFrame加速PySpark,准备数据建模,检查重复数据及异常数据,分析描述性统计、数据相关性,介绍MLlib数据挖掘工具应用,讲解ML机器学习包功能,使用Blaze实现持久化,讲解Tensorflow基础,分析结构化流Streaming,以及打包Spark应用程序,提交作业和监控执行等。
培训将合实例,对Python和Spark进行讲解,通过实际操作,了解云环境下,大数据处理、数据探索的基本方法。

【学员基础】
1,对IT系统设计有一定的理论与实践经验。
2,对数据挖掘和数据处理方法有一定的基础知识。
3,对Hadoop/Spark等大数据技术有一定的了解。

培训目标】
1, 学习Python和Spark的相关基础知识。
2,学习Python和Spark的核心技术方法及应用。
3,了解Python和Spark在数据分析中的使用。

【课程大纲】
第一讲 Spark基础知识
1)什么是Apache Spark
2)Spark作业和API
3)DataFrame和Dataset
4)Spark 2.0的架构
5)SparkSession介绍
6)Tungsten Phase 2
7)结构化流
第二讲 弹性分布式数据集
1)RDD的内部运行方式
2)创建RDD
3)全局作用域和局部作用域
4)RDD转换
5)RDD操作
第三讲 利用DataFrame加速PySpark
1)Python到RDD之间的通信
2)Catalyst优化器刷新
3)创建DataFrame
4)RDD的交互操作
5)利用DataFrame API查询
6)利用SQL查询
7)DataFrame应用实例
第四讲 准备数据建模
1)检查重复数据及异常数据
2)描述性统计
3)数据相关性
4)数据可视化
5)直方图
第五讲 MLlib数据挖掘工具
1)MLlib包概述
2)加载和转换数据
3)数据相关性和描述性统计
4)创建最终数据集
5)MLlib应用实例-预测婴儿生存机会
第六讲 ML机器学习包
1)ML包的概述
2)分类、回归和聚类
3)使用ML预测婴儿生存率
4)ML超参调优
5)ML的特征提取
6)ML的其他功能
第七讲 使用Blaze实现持久化
1)安装Blaze
2)混合持久化
3)使用NumPy和pandas数据
4)与关系型数据库进行交互
5)数据操作和访问
6)数据连接
第八讲 Tensorflow基础
1)神经网络和深度学习
2)TensorFlow介绍和安装
3)配置和设置TensorFlow
4)使用TensorFlow进行矩阵分析
5)TensorFlow操作示例
第九讲 结构化流Streaming
1)Streaming介绍
2)Streaming的基本组件
3)Streaming应用程序数据流
4)用DStream简化Streaming应用程序
5)全局聚合
6)结构化流介绍
第十讲 打包Spark应用程序
1)spark-submit命令
2)以编程方式部署应用程序
3)配置你的SparkSession
4)创建SparkSession
5)模块化代码
6)提交作业和监控执行

【讲师介绍】
杨老师,曼顿培训网(***mdpxb***)资深讲师。主要研究网络信息分析以及云计算相关技术,长期从事通信网管系统、网络信息处理、商务智能(BI)以及电信决策支持系统的研究开发工作,主持和参与了多个国家和省部级基金项目,具有丰富的工程实践及软件研发经验。

【费用及报名】
1、费用:培训费5800元(含培训费、讲义费);如需食宿,会务组可统一安排,费用自理。
2、报名咨询:4006820825  010-56133998  56028090  13810210257   鲍老师
3、报名流程:电话登记-->填写报名表-->发出培训确认函
4、备注:如课程已过期,请访问我们的网站,查询最新课程
5、详细资料请访问北京曼顿培训网:***mdpxb*** (每月在全国开设四百多门公开课,欢迎报名学习)



联系我时请说明是在好培训网看到的,谢谢!

北京曼顿企业管理咨询有限公司(以下简称北京曼顿咨询)成立于2005年,旗下网站为曼顿培训网,是国内较早一批专业的综合性的培训单位之一。是总部位于美国的国际职业认证标准联合会在北京地区授权的培训考试及认证单位[认证号:IOCL086132],同时也是香港培训认证中心授权的培训认证机构[认证号:HKTCC(GZ)A10-11221]。本单位主要从事企业管理、项目管理、市场营销和人力资源管理方面的咨询培训服务。历经多年的发展,已经为近千家企业提供过各种形式的咨询培训服务,客户涵盖了电子电器、通讯、计算机IT行业、金融保险、建材、化工、食品、机械、服装/鞋业、礼品包装、塑胶五金/模具、电线电缆等十几个行业领域,在业界具有广泛的权威和影响力。本单位师资由资深顾问以及业界知名专家组成,顾问师2/3为硕士研究(MBA)以上学历。我们的专家团队基本都来自于财富500企业,具有丰富的实战经验和系统全面的理论知识。

曼顿培训网,是北京曼顿企业管理咨询有限公司(以下简称北京曼顿咨询)旗下网站。是总部位于美国的国际职业认证标准联合会在北京地区授权的培训考试及认证单位[认证号:IOCL086132],同时也是香港培训认证中心授权的培训认证机构[认证号:HKTCC(GZ)A10-11221]。本单位主要从事企业管理、项目管理、市场营销和和人力资源管理方面的咨询培训服务。历经多年的发展,已经为近千家企业提供过各种形式的咨询培训服务,客户涵盖了电子电器、通讯、计算机IT行业、金融保险、建材、化工、食品、机械、服装/鞋业、礼品包装、塑胶五金/模具、电线电缆等十几个行业领域,在业界具有广泛的权威和影响力。本单位师资由资深顾以及业界知名专家组成,顾问师2/3为硕士研究(MBA)以上学历。我们的专家团队基本都来自于财富500企业,具有丰富的实战经验和系统全面的理论知识。


公开课方面,北京曼顿咨询每年在上海、天津、北京、广州、深圳、杭州、苏州、宁波、南京、青岛、合肥、武汉、长沙等城市定期举办公开课程,每年有上千期公开课程成功举办,学员来自各行各业,遍布全国各区域。每年在国内的公开课数量在同类公司中也高居前列,为企业、职业经理人以及爱学习人士提供了有力的培训信息保障。
企业内训方面,自成立以来,一直致力于开发适合中国企业的运营管理实务内训课程,我们已开展了数百场的内训课程。
通过多年的探索与实践,我们的内训课程更加体现个性化需求,内训解决方案更科学合理,具有极强实战性与可操作性。
本公司已为世界500强企业中的120多家企业提供过内训实施及信息服务,典型客户包括工商分行、东风雪铁龙、可口可乐、
本田、上汽、3M、三洋、中石油、中石化、西门子、波音、大众汽车、通用汽车等,满意度高达95%以上。
我们的企业文化:
愿    景:成为倍受社会尊重的专业管理咨询培训机构
使    命:培养经世致用的人才,提升个人与组织的能力
行为准则:严谨   务实    高效
公司地址:北京市丰台区文体路23号世纪商务写字楼

联系电话:010-56028090
公开课方面,北京曼顿咨询每年在上海、天津、北京、广州、深圳、杭州、苏州、宁波、南京、青岛、合肥、武汉、长沙等城市定期举办公开课程,每年有上千期公开课程成功举办,学员来自各行各业,遍布全国各区域。每年在国内的公开课数量在同类公司中也高居前列,为企业、职业经理人以及爱学习人士提供了有力的培训信息保障。

培训机构档案

    未上传身份证认证 未上传身份证认证

    未上传办学许可认证 未上传办学许可认证

© 好培训网 赣ICP备16010775号-2