大数据Spark经典案例分析与介绍
通过spark实现经典案例:网站url统计,topn热门,共同好友,spark自定义排序,倒排索引,解析json数据
主讲:黑马大数据讲师 | 课程时长:5课时 | 难度: 提高
该课程已下架,请查看其它课程
在线客服
扫描二维码
下载博学谷APP
扫描二维码
关注博学谷微信公众号
意见反馈
多年JavaEE开发及编码经验,曾主导多个项目开发,熟悉SpringMVC、MyBatis、Spring等JavaWeb技术,具有多年大数据开发经验,对大数据领域中的常用框架hadoop、hive、flume、kafka、storm、spark等有丰富的实战经验和研究。授课风格严谨,课堂气氛活跃。
猜你还感兴趣
大数据hadoop入门教程
大数据学科入门教程,从Hadoop概念、Hadoop基本使用、运行原理、到实战案例等方面进行讲解,帮助学员了解hadoop、学习Hadoop集群中的文件存储功能分布式编程框架,了解离线大数据处理的基本流程。
用户行为分析类产品架构解密
如今,国内互联网网民数、移动用户数饱和,人口红利消失,从增量市场进入存量市场。增量乏力,存量市场竞争更加激烈。因此各大互联网公司纷纷把目光由结果数据分析转移到过程数据分析(用户行为数据),本课旨在解密用户行为分析类产品背后的原理和架构,顺带灌输一下精细化运营的思想,供大家参考。
Hive视频教程
针对有一定大数据基础的学员,深入讲解如何进行数据分析,加深数据仓库的理解,使用Hive部署。帮助学员在hive上建立企业自己的数据数仓平台,针对企业自己的业务实现自己的UDF函数。
基于Kylin搞定电信数据分析
本课程讲解Kylin原理、架构、Kylin全链路性能优化、Cube增量构建、Kylin 3.0实时构建新特性等,最后又通过一个电信数据多维分析项目讲解了Kylin在实际业务的运用,让你对Kylin的体系结构及运行原理有一个清晰认知的同时,能够轻松解决工作中遇到的实时,建立全套实时数据仓应用解决方案。
大数据前置技能提升课
入行或转型大数据必备技能
kylin-优化
Apache kylin根据用户数据模型和查询模式对数据预计算,并在查询时直接利用预计算结果,从而指数倍提高分析性能。但是随着数据增长,预计算时间不断延长,预计算数据急剧膨胀导致存储压力成倍增加,最终反而导致分析性能下降。本公开课旨在带大家分析性能优化思路,并梳理优化技巧
云计算大数据Zookeeper教程
Zookeeper作为大数据一个重要组件,有一定大数据基础的学员学完可以在以后的大数据学习中奠定扎实的基础。帮学生了解zookeeper的选举机制和zookeeper的基本操作。