在线客服
扫描二维码
下载博学谷APP扫描二维码
关注博学谷微信公众号
一、网站
1. 网易公开课 https://open.163.com/
2. 腾讯课堂 https://ke.qq.com/
3. 中国大学慕课 https://www.icourse163.org/
4. B站 https://www.bilibili.com/
学习资源非常多,内容系统且全面,重点关注一些专业培训机构上传的学习视频,比如博学谷、黑马程序员上传了大量系统的教学视频。
5. Statista https://www.statista.com/
6. CEIC https://www.ceicdata.com/en
7. InfoQ-大数据https://www.infoq.cn/
二、书籍
1. 《为数据而生》
这是一部大数据在智慧城市、医疗、教育、金融、商业等领域的实践笔记;更是一部为未来大数据的发展提供有可行性的路径指南!
2. 《R语言预测实战》
R语言具有上手快、效率高的特点,它横跨金融、生物、医学、互联网等多个领域,主要用于统计、建模及可视化。预测是数据挖掘的主要作用之一,也是大数据时代的核心价值所在。
3. 《Hadoop权威指南》
本书是Hadoop权威参考,程序员可从中探索如何分析海量数据集,管理员可以从中了解如何安装与运行Hadoop集群。
4. 《Hive编程指南》
是一本ApacheHive的编程指南,旨在介绍如何使用Hive的SQL方法——HiveQL来汇总、查询和分析存储在Hadoop分布式文件系统上的大数据集合。《Hive编程指南》适合对大数据感兴趣的爱好者以及正在使用Hadoop系统的数据库管理员阅读使用。
5. Apache Kylin权威指南
本书从Apache Kylin的架构和设计,各个模块的使用,与第三方的整合,二次开发以及开源实践等各个方面进行讲解,为各位读者呈现核心的设计理念和哲学、算法和技术等。
6. 《Flink基础教程》
Flink是众多大数据处理框架中一颗冉冉升起的新星。它以同一种技术支持流处理和批处理,并能同时满足高吞吐、低延迟和容错的需求。本书由Flink项目核心成员执笔,系统阐释Flink的适用场景、设计理念、功能、用途和性能优势。
7. 《大数据之路:阿里巴巴大数据实践》
本书中讲到的大数据架构,就是为了满足不断变化的业务需求,同时实现的高度扩展性、灵活性以及数据展现的高性能而设计的。
三、公众号
1. 大数据技术与数仓
专注分享数据仓库与大数据技术(Flink/Hadoop/Spark/Hive)。
2. DataFunTalk
专注于大数据,人工智能技术应用的分享与交流。
3. 浪尖聊大数据
主要分享大数据框架,如Spark,flink, Kafka hbase 原理源码,同时会分享数据仓库, 图形计算等。
— 申请免费试学名额 —
在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!
相关推荐 更多
数据挖掘、数据分析以及大数据之间的区别有哪些?
进入大数据时代,和数据相关的名词都被人们津津乐道。那数据挖掘、数据分析以及大数据之间有哪些区别呢?数据挖掘是发现信息以及收集数据的过程;数据分析则是将现有数据进行归纳以及分析得出相应结论的过程。而大数据则更加关注数据本身,重要表现就是数据量大,数据的多样性等等。
13207
2019-06-20 18:11:53
大数据测试的发展和困境分析
随着大数据技术的日益深入发展,大数据测试应运而生。可以预见,大数据测试将成为软件测试工程师的发展目标之一。可能对于许多人来讲,大数据测试还是一个十分陌生的概念。实际上,大数据测试不同于传统的软件测试,在测试类型、策略和工具上,都有很大的不同。本文将为大家仔细分析一下大数据测试的发展和困境,下面我们一起来看看!
6569
2020-03-03 23:44:15
分布式系统学习笔记
分布式系统其实就是为了处理更多数据而存在的。对于大数据学习者来讲,分布式系统入门还是很容易的。本文为大家总结整理了一篇关于分布式系统的学习笔记,主要内容有分布式系统的定义、常用分布式方案以及分布式和集群的对比,下面一起来看看吧~
5143
2020-06-09 11:12:49
学习大数据要重点掌握哪些知识点
学习大数据要重点掌握哪些知识点?在大数据时代的背景下,掌握大数据技术为待就业人员提供了新的高薪就业途径。随着“互联网+”的政策支持下,越来越多的企业将大数据技术实现作为企业发展的战略目标。而对于求职者来说,想要从事大数据相应的岗位需要重点掌握哪些知识点呢?我们以零基础学习大数据的同学为主线为大家整理了这些必须掌握的大数据知识。
5185
2020-09-15 17:33:50
如何解决HBase海量数据高效入仓的问题?
如何解决HBase海量数据高效入仓的问题?数据仓库的数据来源于各方业务系统,高效准确的将业务系统的数据同步到数仓是数仓建设的根本。部分业务数据存储在HBase中,这部分数据体量较大达到数十亿。大数据需要增量同步这部分业务数据到数据仓库中进行离线分析,目前主要的同步方式是通过HBase的hive映射表来实现的。
2889
2022-03-10 13:46:02