在线客服
扫描二维码
下载博学谷APP扫描二维码
关注博学谷微信公众号
一、网站
1. 网易公开课 https://open.163.com/
2. 腾讯课堂 https://ke.qq.com/
3. 中国大学慕课 https://www.icourse163.org/
4. B站 https://www.bilibili.com/
学习资源非常多,内容系统且全面,重点关注一些专业培训机构上传的学习视频,比如博学谷、黑马程序员上传了大量系统的教学视频。
5. Statista https://www.statista.com/
6. CEIC https://www.ceicdata.com/en
7. InfoQ-大数据https://www.infoq.cn/
二、书籍
1. 《为数据而生》
这是一部大数据在智慧城市、医疗、教育、金融、商业等领域的实践笔记;更是一部为未来大数据的发展提供有可行性的路径指南!
2. 《R语言预测实战》
R语言具有上手快、效率高的特点,它横跨金融、生物、医学、互联网等多个领域,主要用于统计、建模及可视化。预测是数据挖掘的主要作用之一,也是大数据时代的核心价值所在。
3. 《Hadoop权威指南》
本书是Hadoop权威参考,程序员可从中探索如何分析海量数据集,管理员可以从中了解如何安装与运行Hadoop集群。
4. 《Hive编程指南》
是一本ApacheHive的编程指南,旨在介绍如何使用Hive的SQL方法——HiveQL来汇总、查询和分析存储在Hadoop分布式文件系统上的大数据集合。《Hive编程指南》适合对大数据感兴趣的爱好者以及正在使用Hadoop系统的数据库管理员阅读使用。
5. Apache Kylin权威指南
本书从Apache Kylin的架构和设计,各个模块的使用,与第三方的整合,二次开发以及开源实践等各个方面进行讲解,为各位读者呈现核心的设计理念和哲学、算法和技术等。
6. 《Flink基础教程》
Flink是众多大数据处理框架中一颗冉冉升起的新星。它以同一种技术支持流处理和批处理,并能同时满足高吞吐、低延迟和容错的需求。本书由Flink项目核心成员执笔,系统阐释Flink的适用场景、设计理念、功能、用途和性能优势。
7. 《大数据之路:阿里巴巴大数据实践》
本书中讲到的大数据架构,就是为了满足不断变化的业务需求,同时实现的高度扩展性、灵活性以及数据展现的高性能而设计的。
三、公众号
1. 大数据技术与数仓
专注分享数据仓库与大数据技术(Flink/Hadoop/Spark/Hive)。
2. DataFunTalk
专注于大数据,人工智能技术应用的分享与交流。
3. 浪尖聊大数据
主要分享大数据框架,如Spark,flink, Kafka hbase 原理源码,同时会分享数据仓库, 图形计算等。
— 申请免费试学名额 —
在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!
相关推荐 更多
怎样学习spark
现在一提到云计算大数据,就会想到spark。要怎样学习spark呢?首先我们需要简单了解一下它:Spark 是一种与 Hadoop 相似的开源集群计算环境,甚至在某些工作负载方面表现得更加优越。Spark采用一个统一的技术堆栈解决了云计算大数据的如流处理、图技术、机器学习、NoSQL查询等方面的所有核心问题,具有非常完善的生态系统,这直接奠定了其一统云计算大数据领域的霸主地位;
6822
2019-08-06 10:20:49
大数据Hadoop中HDFS 存储的机制?
HDFS即Hadoop分布式文件系统。它是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。那大数据中HDFS 存储的机制怎样的呢?
11233
2019-08-14 10:19:54
云计算和人工智能的两大误区是什么
云计算和人工智能的两大误区是什么?云计算和人工智能两大误区:云支出正在使数据中心支出大打折扣;人工智能过度炒作在很大程度上使企业购买者失败。过早采用人工智能可能会很有趣,但同时存在着诸多问题。
4649
2020-02-12 18:17:43
如何解决HBase海量数据高效入仓的问题?
如何解决HBase海量数据高效入仓的问题?数据仓库的数据来源于各方业务系统,高效准确的将业务系统的数据同步到数仓是数仓建设的根本。部分业务数据存储在HBase中,这部分数据体量较大达到数十亿。大数据需要增量同步这部分业务数据到数据仓库中进行离线分析,目前主要的同步方式是通过HBase的hive映射表来实现的。
2812
2022-03-10 13:46:02
缓存是什么?为什么要使用缓存?
缓存是什么?为什么要使用缓存?缓存是将一些需要读取数据放在磁盘或者内存中,在读取数据的时候,一般是从关系型数据库中读取数据,缓存时能够最快提高服务响应速度的优化。
6116
2022-04-07 15:07:05