在线客服
扫描二维码
下载博学谷APP扫描二维码
关注博学谷微信公众号
大数据零基础入门书籍推荐,如果你选择的大数据方向不同小编推荐的书籍也不同,下面主要介绍大数据工程师、数据分析师、数据挖掘工程师就业方向的大数据零基础入门书籍,如果你还没确定选什么方向,小编推荐黑马程序员初版的《Hadoop大数据技术原理与应用》比较适合初学者学习。
一、大数据工程师入门书籍:
在互联网公司广泛招聘偏平台业务方向,ETL和OLTP等,主要是基于Hadoop技术栈来处理大数据,算法要求不是特别高。
经典图书推荐:《Hadoop权威指南》《Hive编程指南》《Hbase权威指南》《大数据技术全解》、《大数据挑战NoSql》《Mahout实战》
二、数据分析师入门书籍:
在拥有行业数据的电商、金融、电信、咨询等行业里做业务咨询,商务智能,出分析报告,互联网公司的产品经理差不多类型了,统计学能力要求高,SPSS、SAS、R、SQL。
经典图书推荐:《概率论与数理统计》、《统计学》推荐David Freedman版、《业务建模与数据挖掘》、《数据挖掘导论》、《SAS编程与数据挖掘商业案例》、《Clementine数据挖掘方法及应用 》、《IBM SPSS Statistics 19 Statistical Procedures Companion》等。
三、数据挖掘工程师入门书籍:
在互联网、电商、搜索、社交等大数据相关行业里做机器学习算法实现和分析,基本数据结构算法、机器学习等都要求较高。Hadoop、spark技术栈,Java、Python、C++、Scala、Shell。
经典图书推荐:《数据挖掘概念与技术》、《数据挖掘导论》、《数据挖掘-实用机器学习技术》;《机器学习》Tom Michael 、《机器学习导论》、周志华《机器学习》、《机器学习实战》、《集体智慧编程》、《统计学习方法》ESL 《Elements of Statistical Learning》 ISL 《An Introduction to Statistical Learning》PRML 《Pattern Recognition and Machine Learning》《数据库系统概论》、《算法导论》、《Web数据挖掘》、《推荐系统》、《数据可视化》《Thinking in Java》、《Python核心编程》、《Thinking in C++》等。
四、大数据零基础入门书:
《Hadoop大数据技术原理与应用》这本书围绕Hadoop生态圈相关系统介绍大数据处理架构Hadoop。全书共11章节,其中,第1-2章主要带领大家认识Hadoop以及学会搭建Hadoop集群。第3-5章讲解了分布式文件系统HDFS、分布式计算框架MapReduce以及分布式协调服务。第6章讲解的是Hadoop2新特性,包含YARN和高可用特性。第7-10章主要讲解Hadoop生态圈的相关辅助系统,包括Hive、Flume、Azkaban和Sqoop。第11章是一个综合项目——网站流量日志数据分析系统,其目的是教会大家如何利用Hadoop生态圈技术构建大数据系统架构并进行开发,同时加深Hadoop技术的理解。
本书可作为高等院校本、专科计算机相关专业、信息管理等相关专业的大数据课程教材,也可供相关技术人员参考,是一本适合广大计算机编程爱好者的优秀读物。
— 申请免费试学名额 —
在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!
相关推荐 更多
大数据Hbase面试题汇总
在大数据中,我们总会碰到Hbase数据库。尤其对于即将要面试大数据的小伙伴来说,Hbase数据库更是绕不过去的一个重要考点,因此小编汇总了近些年来比较常见且经典的大数据Hbase面试题,希望可以帮到大家。
8080
2019-08-20 18:49:37
什么是数据科学异常值检测原理?
什么是数据科学异常值检测原理?异常值的检测方法有基于统计的方法,基于聚类的方法,以及一些专门检测异常值的方法等。使用pandas,可以直接使用describe()来观察数据的统计性描述,或者简单使用散点图也能很清晰的观察到异常值的存在。
7126
2020-03-20 16:21:07
Hadoop集群搭建过程总结
本文主要总结了Hadoop集群搭建的过程,内容包括发行版本说明、Hadoop集群简介、服务器准备、网络环境准备、服务器系统设置以及JDK 环境安装。有学习需要的小伙伴一起来看看吧~
6361
2020-06-18 15:32:40
数据分析师获取数据的方式有哪些?
数据分析师工作的第一步就是获取数据,也就是数据采集。获取数据的方式有很多,本文将着重介绍一下数据分析中的数据来源。一般来讲,数据来源主要分为两大类,企业外部来源和内部来源。其中外部来源包括外部购买、网络爬取、免费开源数据等,内部数据来源包括销售数据、考勤数据、财务数据等。
6563
2020-08-07 18:19:53
Sequence File格式是什么?如何使用?
Hadoop可以存储多种文件格式。sequenceFile文件是Hadoop用来存储二进制形式的[Key,Value]对而设计的一种平面文件(Flat File)。可以把SequenceFile当做是一个容器,把所有的文件打包到SequenceFile类中可以高效的对小文件进行存储和处理。
5437
2021-03-16 13:59:21