在线客服
扫描二维码
下载博学谷APP扫描二维码
关注博学谷微信公众号
对于零基础想要入门大数据的初学者来讲,需要学习的知识点很广泛也需要不停地深挖。为了帮助大家构建自己的大数据学习框架,本文以博学谷的课程为参考,为大家规划了一条详细的学习路线,总共是一个学习阶段。下面一起来看看这份最新的2020年大数据零基础学习路线规划吧!
阶段一 : Java基础
1、编程基础
DOS常用命令、Java概述、JDK环境安装配置、环境变量配置、Java程序入门
常量与变量、数据类型、运算符、流程控制语句、方法、数组
2、面向对象入门
面向对象思想、类与对象、成员变量和局部变量、封装、 this关键字、构造方法
Object类、Scanner类、Random类、String、StringBuilder类
集合概述、集合特点、ArrayList集合
字符输入流、字符输出流、字符缓冲输入流、字符缓冲输出流、 复制文件、集合与文件中数据相互读写
阶段二 : JavaWeb
1、Java基础增强
类加载器、反射、网络编程、端口和协议、TCP协议、服务端、客户端、多线程、线程和进程、线程的生命周期、线程安全、代码同步、注解、JDK常用注解、自定义注解
2、Java web 核心
HTML、CSS、JavaSript、BootStrap
MySQL数据库、MySQL单表操作、MySQL多表操作、MySQL事物、 MySQL存储引擎、JDBC、JDBCDataSource
Tomcat、Http协议、servlet入门、Rquest、Response、JSP、MVC、 Cookie、Session、JSP、ETLJSTL、Filter、listener
Jquery、Ajax、ajax跨域、分页
Maven项目构建、管理、编译、仓库配置、 Git项目管理
阶段三 : 主流框架
1、Spring 组件
Spring简介、Spring配置文件、Spring配置数据源 、Spring注解开发、AOP简介、AOP的实现方式、JdbcTemplate基本使用、Spring的事务控制
2、SpringMVC组件
Spring集成web开发环境、SpringMVC简介、SpringMVC组件解析、SpringMVC的数据响应、SpringMVC的请求参数绑定、SpringMVC的文件上传、SpringMVC的拦截器 、SpringMVC的异常处理
3、Mybatis组件
Mybatis快速入门、Mybatis基本增删改查操作、Mybatis核心配置文件、Mybatis的dao层实现原理、Mybatis映射文件深入-动态SQL、Mybatis核心配置文件深入、Mybatis的多表操作、Mybatis注解开发、SSM整合
阶段四 : 流行框架
1、Lucene组件
全文检索基本介绍、lucene入门案例中文分析器索引库维护
2、Spring Data JPA
JPA的引入、JPA的入门案例主键生成策略、JPA的基本操作
3、Spring Boot
spring boot 介绍、spring boot 入门、spring boot 原理分析、 spring boot 配置文件
阶段五 : 大数据基础增强
1、linux操作基础
虚拟机的联网以及基础命令增强、linux的查找命令、linux的用户与用户组、linux的权限管理、linux系统服务管理、网络管理 、shell的变量定义、变量引用、算数运算符、流程控制语句、函数使用
2、Jvm 优化
熟悉jvm 参数,visualVM 工具,垃圾回收原理, JVM字节码分析等等
阶段六 : 大数据Hadoop离线分布式系统
1、大数据基础和硬件介绍
大数据集群基本环境准备、大数据集群环境的基础准备
2、Hadoop 核心组件以及高级性能优化
HDFS组件详解以及实战、mapreduce 组件详解以及高级性能优化、Yarn组件详解以及多租户的实现、hive组件实战以及性能优化、impala组件实战以及性能优化sqoop常见问题详解
3、辅助系统工具
sqoop hue impala kudu oozie flume azkaban组件功能介绍、架构和原理、多个案例整合
4、网站流量日志分析项目
项目背景,日志埋点收集,数据预处理,数据入库,指标分析,统计分析,可视化
阶段七 : 大数据 NoSQL、Kafka和ELK技术实战
NoSQL、Kafka和ELK技术实战
NoSQL介绍、Redis的原理和架构、 Redis的集群搭建、Hbase的应用场景、Hbase架构和原理以及RowKey设计和优化策略、HBase+Redis微博实战案例、Elasticsearch的功能、架构和原理以及ELK案例实战
阶段八 : 大数据 Spark 内存计算系统
1、Scala语言基础
Scala基础、声明变量、数据类型、条件表达式、块表达式、循环、方法和函数、数组、元组、集合、Iterator、构造器、伴生对象、akka
2、Spark入门以及集群搭建
Spark集群环境搭建,spark入门程序,RDD入门
3、SparkRDD
Spark的应用场景、架构和原理、入门案例、Spark Session讲解、RDD的概念和特性、Transformation RDD讲解、Action RDD讲解、Partition、Task、RDD的依赖关系、RDD的容错机制、RDD的存储级别、RDD的缓存机制、RDD的广播操作、DAG思想、DAG的生成、DAG的处理过程、运行机制、Driver和Executor
4、Spark SQL
Spark SQL功能介绍、DataFrame、DataSet、RDD、Dataset和DataFrame的转换、读写Hive表数据、读写HDFS的数据、DataFrame的API操作、读取文件(txt、CSV、Json、parquet)、临时表、读写RDBMS、Spark SQL执行计划、Spark SQL的性能优化
5、SparkStreaming原理_运行过程_高级特性
sparkstring的功能介绍,架构,流计算Dstream运行原理
6、Structured Streaming_介绍_案例
Structured String的功能介绍、input功能、output功能、window操作、watermark操作、过期数据操作、去重数据操作、整合Socket数据、整合Kafka数据、OutputModel(Append\complete\update)功能、Flume+kafka+Structured Streaming实现用户访问行为的实时分析
7、DMP项目
Kudu应用场景,项目介绍, Kudu原理,cdh环境搭建,kudu整合spark开发,项目框架搭建,报表统计,商圈库功能。
阶段九 : 大数据 Flink 实时计算系统
1、Flink基础介绍
Flink的运行机制、Flink组件和逻辑计划、Flink执行计划生成、JobManager中的基本组件、TaskManager、算子、网络、水印WaterMark、任务调度
2、flink高级进阶
flink的状态管理、CheckPoint、flinksql及flinkTableApi
3、Flink电商指标分析项目
上报服务系统开发、Flink实时数据分析系统开发、实时频道热点分析业务开发、实时频道PV/UV分析、实时频道用户新鲜度分析、实时频道地域分析业务开发、实时运营商分析业务开发、实时数据同步系统、Canal数据采集平台
阶段十 : 大数据新技术实战详解
Druid
Druid应用场景、集群搭建、数据加载、重要概念、架构及原理、数据查询、元数据、实时应用案例
阶段十一 : 机器学习( 选修 )
1、机器学习概念入门
基本概念、数据的预处理、模型的评估
2、机器学习数学基础
初等数学基础、函数求导以及链式求导法则、方向导数、梯度、泰勒级数、 拉格朗日乘子法、线性代数与矩阵、特征值与特征向量、概率分析、 极大似然估计、梯度下降法代码实践、牛顿法代码实战、 矩阵分解实战(SVD,PCA,QR)
3、机器学习语言基础之Python语言
基础数据类型、list/tuple/dict/set、列表推导式、生成器推导式、 lambda函数、控制语句、文件读写、异常处理分析、面向对象编程、 GUI编程、Python基础项目实践
4、Python数据分析库实战
Numpy矩阵运算库基础及实战、Scipy数值运算库基础及实战、 Matplotlib绘图库基础及实战、Seaborn绘图库基础及实战、 Pandas数据分析库基础及实战
5、Spark机器学习库实战
SparkML和SparkMLLIB区别、Spark机器学习基础、Pipeline管道、 特征抽取(TF-IDF、Word2Vec、CountVectorizer)、特征转换(Tokenizer、 PCA、N-gram、DCT、one-hot、MinMaxScaler、Normalizer、SqlTransformer、VectorAssembler)、特征选择(VectorSlicer、RFormula、 ChiSqSelector)
6、机器学习算法之用户标签预测项目实战
用户画像标签预测实战、KNN、KMeans、决策树算法模型(ID3、C4.5、 Cart树)、集成学习算法(Bagging、随机森林、Adaboost算法、GBDT算法、 XGBOOST算法、LightGBM算法模型)、
7、人才流失模型项目实战
机器学习算法之推荐系统实战
基于记忆的CF实战(Surprise库实战)、基于模型的CF实战(SparkALS实战)、 基于Native-Bayes分类算法实战、基于内容推荐(jieba分词、提取词向量、 文本分类、特征聚类)、关联挖掘算法实战(基于Spark的FP-Growth算法实战)、推荐项目实战
8、机器学习算法之CTR点击率预估实战
特征工程实战、CTR点击率预估应用场景分析、 逻辑斯特回归算法理论基础推导及项目实战、推荐系统指标分析、 推荐系统架构分析、基于Wideanddeep模型理论及实战(学会读学术Paper)
9、机器学习算法之深度学习基础及图片分类实战
神经网络和深度学习基础、MP神经元模型、感知机模型、BPNN模型实战、 CNN模型实战图像识别、Tensorflow基础、电影评论文本分析、 RNN文本情感分析实战
阶段十二 : 云计算( 选修 )
1、虚拟化
hypervisor管理类工具、QEMU、KVM、QEMU-KVM、libvirt、虚拟化技术概述,Xen、VMware、KVM虚拟化对比与实践
2、公有云(阿里云)
公有云概述、阿里云应用实战
3、私有云运维(OpenStack)
Openstack概述,OpenStack组件功能介绍,OpenStack安装与配置,OpenStack私有云运维实战;
4、容器Docker+监控
Docker概述,Docker部署,Docker容器,Docker镜像仓库该学科热门课程
Kubernetes概述、Kubernetes安装与部署、Docker+Kubernetes集群实战
以上这份2020年大数据零基础学习路线规划,可以说基本涵盖了大数据最核心的技术,同时由浅入深,层层深入,十分适合初学者进行学习。如果大家对学习大数据有需求,不妨上博学谷体验一下相关的视频课程,相信可以让大家快速系统地熟悉大数据的应用场景、理解大数据技术原理、以及掌握大数据应用的技术方法。
— 申请免费试学名额 —
在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!
相关推荐 更多
在线大数据培训机构都会培训什么课程?
在线大数据培训机构都会培训什么课程?一般大数据培训课程内容氛分为七章:大数据基础增强、大数据 Hadoop 离线分布式系统、大数据 Storm 实时计算系统、大数据 Spark 内存计算系统、大数据 Spark 项目实战、机器学习等。职场转型零基础能学大数据开发吗?需要学习哪些大数据技术小编带你一起找答案。
10689
2019-04-10 00:08:24
重庆大数据培训机构靠谱吗?培训机构哪家好?
重庆大数据培训机构靠谱吗?培训机构哪家好?总体来说,IT培训机构无论是师资力量还是教学内容,都是北上广深这样的一线城市最好。那么,不是一线大城市难道就不能选择大数据培训机构吗?博学谷作为在线IT培训机构,就是为了广大学员能够平等享受到优质的IT教育而存在的。别说重庆这样的直辖市,哪怕是在五线小城市,都能学到大数据最新的课程内容。
5687
2019-08-27 13:24:35
大数据培训机构哪个好?零基础可以参加吗?
大数据培训机构哪个好?零基础可以参加吗?建议大家来知名在线教育平台博学谷,针对没有基础的学习者专门开设了0基础大数据在线就业班,大数据十大学习阶段,循序渐进,逐步深入。即使是零基础的学习者,也可以从大数据入门到精通最后直达就业。下面我们来一起看看课程详情。
6122
2019-09-24 11:04:35
零基础学大数据难吗?
零基础学大数据难吗?通过各大招聘平台我们可以看到,同样都是互联网技术岗位,大数据技术岗位的薪资普遍较高,不仅仅是因为目前布局大数据技术是各个企业的战略目标,同时也因为大数据技术有一定的难度,那对于零基础的同学能学会大数据技术吗?
5113
2020-08-24 14:31:50
Kafka的优势有哪些?经常应用在哪些场景?
Kafka的优势有哪些?经常应用在哪些场景?Kafka的优势比较多如多生产者无缝地支持多个生产者、多消费者、基于磁盘的数据存储、具有伸缩性、高性能轻松处理巨大的消息流。多用于开发消息系统,网站活动追踪、日志聚合、流处理等方面。今天我们一起来学习一下吧!
3222
2022-03-22 15:11:36