在线客服
扫描二维码
下载博学谷APP扫描二维码
关注博学谷微信公众号
机器学习有哪些算法?本文将为大家盘点十大经典机器学习算法,其中包括了支持向量机、人工神经网络、逻辑回归、朴素贝叶斯、决策树、K- 均值、K- 最近邻算法、随机森林、线性回归和降维。当然盘点的目的,并不是要把这些机器学习算法进行一个排名对比,毕竟算法之间并没有优劣之分,每个算法都有自己的使用的场景。下面我们就来具体分析一下机器学习的十大算法。
1、支持向量机
支持向量机是一种用于分类问题的监督算法。支持向量机试图在数据点之间绘制两条线,它们之间的边距最大。为此,我们将数据项绘制为n维空间中的点,其中,n是输入特征的数量。在此基础上,支持向量机找到一个最优边界,称为超平面(Hyperplane),它通过类标签将可能的输出进行最佳分离。超平面与最近的类点之间的距离称为边距。最优超平面具有最大的边界,可以对点进行分类,从而使最近的数据点与这两个类之间的距离最大化。
2、人工神经网络
人工神经网络可以处理大型复杂的机器学习任务。神经网络本质上是一组带有权值的边和节点组成的相互连接的层,称为神经元。在输入层和输出层之间,我们可以插入多个隐藏层。人工神经网络使用了两个隐藏层。除此之外,还需要处理深度学习。人工神经网络的工作原理与大脑的结构类似。一组神经元被赋予一个随机权重,以确定神经元如何处理输入数据。通过对输入数据训练神经网络来学习输入和输出之间的关系。在训练阶段,系统可以访问正确的答案。如果网络不能准确识别输入,系统就会调整权重。经过充分的训练后,它将始终如一地识别出正确的模式。
3、逻辑回归
逻辑回归与线性回归类似,但它是用于输出为二进制的情况(即,当结果只能有两个可能的值)。对最终输出的预测是一个非线性的S型函数,称为 logistic function, g()。这个逻辑函数将中间结果值映射到结果变量 Y,其值范围从0到1。然后,这些值可以解释为 Y 出现的概率。S型逻辑函数的性质使得逻辑回归更适合用于分类任务。
4、朴素贝叶斯
朴素贝叶斯是基于贝叶斯定理,应用最为广泛的分类算法之一。对于给定的训练数据集,首先基于特征条件独立假设学习输入/输出的联合概率分布;然后基于此模型,对给定的输入 xx ,利用贝叶斯定理求出后验概率最大的输出 yy 。
5、决策树
决策树可用于回归和分类任务。在这一算法中,训练模型通过学习树表示(Tree representation)的决策规则来学习预测目标变量的值。树是由具有相应属性的节点组成的。在每个节点上,我们根据可用的特征询问有关数据的问题。左右分支代表可能的答案。最终节点(即叶节点)对应于一个预测值。每个特征的重要性是通过自顶向下方法确定的。节点越高,其属性就越重要。
6、K- 均值
K- 均值(K-means)是通过对数据集进行分类来聚类的。例如,这个算法可用于根据购买历史将用户分组。它在数据集中找到 K 个聚类。K- 均值用于无监督学习,因此,我们只需使用训练数据 X,以及我们想要识别的聚类数量 K。该算法根据每个数据点的特征,将每个数据点迭代地分配给 K 个组中的一个组。它为每个 K- 聚类(称为质心)选择 K 个点。基于相似度,将新的数据点添加到具有最近质心的聚类中。这个过程一直持续到质心停止变化为止。
7、K- 最近邻算法
K- 最近邻算法(K-Nearest Neighbors,KNN)非常简单。KNN 通过在整个训练集中搜索 K 个最相似的实例,即 K 个邻居,并为所有这些 K 个实例分配一个公共输出变量,来对对象进行分类。K 的选择很关键:较小的值可能会得到大量的噪声和不准确的结果,而较大的值是不可行的。它最常用于分类,但也适用于回归问题。用于评估实例之间相似性的距离可以是欧几里得距离、曼哈顿距离或明氏距离。欧几里得距离是两点之间的普通直线距离。它实际上是点坐标之差平方和的平方根。
8、随机森林
随机森林(Random Forest)是一种非常流行的集成机器学习算法。这个算法的基本思想是,许多人的意见要比个人的意见更准确。在随机森林中,我们使用决策树集成。为了对新对象进行分类,我们从每个决策树中进行投票,并结合结果,然后根据多数投票做出最终决定。
9、线性回归
线性回归算得上是最流行的机器学习算法,它是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,目前线性回归的运用十分广泛。线性回归就是要找一条直线,并且让这条直线尽可能地拟合散点图中的数据点。它试图通过将直线方程与该数据拟合来表示自变量(x 值)和数值结果(y 值)。然后就可以用这条线来预测未来的值!这种算法最常用的技术是最小二乘法。这个方法计算出最佳拟合线,以使得与直线上每个数据点的垂直距离最小。总距离是所有数据点的垂直距离(绿线)的平方和。其思想是通过最小化这个平方误差或距离来拟合模型。
10、降维
由于我们今天能够捕获的数据量之大,机器学习问题变得更加复杂。这就意味着训练极其缓慢,而且很难找到一个好的解决方案。这一问题,通常被称为“维数灾难”。降维试图在不丢失最重要信息的情况下,通过将特定的特征组合成更高层次的特征来解决这个问题。主成分分析是最流行的降维技术。主成分分析通过将数据集压缩到低维线或超平面 / 子空间来降低数据集的维数。这尽可能地保留了原始数据的显著特征。
以上就是十大经典机器学习算法盘点,大家都记住了吗?总体上看来,这些算法都各有千秋,大家可以根据具体的问题具体分析,从而判断应该使用什么算法。
— 申请免费试学名额 —
在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!
相关推荐 更多
机器学习与模式识别如何区分?两者有什么区别与联系?
随着人工智能在近些年的崛起,机器学习、模式识别这两个词也成为了热门词汇,频繁出现在大众眼前。虽然常常听说机器学习与模式识别,但是却很少有人能清楚地区别两者。本文就带大家充分了解机器学习和模式识别的概念、区别和联系。
15982
2019-09-05 16:47:59
2019年人工智能三大热门技术盘点
在刚刚过去的2019年,人工智能领域发生了颠覆性的突破,不断有热门技术迭代和实施落地。当然在AI技术的发展变化中,有技术的的爆发也有技术的消亡。在2020年的开端,我们就来盘点一下2019年人工智能三大热门技术,即强化学习、自然语言处理和计算机视觉技术。这些人工智能领域的热门技术,不再是只存在于科幻影视剧和小说的遥远幻想,更多的已经逐渐深入并应用到我们的实际生活之中了。下面我们赶紧来看一下吧!
6885
2020-01-03 12:17:29
人工智能应该学什么专业?学什么知识?
可以选择智能科学与技术专业、模式识别与智能系统专业、机器人工程专业、计算机科学与技术专业等相关专业。目前人工智能领域的人才紧缺,同时人工智能涉及到各种软硬件也可应用到各种方面。
4693
2021-01-28 16:12:39
2021年开源就业报告来了!它透露了以下几个信息
Linux 基金会发布了《2021 年开源就业报告》,来自全球 200 多名招聘经理和 750 名开源专业人士对开源圈中的种种变化和挑战进行了前沿分析和专业解读,与此同时,报告中还为求职者提供了专业的指导意见,比如哪种技术最具有市场价值,哪些证书能够帮助大家在求职的过程中脱颖而出,以及各领域对具体技术需求的详细数据分析等。下面小谷就跟大家总结一下报告的主要内容:
3303
2021-09-24 18:08:49
智能汽车用到哪些技术?
智能汽车用到哪些技术?智能汽车涉及到7个技术,如汽车“通信”系统、3D手势系统、汽车与智能手表集成、自动泊车系统、集成不同的应用程序、轻质材料、与手机完全集成等。
5723
2022-06-27 15:42:39