在线客服
扫描二维码
下载博学谷APP扫描二维码
关注博学谷微信公众号
后端是处理数据提取用户想要的数据。简单常用的是Python,相对于java,c, c++,Python简直对初学者太友好,提供丰富多彩的API接口,比如常见的降维聚类算法:PCA, t-SNE, MDS, k-means等。如果用c实现过PCA算法有几百行代码,可在Python里只需要三行代码。那如何用Python实现对Iris数据集使用PCA算法以及展示效果?
建议新手使用Python练手操作门槛低,前期可以将更多的关注点集中在前端数据可视化上。到后期,有经验自由组合。前期使用的是Python,可到后期由于性能问题,Python已经很难解决我项目所遇到的数据和算法复杂度。于是将复杂度高的算法全部用C重写了一遍,并用Python调用这个模块。这样之前项目的项目代码框架不变,不需要代码全部重写重构,只需在相应的地方调用相应的C模块即可。
Python使用PCA算法实战
用户需要安装Python包,建议新手安装anaconda,anaconda集成了Python以及在开发过程中一大堆第三方包,比如下文用到的sklearn包。
引入第三方库的PCA算法,sklearn是Pythonz中常用的机器学习第三方模块,对常用的机器学习方法进行了封装,包括回归、降维、分类、聚类等方法。
from sklearn.decomposition import PCA
加载Python中自带的Iris数据集,做机器学习的应该比较熟悉这个数据集。主要包含4个维度,三个类。
from sklearn.datasets import load_iris
irisData = load_iris()
对数据集使用PCA算法,将数据降到2维。
pca = PCA(n_components=2)
reducedData = pca.fit(irisData)
将结果在散点图中画出来,Python功能强大提供可视化图表的能力。但更多是以处理数据为目的,将数据传给前端让前端绘制。
— 申请免费试学名额 —
在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!
相关推荐 更多
自学机器学习应该避免的三大误区与陷阱
作为人工智能的核心,机器学习成为炙手可热的概念。很多朋友都开始进入机器学习的大军之中,不知道大家在学习的过程中是否注意到“自学机器学习应该避免的三大误区与陷阱”呢?下面小编就和大家一起探讨一下。
7496
2019-08-07 18:11:22
为什么要掌握数据分析能力?有什么用?
在当下这个大数据时代,数据分析早已不是一个岗位,而是许多从业者的核心竞争力。无论是在医疗、旅游还是互联网行业,甚至不论你是做运营还是研发,掌握数据分析能力都是基本功之一。其实也很好理解,我们的生活和工作早就离不开和各种数据打交道了。那么掌握数据分析能力到底有什么用呢?我们可以来看看。
7864
2019-11-19 15:59:14
有哪些必备的Python基础知识
提到Python,应该很少有人没听过这个词,它的知名度已经表明了它的重要性。Python不仅仅是计算机从业者需要掌握的技能,它还可以运用到许多领域中,帮助人们快速解决工作中的问题,提高工作效率。
5195
2020-05-11 09:34:09
想学Python需要报培训班吗
现在是一个快速发展的社会,许多人都面临就业难,就业竞争大的情况。这时候就有好多人想要选择学习编程语言这项技能。这样也就应运而出了好多的培训机构。但现在又会有许多人有疑惑,学习Python需要去培训吗?什么样的人比较需要进行报班学习呢?想学Python需要报培训班吗?
5167
2020-06-11 15:03:53
CSS 元素溢出是什么?怎么使用?
CSS 元素溢出通俗的说CSS样式中子元素尺寸超出了父元素尺寸造成页面的错位,视觉效果差,解决内容错位的问题我们需应用元素溢出的解决办法来让内容正常展现出来。
3799
2021-12-09 15:39:57