在线客服
扫描二维码
下载博学谷APP扫描二维码
关注博学谷微信公众号
后端是处理数据提取用户想要的数据。简单常用的是Python,相对于java,c, c++,Python简直对初学者太友好,提供丰富多彩的API接口,比如常见的降维聚类算法:PCA, t-SNE, MDS, k-means等。如果用c实现过PCA算法有几百行代码,可在Python里只需要三行代码。那如何用Python实现对Iris数据集使用PCA算法以及展示效果?
建议新手使用Python练手操作门槛低,前期可以将更多的关注点集中在前端数据可视化上。到后期,有经验自由组合。前期使用的是Python,可到后期由于性能问题,Python已经很难解决我项目所遇到的数据和算法复杂度。于是将复杂度高的算法全部用C重写了一遍,并用Python调用这个模块。这样之前项目的项目代码框架不变,不需要代码全部重写重构,只需在相应的地方调用相应的C模块即可。
Python使用PCA算法实战
用户需要安装Python包,建议新手安装anaconda,anaconda集成了Python以及在开发过程中一大堆第三方包,比如下文用到的sklearn包。
引入第三方库的PCA算法,sklearn是Pythonz中常用的机器学习第三方模块,对常用的机器学习方法进行了封装,包括回归、降维、分类、聚类等方法。
from sklearn.decomposition import PCA
加载Python中自带的Iris数据集,做机器学习的应该比较熟悉这个数据集。主要包含4个维度,三个类。
from sklearn.datasets import load_iris
irisData = load_iris()
对数据集使用PCA算法,将数据降到2维。
pca = PCA(n_components=2)
reducedData = pca.fit(irisData)
将结果在散点图中画出来,Python功能强大提供可视化图表的能力。但更多是以处理数据为目的,将数据传给前端让前端绘制。
— 申请免费试学名额 —
在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!
相关推荐 更多
商业数据分析培训课程学什么?学完了有什么用?
商业数据分析培训课程学什么?有什么用?不同的IT培训机构学习的内容会有所差异,不过一般来讲主要是学习数据挖掘、统计学等基础知识和Excel、SPSS和SAS等软件的应用。学完之后即培养了大家数据分析的逻辑思维能力,又能胜任各行业的数据分析师岗位。
8712
2019-09-09 17:23:05
Python中*args 和 **kwargs的用法总结
对于大部分Python新手来说,*args和**kwargs这两个魔法变量需要花大量的时间来解释。那么它们到底是什么呢?在什么时候使用它们呢?要搞清楚这些问题,首先你要明白,其实并不是必须写成*args和**kwargs。只有变量前面的*(星号)才是必须的。那下面就让我们先看看在Python中*args 和 **kwargs的用法总结吧。
6978
2020-06-19 16:36:08
学Python数据可视化要掌握哪些知识点?
学Python数据可视化要掌握哪些知识点?掌握数据分析库的使用,如Numpy、Pandas、Matplotlib、Seaborn、Bokeh库等,数据清洗、分组和聚合等常见数据分析方法;时间序列、文本序列相关的数据分析方法;对数据进行处理分析及其可视化。
6283
2020-07-17 14:44:27
数据分析的工作流程是什么?
在大数据技术催化下,数据分析成为目前各大企业未来长期发展的风向标。甚至大部分企业在招聘人才时也开始注意相应岗位人员数据分析能力。目前我们常见的数据分析主要是针对既有数据进行的结论判断式的分析,而企业急需的高端人才则是定位在探索性的数据分析。
6879
2020-08-14 15:00:18
多任务版静态Web服务器程序怎么写?
多任务版静态Web服务器程序怎么写?在Web服务器不支持多用户同时访问时,只能一个一个的处理客户端的请求,而多任务版的web服务器可以同时处理多个客户端的请求,使用多线程比进程更加节省内存资源。
3074
2021-12-22 09:54:44