在线客服
扫描二维码
下载博学谷APP扫描二维码
关注博学谷微信公众号
后端是处理数据提取用户想要的数据。简单常用的是Python,相对于java,c, c++,Python简直对初学者太友好,提供丰富多彩的API接口,比如常见的降维聚类算法:PCA, t-SNE, MDS, k-means等。如果用c实现过PCA算法有几百行代码,可在Python里只需要三行代码。那如何用Python实现对Iris数据集使用PCA算法以及展示效果?
建议新手使用Python练手操作门槛低,前期可以将更多的关注点集中在前端数据可视化上。到后期,有经验自由组合。前期使用的是Python,可到后期由于性能问题,Python已经很难解决我项目所遇到的数据和算法复杂度。于是将复杂度高的算法全部用C重写了一遍,并用Python调用这个模块。这样之前项目的项目代码框架不变,不需要代码全部重写重构,只需在相应的地方调用相应的C模块即可。
Python使用PCA算法实战
用户需要安装Python包,建议新手安装anaconda,anaconda集成了Python以及在开发过程中一大堆第三方包,比如下文用到的sklearn包。
引入第三方库的PCA算法,sklearn是Pythonz中常用的机器学习第三方模块,对常用的机器学习方法进行了封装,包括回归、降维、分类、聚类等方法。
from sklearn.decomposition import PCA
加载Python中自带的Iris数据集,做机器学习的应该比较熟悉这个数据集。主要包含4个维度,三个类。
from sklearn.datasets import load_iris
irisData = load_iris()
对数据集使用PCA算法,将数据降到2维。
pca = PCA(n_components=2)
reducedData = pca.fit(irisData)
将结果在散点图中画出来,Python功能强大提供可视化图表的能力。但更多是以处理数据为目的,将数据传给前端让前端绘制。
— 申请免费试学名额 —
在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!
相关推荐 更多
大数据分析师工资待遇怎么样?
大数据分析师工资待遇怎么样?由于各地区的发展水平不同,大数据分析师薪资按地域来划分,深圳市薪酬大约在15k左右居全国首位,其次北京约12.5k,之后是上海和杭州。工作1-3年经验的数据分析师需求量最大,其次是3-5年工作经验的资深分析师。
13524
2019-10-11 14:04:06
如何有效提升数据分析效率?五大Python技巧
如何有效提升数据分析效率?相信这是所有数据分析工作者都想解决的问题。本文整理了五大Python技巧,分别是Pandas Profiling;使用 Cufflinks 和 Plotly 绘制 Pandas 数据;IPython 魔术命令;Jupyter 中的格式编排;Jupyter 快捷键。相信这些技巧能很好地帮助大家提高数据分析的效率,下面赶紧来看看吧!
4905
2019-11-10 15:41:09
有编程基础Python自学行吗?
有编程基础Python自学入门更快,目前Python比较火爆,计算机基础越好对学习Python新的编程语言越有利。大学计算机专业C语言不是很好的入门语言,理解起来有些抽象。零基础学Python很容易上手,有一定的编程基础从零开始学习Python比零基础更容易些。
4959
2020-05-19 10:59:14
定时器是什么?怎么用?
定时器是在一段特定的时间后执行某段程序代码。定时器有两种方法:setInterval()按照指定的周期(以毫秒计)来调用函数或计算表达式。方法会不停地调用函数,直到 clearInterval() 被调用或窗口被关闭;setTimeout()在指定的毫秒数后调用函数或计算表达式。
4176
2021-12-29 14:28:29
进程是什么?进程的作用是什么?
进程是什么?进程的作用是什么?进程是实现多任务的一种方式,一个正在运行的程序或者软件就是一个进程,是操作系统进行资源分配的基本单位也就是说每启动一个进程。一个正在运行的程序或者软件就是一个进程,它是操作系统进行资源分配的基本单位,也就是说每启动一个进程。
6516
2022-03-30 16:05:13