在线客服
扫描二维码
下载博学谷APP扫描二维码
关注博学谷微信公众号
数据科学家和数据分析师的区别在哪儿?数据科学家和数据分析师在所用编程语言、平台/工具,以及所解决的问题方面都有共同之处。这些工具包括但不限于SQL、Tableau,以及相似的分析流程,定义问题、分析数据和输出结果;一部分差异在分析的自动化上,数据科学家专注于使用Python等语言编写算法,进行自动化分析和预测;而数据分析师则使用静态的或者过往的数据,在某些情况下会使用Tableau和SQL等工具去做预测。
有人会说,要成为一名数据科学家,要先从数据分析的工作做起。数据科学与数据分析用完全不一样的工具和编程语言,数据科学是数据分析的一种形式,因为最终你是在与数据打交道转换格式,进行可视化得出可用的结论。
一、数据科学家的主要职责
数据科学家主要职责:与有关部门一起定义要解决的问题;获取数据(使用SQL);探索性的数据分析、特征工程、模型构建、预测(使用Python、Jupyter Notebook、各种算法);根据工作场景,将代码编制成.py文件和/或用于部署的模型。实施自动化统计的行业,使用各种模型来进行分类和预测。成为一名数据科学家必备技能:Python 或者 R、SQL、Jupyter Notebook。
算法/建模
1、Python,大部分公司倾向于用Python而不是R作为主要编程语言。虽然职位描述里可能会同时列出两者;但是,我猜你身边的大多数人——比如机器学习工程师、数据工程师和软件工程师——都不怎么熟悉R。因此,要想成为一名更全面的数据科学家,Python应该更有用。
2、SQL,SQL是你从事数据科学必备的技能。工作中数据集往往不会直接发给你的,这跟学术界不同,你需要通过SQL获得自己的数据集。现在有很多SQL的分支,比如PostgreSQL、MySQL、Microsoft SQL Server T-SQL,以及Oracle SQL。它们都属于同一种查询语言,形式接近,但平台不同。因此,会其中任何一种就行,换到另一种SQL很容易。
3、Jupyter Notebook既可以用于编程也可以建模。你可以把Jupyter当作一个研究工具,你可以编程,写代码,注释掉代码,调用sklearn、pandas和numpy这些库来建模和测试。
4、算法,数据科学家的主要职责是用算法来快速准确地预测、分类,以及根据数据来给建议。每当你用新的数据来训练模型,就会得到一些新的结果。关键的算法通常分成两大类:无监督学习和有监督学习。
二、数据分析师的主要职责
数据分析师主要职能:与相关部门定义要解决的业务问题;获取数据(使用SQL);探索性的数据分析、趋势分析和可视化(使用Excel和Tableau)——根据工作场景,向有关部门展示从数据中获得的发现,并提供可行性的建议。
数据分析师与业务分析师、商业情报分析师,甚至Tableau开发人员有着相似的头衔。数据分析的重点是描述和可视化数据所包含的信息,然后向非技术用户传达并做进一步的解释说明。做预测分析的数据分析师跟数据科学家的工作有很多重叠部分,与数据科学家有更多相似之处,但不是通过自动化、算法化的方法来输出预测的。
数据分析师需要具备的技能有:SQL、Excel、Tableau等。
1、SQL,前文提到过数据科学家如何使用SQL,数据分析师也会进行类似的操作。但是,SQL对数据分析师更重要。数据科学家可能只是简单地从表单中选择列就可以了,而数据分析师却要执行更为复杂的查询操作(例如,常用的表单表达式,数据透视表,窗口函数,子查询)。不同公司情况不同,有时候数据分析师更接近数据工程师,而非数据科学家。
2、Excel,很老派,但依然很强大,你甚至可以用它做预测分析和趋势分析。主要的坑爹之处是跟Python比速度太慢。
3、Tableau,可视化工具,但根据我的经验,大多数公司都把它明确列为数据分析师的必备技能。在Tableau中可以拖放数据到预设图表,简单强大;还有更多复杂的高级功能,比如计算字段,连接到一个实时的SQL数据库而非基于静态的Excel表单进行分析。
数据科学和机器学习两个领域很容易混淆,从职责描述上这两个职位都差不多,数据科学和数据分析这两个职位更容易区分。
— 申请免费试学名额 —
在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!
相关推荐 更多
数据分析培训工程师待遇怎么样?就业前景如何?
近来,数据分析几乎成为互联网行业的必备岗位,许多想参数据分析培训的同学都有这样的疑问:数据分析培训的工程师待遇怎么样?就业前景如何?其实大家大可不必担心培训完的工作问题,数据分析工程师待遇最低都有12K。只要真的学到了知识,数据分析工程师不愁找不到好待遇、有前景的工作。下面我们就来看看数据分析工程在各行各业的待遇和前景。
5573
2019-08-28 14:41:55
有没有大数据分析培训资料下载?
随着大数据时代的带来,数据分析岗位也成为企业与从业者备受关注的焦点。越来越多的人通过学习进入数据分析领域。目前学习数据分析的人群中,一大部分同学通过参加数据分析培训课程快速学习,也有部分同学依旧在苦苦搜索免费的大数据分析培训资料下载。
7347
2019-09-03 18:49:46
如何利用pandas绘制可视化图表?
众所周知,Pandas是基于Python平台的大数据分析与处理的利器,它可以把十分复杂的可视化过程,变得简单一点。本文将以2019年世界幸福指数的数据为例,为大家详细展示如何利用pandas绘制可视化图表。相信经过本次手把手教学,大家可以举一反三掌握绘制可视化图表的能力。感兴趣的朋友赶紧来看详细的步骤解析吧!
6157
2020-03-04 18:47:04
Python数据分析主要功能是什么?可以用来做什么?
Python是一种计算机程序设计语言,具有简洁性、易读性以及可扩展性,相较于其他语言学习起来更加容易。随着互联网的发展,Python知识也被越来越多的人所熟知。Python数据分析早已成为现在职场人的必备核心技能。利用Python数据分析可以检查数据表、数据表清洗、数据预处理、数据提取和数据筛选汇总等。
5573
2020-04-01 15:03:59
学数据分析能速成吗?如何进阶学习?
大部分数据分析入门者水平参差不齐,除去数据分析的专业知识和能力在职场通用素质也远达不到大厂要求。培训班宣传学习数据分析速成的千万不要信,如果当前处于一个入行转行无门的状态,参加培训班对来说确实是一条捷径,参一定要选择正规的机构学习。
4065
2021-05-13 14:02:44