为了解决大家对Data Science的疑惑,清柚在上周特地邀请了曾在Amazon数据部门任职,现在在Facebook从事数据科学和人工智能的大神Chris Zhang在线上讲座为大家答疑解惑。
而为了满足由于时间冲突没能赶上讲座的同学们的需求,清柚特地将讲座内容进行整理回顾,所有你想知道的,都在这一篇一并呈现给你!
Data Science
现状解析以及未来就业趋势
Data Science 作为一个新兴领域,但却在很多公司起到不可或缺的作用。Data science 旨在将IT技术与商业决策之间架起桥梁,所以职位本身的要求很高,而这类复合型人才的紧缺也导致了Data Science这一大热潮的崛起。
根据《未来数据人才报告》指出,预计到2020年美国就业市场将新增270万个数据相关的新职位。
而Data Science已经被运用到各个领域,其中包括金融,能源,旅游以及政府部门等。而很多大学也都已经意识到了开设这个领域的课程和项目的重要性。
从Columbia University 到MIT, 还有UC Berkeley以及NYU等学校都纷纷开设了相关的研究生项目,目的为了给学生 增加更多机会可以学习这个领域的课程以及发展职业。
DS/BA/CS
在申研学习、就业方向的区别?
Data Science, Business Analytics 和 Computer Science 三者无论在申研和在就业上最主要的区别就是对于技能的侧重点不同。
大部分Data Science项目都设置在Engineering学院下,或独立成院,Data Science更像一个完整独立的学科,集统计学、数据分析、机器学习等学科为一体,正在迅速发展形成体系;
而Business Analytics则一般设置在商学院下,属于商学院的一个分支,Business Analytics则更像是为了就业而设置的一个专业,加上商学院本身比较重视职业发展,因此授课重点是能在实际工作中用到的商业数据分析和决策辅助技能。
我们可以用以下等式来更直白的解释这三者之间的联系:
BA ≈ Data Science
= Statistics +
Computer Science +
Business
= Business Decisions
而BA和Data Science之间的不同也在于其侧重点的占比不同:
MSBA=
40% Statistics +
30% Computer Science +
30% Business
•适合文科/商科/理科/工科背景的申请人申请
Data Science=
30% Statistics +
50% Computer Science +
20% Application
•适合理工/工科背景的申请人申请
而在工作中这三者的工作部门以及工作内容也是有明确划分的。
Business Analyst 被称作商业分析师,这个职位的作用是沟通产品和商业的桥梁,服务对象一般是产品经理以及高层领导。处理的数据是和商业直接相关的,比如公司的收入、盈利等,而主要工作内容是定期产出报告来分析季度数据,从而支撑市场的决策。
而Data Scientist 大部分是在IT部门下面,这个职位相对更加technical,主要的工作内容是建立模型Predictive modeling,也就是我们常说的Machine learning,用已有的数据去预测没有的数据, 能够自动为商业部门提供决策,这是Data Scientist很核心的技能。
在Facebook的Data Scientist分成两种方向(track),一种是Research track,就是我们上面讲的Data Scientist。另一种是Product Analytics track,就是我们上面讲的Business/Product Analyst。
如何判断自己是否适合学习
Data Science?
想要判断自己是否适合学习Data Science, 我们不妨先看一下data science的课程设置以及行业对于data scientist 的要求,从而知道自己是否适合这个工作。
我们列举了以下三项Data Scientist的主要技能要求:
(1)、计算机科学能力
数据科学专业大多要求具备编程、计算机科学相关的专业背景。简单来说,就 是对处理大数据所必需的 Hadoop、Mahout 等大规模并行处理技术与机器学习相关的技能。
(2)、数学、统计、数据挖掘的能力
除了数学、统计方面的素养之外,还需要具备使用 SPSS、SAS 等主流统计分析软件的技能。
(3)、数据可视化
信息的质量很大程度上依赖于其表达方式。对数字罗列所组成的数据中所包含的意义进行分 析,开发 Web 原型,从而使 分析结果可视化,这是对于数据科学家来说十分重要的技能之一。
除了以上硬性技能之外,实际工作中,data scientist还需具备相应的soft skills: 比如自圆其说的能力。
因为Data Scientist的工作不单单是建立模型发现问题,同时要将数据结果以及对未来的预测进行报告。
而且,你的听众可能是高层决策者,他们并不具备计算机领域知识,但他们关心结果,如何将数据转化成听众能够理解的语言,并且能够信赖你的能力,很大程度上依赖的是data scientist的沟通能力。
Data Science 硕士申请的重难点
虽然Data Science是当下的大热专业,但实际真正开设这一独立专业的院校并不多。而想要挤进这一专业的学生数量也是在逐年递增,竞争十分激烈。选择不多,竞争又大,相应的录取Bar也是极高的。特别是学校对于学生本科的专业背景更加看重,会更加重视有计算机以及统计背景。
另外,根据近几年的申请录取状况来看,清柚不建议同学们只盯Data Science专业为唯一选择,更应该仔细浏览每个学校的课程设置,很多学校会开设与Data Science相关的专业,并且课程设置也很实用,这都可以作为数据科学的备选项。