近几年,大数据为各个领域带来了全新的变革,大数据的重要性越来越被企业和国家所看到,大数据工作者的需求被无限放大。
马云在演讲中就提到,未来的时代将不是IT时代,而是DT(Data Technology)的时代。“Data Scientist”也被Harvard Business Review 评为21世纪最性感的职业之一。
随着科技的发展,每时每刻都有大量数据产生。这些数据有什么用?如何从数据中分析事物未来的发展趋势,窥见新的商机?商业分析(BA)和数据科学(Data Science)就这样应势而生。
很多人都知道BA和DS两个专业都是对数据进行分析,但却并不清楚两者内在的联系和区别,导致专业选择上的迷茫。那今天我就从几个角度把这两个专业做一个详细的对比。
第一, 专业定义对比
BA ,全称 Business Analytics ,是以商业知识为基础,数理编程为手段,从数据分析出发,以决策优化来创造价值的新兴专业,实现 Big Data 的商业应用。
麻省理工 Sloan 商学院对于 BA 项目的定位是这样的:
Prepares students for careers that apply and manage modern data science to solve critical business challenges .
通过对现代量化数据的管理和分析,从而对企业决策做出贡献。
Data Science 顾名思义:和数据有关的科学研究都是数据科学。
维基百科对 DS 的解释是这样的:
In general terms , Data Science is the extraction of knowledge from data, which is a continuation of the field data mining and predictive analytics, also known as knowledge discovery and data mining.
数据科学是指通过挖掘数据、处理数据、分析数据,从而获取数据中潜在的信息和技术。
从这两个概率我们不难看出,BA的落脚点是决策,分析数据是手段,而DS 的落脚点是通过技术获取潜在信息的。
第二,课程设置对比
BA普遍的课程设置配比:
Business Analytics = 40% Statistics + 30% Computer Science + 30% Business
这30%的CS其实更准确的说法是programming就是编程, BA不需要很专业的计算机基础,会一些编程像Python,语言。
BA 对于申请人的背景要求没有过多限制,文科、商科、理工科背景的同学都可以申请。不同背景的同学,需要根据BA的需求去补充相应的技能和课程背景。比如说理工科学生,想申请BA,就可以去修一些商科的课程,像会计,金融,市场营销等课程,如果是商科学生就需要学一些编程方面的课程。
DS课程配比:
Data Science = 30% Statistics + 50% Computer Science + 20% Application
从这个设置也可以看出来DS更适合于理工科背景的同学申请,DS最匹配的专业是,应用数学,统计和计算机,其次是其他工科类专业,再就是有一定编程基础的同学也可以申请,量化背景较强的专业,比如金工,同样也适合于申请 DS 专业。
第三, 就业方向对比
近几年世界许多产业进入数据、并且向人工智能方向发展,以 Facebook和 Instagram为代表的社交网络平台,以阿里和 Amazon为代表的电商消费平台,以Uber和 Airbnb为代表的共享商业平台,从最基础的医疗、消费、广告行业,到金融、社交媒体、创新型产业,都因为积累了大量的、动态的消费者行为数据,因此这些行业急需数据分析人オ来做基础的数据分析、模型整合和大数据挖掘,从而更改进改善企业的商业模式和市场策略。
美国企业与高等教育论坛(BHEF)与普华永道(PWC)发布报告显示:约23%的毕业生有数据分析技能,但69%的雇主都希望求职者具备数据分析技能。在这份报告中,数据分析人才的供给指数最低,仅为0.05,相当于20个职位在竞争1个求职者。
中国商业联合会数据分析专业委员会汇统计算,未来中国基础性数据分析人才缺口将达到1400万,而在BAT招聘职位中60%以上是在招大数据方向的人才。
由此可见,在未来很长一段时间BA和DS都有非常大的市场需求。
BA 的就业方向主要在投行、四大、咨询、科技公司,零售等,在不同行业中专门从事行业数据搜集、整理、分析,并通过数据对相应行业进行调研,不同行业的叫法也不同,咨询师、数据分析师、统计分析师等,就业前景非常广阔。
DS 的就业方向包括 Data Scientist 、Data Engineer 、Data Analyst 等,主要的工作内容包含数据模型的建立、数据架构、数据监管与存储等,目的是为了将数据整理好,使其存储成本最小化,查询的效率更高。
从就业数据来看, Data Science 在美国更容易找到工作,加上偏技术的工作对语言交流的要求也不是很高。BA的优势是在回国后的就业面更广,可以去技术岗,也可以做咨询或市场,相对来说回国发展的同学占大多数。
BA 和 DS 两个专业本身都是技术性、实用性较强的专业,选择什么方向就业和个人能力关系很大,只要有真才实学,就业还是很容易的,毕竟市场需求还是很大的。
总的来说:BA可选择的职位类别更广泛,DS可选择的职位不可替代性更高。
第四, 薪资对比
BA的平均年薪是6万多美金,而DS的平均年薪达到了9.5万美金,平均薪资BA低于DS,这个也印证了,越需要technical技能的岗位,相应的,薪资水平越高。
接下来我们来看一个数据处理的一个流程,基本上包括以下5个步骤:
1. Business understanding 明确问题
就是要明白公司要解决什么问题,要分析什么数据。
这个步骤在整个data 领域,通常被商业分析师,或者数据分析师,他们主要是要对公司业务,对产品很了解,所以他要知道自己要解决的问题是什么,然后通过什么样的数据可以解决这些问题。
这部分对编程,对数据分析要求相对没有那么高,而更多的是解决问题,分析问题的能力。
那在我们知道是什么问题,同时知道分析什么数据去解决这个问题之后呢,下一步就是来到 ↓
2. Data acquisition 抓取数据
那这一步一般情况下在公司里是数据分析师和数据工程师来完成的。他们要抓的数据可以是各种各样的,去到一些行业的数据库。那有时候数据库的数据也不能满足分析的要求,就需要再去爬取一些其他地方的信息,数据来分析。
在这个岗位就需要能掌握SQL,还有爬虫能力,掌握常见的语言,像python,Java等 可以从不同的地方抓取数据,并把这些数据存到自己的数据库。这些就是data engineer做的事情。
这部分对编程和挖数据的能力要求比较高。
3. Data clean up 处理清洗数据
就是把数据变成可分析的状态。
在建模之前都需要把数据进行很好的清理,变成更可读更易读的版本,比如说我们拿到了一些数据的,但是这些数据里有些日期或者其他的条件是缺失的,那我们是把这些数据自己随便填,还是直接删除,不同的情况,数据分析师他们会有自己的判断。在这一步我们要把有用的数据提取出来为下一步分析做更充分的准备。
所以这一步就需要能掌握一些分析数据,处理数据的语言,比如说python里常用的数据包,SQL 等。
4. Data modeling & analysis 建模分析
这个岗位大多是由DS,数据科学家来完成。
这个步骤就是通过建模来对未来有一些预测性的判断。这一块就对数理能力,统计,建模这些要求比较高,也需要有很强的编程机器学习方面的能力。
所以数据科学家这个岗位也是整个数据里面最核心,要求最高的岗位。
5. Development 执行
最后一个步骤就是通过分析,我们最后得出一个结论,来指导公司进行决策。这一部分也都是由我们第一部分里的商业分析师通过对数据进行可视化的分析,利用TABLEAU, EXCEL 等比如说做一些可视化的图,比较基础的像饼状图,柱状图等来呈现,指导公司的决策。
所以在整个环节的头和尾,一般就是BA的职责,对数据处理的技术性要求不高,但是需要有不错的商业理解力,和沟通表达能力。中间这几个环节呢,就是DS的职责,尤其是建模环节对技术要求就比较高。
当然在每个公司对数据的要求不一样,可能有些小公司,BA就需要完成整个环节,而在一些大型的数据公司,对数据要求很高,岗位职责就会比较细致,分工也会更明确。
相信通过前面几个部分的完整分析,大家对BA 和DS已经有了相对清晰一点的认识,同学们也可以通过自己的学科背景,和对岗位的要求和职位的描述来初步确定,自己更适合学哪个专业。