计算机系统观念和微积分观念都主要包括抽象化和方式论
统计数据策略师和统计数据挖掘技师尽管都是统计数据应用领域的洞悉者,但她们的组织工作文本却大不相同。对一个统计数据策略师而言,最重要的并非程式设计潜能,而要方式论预测潜能、销售业务认知潜能、财务报表呈现潜能等。
统计数据策略师
统计数据策略师采用的主要就辅助工具能是程式设计,但并非要的。
即便有大批强悍功能强悍的统计数据挖掘辅助工具,如Excel、Tableau、SPSS、SAS等,即便你没程式设计能力,依然能独当一面绝大部分统计数据挖掘组织工作。
但较之统计数据挖掘技师,你还须要许多附加的潜能,比如说统计数据建模、撰写统计数据调查报告、在党委即使许多人眼前做调查报告、演说等潜能。
与此同时,即便那时网络子公司都在讲大统计数据,而统计数据基本上都储存有各式各样大统计数据网络平台和统计资料库中,因此你须要掌控Hive、HDFS、MySQL等的采用方式,因此熟练SQL是无可避免的。
统计数据策略师通常有三种,一类是销售业务取向的,主要就为各销售业务线、商品副经理、营运、各部门党委的市场需求提供更多全力支持,协助她们预测认知销售业务,辨认出销售业务难题和提供更多她们。软件系统; 并有宏观经济预测。通常没市场需求端。主要就是自发性积极主动探索,积极主动辨认出子公司销售业务中存有的难题,理清子公司行业发展趋势,辅导子公司发展路径。
统计数据挖掘技师
尽管不能做统计数据挖掘组织工作就不能程式设计,但好的程式设计技能会成为你组织工作中的得力助手。
许多时候,统计数据挖掘技师都会为统计数据策略师做许多全力支持性的组织工作,比如说为她们构建统计资料库、清理统计数据、搭建财务报表网络平台等。
有时统计数据挖掘师也会直接向统计数据挖掘技师提出要求。某些统计数据储存方式和格式超出了统计数据策略师的技能范围。这时候须要统计数据挖掘技师为她们做许多前期组织工作。
另外,统计数据挖掘技师经常须要做许多机器学习的组织工作,因此须要对各式各样机器学习算法的理论和代码实践有足够的了解。
在统计数据挖掘技师中,也有许多不同的类型,如特征工程、统计数据仓库、统计数据网络平台全力支持、算法技师、统计数据科学家等,她们的组织工作职责不同,专业技能也不同。
对大多数的统计数据挖掘工程师来讲,程式设计技能是要掌控的,但是根据不同的挖掘技师的性质,须要掌控不同的程式设计技能。通常来讲,Python、Java、Scala是常用的大统计数据挖掘语言,部分统计数据科学家喜欢采用R;最常用的大统计数据网络平台是Hadoop网络平台和Spark网络平台,常用的结构化统计资料库有MySQL或其他关系型统计资料库,MongoDB更常用于非结构化统计资料库。
对统计数据挖掘技师而言,必要的 Linux 知识也是必不可少的。由于统计数据挖掘工程师的绝大部分组织工作都是在远程服务器上完成的,无法在命令中去操作各式各样Linux系统(常用的CentOS、Ubuntu等),组织工作效率会大打折扣。另外,Shell在统计数据处理方面也很强悍,sed+awk简直就是统计数据处理的神器。
以上并非很系统的比较,但是是我组织工作中最实际的体会。我并非码农。在这个转型的过程中,我遇到了许多挑战,但是它们之间并没什么差别,许多东西都是共通的。
如果你程式设计基础不好,能从统计数据策略师入手,然后考虑转型统计数据挖掘;如果你的程式设计基础好,能考虑统计数据挖掘,但是统计数据挖掘技师通常不会接触太多销售业务。两个应用领域的职业道路截然不同。统计数据策略师之后能做销售业务、商品转移和管理;而统计数据挖掘技师通常能在技术应用领域进行纵向深入的积极主动探索,后面可能做技术管理,也有搞一辈子的技术的。