这是三个较好的难题。由于组织工作其原因我平常碰触到许多的逻辑学家,因而想从逻辑学家的视角谈谈对这个难题的看法。
许多逻辑学家认为,data science并并非三个分立的学科专精,而要统计统计数据的一小部分。
这里头不须建有态度/自身利益难题。那时绝大部分data science都是在统计统计数据系上面的,统计统计数据前段时间这二三十年的经济繁荣和当代社会风气里大批的统计信息处置的须要也是密不可分的。假如data science原则上分出,因而“现代”的统计统计数据的发展前景将显得十分黯淡。
但主观上讲,我真的逻辑学家的看法却是有规矩的。
三个逻辑学家Karl Broman的这段话很有指标性:
“When physicists do mathematics, they dont say theyre doing “number science”. Theyre doing math.
If youre analyzing data, youre doing statistics. You can call it data science or informatics or analytics or whatever, but its still statistics.”
统计统计数据原本就是自然科学研究怎样处置统计数据的自然科学。因而再原则上地设立三个“统计数据自然科学”,理据并并非很充份。
换三个视角说,A和B要想正式成为三个分立的学科专精,因而每三个都要有较为大的一小部分文本,是另三个不自然科学研究的。统计统计数据学里面有许多文本data science并不自然科学研究,这没难题。但另三个路径,data science的大部份文本,都能看作是统计统计数据的专精领域。换句话说,在“逻辑学家是并非该自然科学研究data science”的难题上,最少是没一致意见的。维米县,你要问三个力学学家他为何不做某一力学的难题,因而他如果提问他是力学学家就能了,即使微积分和力学是三个学科专精,力学学家原本就不应做力学难题。但你要问他为何不做某一拓扑难题,那他要是提问他是做预测的,和拓扑并非三个路径。即使拓扑是微积分的一小部分,力学学家全然能做拓扑,因而他要是更细细地说明他虽然是力学学家,但做的是除此之外的路径。因而假如你问三个逻辑学家他为何不做某一data science的难题,他会怎么提问?你会听到他说,我是做XXX路径的,不做data science,而不会听到他说我是逻辑学家,不做data science。因而说,逻辑学家并不认为做data science是在做“统计统计数据之外的事情”。
有一种看法认为data science和统计统计数据的差别在于data science更偏重于对大统计数据的自然科学研究,技术上更多地和computer science联系。然而这原本也就是近年来统计统计数据的发展路径。作为一门很实用的自然科学,统计统计数据学在不断地发展,以适应现实的需求。因而,对大统计数据的自然科学研究和对计算机的更多的应用,原本就是统计统计数据自然科学研究的热点。现实的需求与其说产生了data science这个分立的学科专精,还不如说是推动统计统计数据学朝着三个能被称为“data science”的路径连续地发展。
最后说一下专精划分。那时确实有许多大学开设了原则上的data science专精。这个专精应该理解成统计统计数据学上面的三个专精路径,和现代的统计统计数据专精相比,它在培养上更注重computer science的基础和思想,在现代的数理统计统计数据上下的功夫较为少。因而原则上把data science划出以差别其他的统计统计数据专精却是有意义的。然而从学科专精的视角讲,data science至今为止却是统计统计数据的三个分支。