数据科学是关于从数据中提取知识的研究。它使用许多领域的各种技术,包括信号处理、数学、概率、机器学习、计算机编程、统计、数据工程、模式匹配和数据可视化,目的是从数据中提取有用的知识。随着计算机系统能够处理更多的数据,大数据是数据科学的一个重要方面。
从事数据科学的人被称为数据科学家。数据科学家使用数学、统计学和计算机科学来解决复杂的数据问题,尽管不需要在这些学科上有非常好的技能。然而,数据科学家很可能只是这些学科中的一两个学科的专家,这意味着跨学科团队可以成为数据科学的一个关键组成部分。
优秀的数据科学家能够运用他们的技能来实现多种目的。他们的技能和能力差别很大。