大数据和数据挖掘之间,主要有什么关系?
2023-04-19 16:09:50
当“大数据”压倒性地涌向我们时,人们往往希望进一步了解大数据,因此“数据挖掘”已经成为我们理解大数据概念无法绕过的“障碍”。通过对大数据和数据挖掘的比较和分析,将有助于人们了解大数据的背景和未来的真实趋势。
顾名思义,数据挖掘就是从大量的数据中挖掘出有用的信息,即从大量的、不完整的、有噪音的、随机的、模糊的数据中提取隐含的、有规律的、未知的、潜在的有用的信息和知识的过程。数据挖掘是利用各种分析工具在海量数据中发现模型与数据之间关系的过程。它可以帮助决策者找到潜在的数据关系,找到隐藏和被忽视的因素,因此它被认为是解决这个数据爆炸时代信息不足问题的有效途径。数据挖掘作为一门交叉学科,融合了数据库、人工智能、统计学、机器学习等领域的理论和技术。数据库、人工智能和数理统计为数据挖掘的研究提供了三大技术支持。 大数据是一种通过高速捕获、发现和分析从大容量数据中获得价值的新技术架构。有四个"V“字开头的特点:Volume(体量大),Velocity(速度快),Variety(杂种),Value(价值大)。Volume是指大数据的巨大数据量和数据完整性,Velocity可以理解为更快地满足实时需求;Variety意味着在大量和各种数据之间找到内部关联;Value是最重要的,它是大数据的最终意义:挖掘数据存在的价值。
2.相互关系
大数据是数据挖掘概念的重新升级。与上升相比,只有2~三年的大数据概念,已经发展了20多年的数据挖掘,堪称大数据的鼻祖。因为大数据和数据挖掘的本质是一样的――挖掘和分析数据,以找到有价值的信息。此外,大数据的兴起是在人工智能、机器学习和数据挖掘技术的基础上发展起来的,人工智能和机器学习正在服务于数据挖掘。从表面上看,大数据与数据挖掘的显著区别在于“大”。然而,深入分析会发现,一方面,数据挖掘对象不仅可以用于少量数据,而且适用于大量数据,而且由于挖掘方法和技术工具的不断升级,改变新名称;另一方面,大数据的本质不是“大”,而是用新思维和技术分析大量数据,揭示隐藏的人类行为模式,创造新产品和服务,或预测未来趋势。因此,大数据和数据挖掘的概念将在一定时期内共存。由于使用的时间、场合或习惯,真正的关键是如何反映数据的价值。
大数据是数据挖掘产业化的表现。数据的价值在于信息,技术的价值在于利润。数据挖掘可以看作是专业技术领域的专业术语。在商业领域,需要进一步的包装和升级。只有这样,一系列的开放平台和技术解决方案才能迅速“着火”。显然,这种商业运作模式已经非常成熟和成功。目前,大数据已被视为创新和生产力提升的下一个前沿,正成为国家竞争力的要素之一,越来越受到世界的重视。许多政府增加了对大数据发展的支持,甚至上升到国家战略的高度。
目前,数据挖掘在专业领域的地位非常强,但大数据仍受到公众和行业的质疑,被认为是一种商业噱头和欺骗。事实上,许多争论本质上并不是在讨论同样的问题。至少从当前的数据收集和分析能力来看,人们处理的数据从样本数据到所有数据的结论是不可能的。
我们应该看到,没有不变的真理,只有客观的规律。任何技术都不是万能的。作为一种技术,它只代表一种发展方向。它具有存在的价值,因为它可以解决一些实际问题。至于技术的商业应用是否成功,它也受到许多其他因素的影响,如应用和推广。