近十多年来,数据挖掘在全世界信息产业界受到了极大的关注,并飞速发展,究其原因,在于全球信息技术的迅速发展和互联网的快速普及造成了数据过量和信息爆炸,人们迫切需要有这样一种技术可以帮助他们从浩如烟海的信息中找出他们真正需要的、有价值的那一部分信息和知识。而数据挖掘正是解决以上问题的有效手段。 关于数据挖掘,最简单明确的表述是从海量、混杂的数据里挖掘或者提取有用模式或知识的一个过程。
数据挖掘可以说是一门跨多个学科和知识领域的新兴课题,它将人们应用数据的方式从原本简单的查询提升至在数据里挖掘与发现知识以对决策行为提供支持。而为了能满足人们从数据里发现知识的需求,来自不同领域,如数据库领域、模式识别领域、机器学习领域、人工智能领域、统计学领域、可视化领域和并行计算领域等的诸多优秀的研究者和技术专家都致力于研究这个新兴的课题—数据挖掘,不断研究和创造出优秀的研究成果,也使得数据挖掘成为了新的技术热点。 数据挖掘技术的发展与数据库技术的发展密切相关,可以从各种数据源,如关系数据库、空间数据库、数据仓库、时态数据库、文本数据库、多媒体数据库、事务数据库、面向对象数据库、异构数据库以及Internet等中挖掘信息。
目前,数据挖掘技术广泛应用在很多行业,如金融业、通信业、交通业、大型零售业及保险业等商业领域,从而可以解决以下商业问题: (1)市场分析及行为问题,如营销背景分析、客户群体划分和交叉销售等;
(2)客户行为分析及功能分析问题,如客户信用分析、客户流失性分析、欺诈行为发现和故障诊断等等。数据挖掘技术和算法的研究价值不仅仅在于学术领域,更多的在于实际的商业应用。
近年来,人们希望有新的技术和工具对大量数据进行强有力的分析,从中提取出有价值的信息,为决策者提供必要的支持。由此,数据挖掘技术应运而生。许多企业实施了ERP系统,完成了企业业务管理的功能,并形成了准确、及时、完整的基础数据。然而,决策中最重要问题是如何获取更高层次的知识,来把握企业整体运作和决定企业未来的战略发展,这就需要可靠的决策支持系统,而数据挖掘技术就成为实现决策支持系统的最佳途径。
..
|