|
数据挖掘在企业当中的应用 |
作者:佚名 来源:网络 |
导语:现代企业经常会搜集大量的数据,这些数据涵盖了市场、客户、供货商,及其竞争对手等重要信息,但是由于信息超载与无结构化,企业的决策者无法充分利用这些庞大的数据资源,仅能使用其中的一小部分,这可能导致决策失误,甚至出现决策错误。而借助数据挖掘技术,企业完全有能力从浩瀚的数据海洋中,挖掘出全面而又有价值的信息和知识,并作为决策支持之用,进而形成企业独有的竞争优势。
|
您的企业适用吗? 当今世界,所有行业都面临激烈的竞争环境,及时做出正确决策是企业生存与发展的重要环节。随着竞争越来越激烈,利润的降低使得很多企业必须从粗放经营转变到集约经营。经营决策需要尽可能多的定量分析,而不是似是而非的定性分析;经营决策还需要尽可能快的速度,所有这些都需要技术上的支持。 ERP、CRM、OA等信息系统的广泛应用以及互联网的蓬勃发展,使得企业数据量激增,人们希望获得更高层次的数据分析能力。现在,大多数企业并不缺少数据,而是苦恼于海量数据以及数据的不一致性;随着数据量的增加,数据变得越来越难以访问、管理。如何把已有的海量数据转换成更有价值的商用信息,以便用于决策支持呢?数据仓库被广泛认为是最好的解决方案之一。 建立数据仓库的目的,是把企业的内部数据和外部数据进行有效集成,为企业众多的决策、分析人员所用。内部数据,是指通过企业业务系统收集到的数据,这些数据可能分布在不同的数据库和网络中,正在为不同的部门服务。比如对一个制造业用户来说,可能有财务数据、市场数据、销售数据、人事数据以及设备检修数据分布在不同的部门。如果这些数据是相对独立的,则不利于企业进行全面分析。外部数据,是指企业通过网络收集来的相关信息。数据仓库,就是要对这些数据进行结构重组,并且充分考虑今后的扩展性与外部数据的接口,使得企业数据资源实现更大的价值。 了解了数据仓库的用途,还要明白自身企业的状况,这才能称为“知己知彼”。你的企业是否可以引入数据仓库呢?数据仓库,需要足够庞大的历史数据积累,还要保证及时补充最新的业务数据。为此,你还要有一个性能良好的运算环境、存储环境以及网络环境做支持。当然,“足够庞大”这个词语对于不同规格的企业有不同的含义。谨慎规划,选择一个适当规模的数据仓库,不要设计出一个不切实际的庞然大物,那会成为你财政预算的黑洞。 数据仓库到底如何用? 金融、电信、保险、零售,这些都是数据仓库常见的应用行业。行业不同,具体应用形式差别也很大,这里我们只能探究其带有共性的部分。 借助数据仓库,企业能够从海量信息中探究寻数据与数据之间的关系。这种关系,一般显示数据组之间相似或相反的行为或变化。企业决策者,则有可能从这些发掘出来的关系得到启示;而这种启示又很可能使得决策者赢得竞争优势。例如,在开展促销活动的时候,电信运营商可以利用数据仓库找到需要特定服务的目标用户(例如有可能成为无线局域网用户的顾客),有针对性地对其进行宣传;这比传统方式采用的地毯式广告轰炸要高明得多。要知道,在午餐的时候收到一个不请自来的广告电话,宣传的却是跟自己毫无关系的服务,这会让很多人感到厌烦。 数据仓库的重要用途之一,就是生成报表。与传统的交互式数据库系统不同,数据仓库的使用者一般不可能更改数据,这使得利用数据仓库产生报表的时候可以“随心所欲”,不用担心破坏了数据的完整性。数据仓库还有一个明显的优势是,它的表都是为了快速响应而特别优化的。查询很多行的信息,往往也只是需要几分钟而已。如果你的职务要求你经常处理海量信息,数据仓库也许是你最好的报表工具。通过查询工具,你可以把数据仓库挖掘的信息导入到你的个人电脑中。数据本地化存储之后,你可以将其改造成你喜欢的格式。或者,你可以把查询结果导入到其它软件之中,例如Excel,以进行进一步加工。 针对不同层次的用户,数据仓库可以开发如下几种应用: 即席查询系统:这是应用最普遍的一种查询,可以让用户随时获取所希望的数据。它能够提供从多个角度的灵活查询,适合于业务分析人员。 联机分析处理系统:能够提供灵活丰富的多维分析与查询环境,可以从不同角度去分析企业的运作情况,并对未来进行预测,主要适合企业中层领导以及业务分析人员。 领导信息系统:这是为那些不太熟悉计算机技术的领导人员设计的,需要以简单的图形界面来提供访问数据仓库能力。它能够提供易于定制的决策分析环境,主要适合企业高层决策者使用。 业务流程重整:这是指利用数据仓库技术,改善企业业务流程中的某些工作,也是数据仓库的重要作用之一,著名的例子就是“尿布与啤酒”。 当然,一个完整的数据仓库系统,应该是综合了企业内部数据与外部数据,并可以提供以上诸多应用功能的系统。 回避常见陷阱 数据仓库这样的庞然大物,建设起来务必要小心。下面几个建议,涉及到建设数据仓库最常见的若干问题,也许可以助你一臂之力。 杀鸡别用宰牛刀 如果杀鸡用了宰牛刀,那不是宰牛刀的错误,只能怪罪操作者。 不要贪大求全 不要把所有能找到的数据都放到数据仓库中,凭借数据仓库,企业也并不能预知商务活动中所有的事情。不要把你能拿到的所有数据都一股脑扔入数据仓库。要保证关键信息的及时、准确,例如客户信息、产品信息、财政报表、人事信息,处理好这些信息比一味贪大求全要有意义。把无关紧要的数据都放到数据仓库中,很快就会导致过于庞大的数据库,响应缓慢、难于维护,这使得数据仓库华而不实,难以使用。 数据挖掘是近年来数据库应用领域中相当热门的话题。数据挖掘一般是指在数据库或数据仓库中,利用各种分析方法与技术,对过去累积的大量繁杂数据进行分析、归纳与整合等工作,提取出有用的信息,例如趋势、模式及相关性等,并将其中有价值的信息作为决策参考提供给决策者。通俗地说,数据挖掘就是从数据中发掘信息或知识,有人称为知识发现,也有人称为数据考古学、数据模式分析或功能相依分析。目前,数据挖掘已经成为数据库系统、机器学习、统计方法等多个学科相互交叉的重要领域,而在实务界,越来越多的企业开始认识到,实施数据挖掘可以为企业带来更多潜在的商业机会。 但我们对数据挖掘应有一个正确的认知:数据挖掘不是一个无所不能的魔法。数据挖掘的种种工具都是从数据中发掘出各种可能成立的“预言”,并对其潜在价值加以“估计”,但数据挖掘本身并不能在实际中查证和确认这些假设,也不能判断这些假设的实际价值。
|
|