数据挖掘技术就是利用机器学习统计数学和可视化技术,从大量的数据库中确认出有效的、新颖的、潜在的、有用的以及最终挖掘出可理解模式的高级处理过程,数据挖掘实际上是数据库中的知识发现过程。
1、数据挖掘:过程与方法 数据挖掘是将人工智能技术(神经网络,模糊逻辑,遗传算法等)应用到大规模数据中,从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
数据挖掘作为知识发现的一个特定步骤,是知识发现的核心。它的目标是利用算法,从数据中抽取模式,将大容量数据转换为有用的知识和信息。
这里所提的模式包括模型或结构。数据挖掘的过程一般由三个主要的阶段组成:数据准备、数据采集、结果表达和解释。数据挖掘方法有很多种,其中比较典型的有关联分析、序列模式分析、分类分析、聚类分析等。
关联分析是利用关联规则进行数据挖掘,目的是挖掘出隐藏在数据间的相互关系,关联规则是描述事物之间同时出现的规律的知识模式。序列模式分析和关联分析相似,是把数据之间的关联性与时间性联系起来,侧重点在于分析数据间的前后或因果关系,为了发现序列模式,不仅需要知道事件是否发生,而且需要确定事件发生的时间。分类分析就是分析示例数据库中的数据,为每个类别做出准确的描述、建立分析模型或挖掘出分类规则,把集中的数据映射到某个给定的类上,其输入集是一组记录集合和几种标记。与分类分析不同,聚类分析法的输入集是一组未标定的记录,也就是说此时输入的记录还没有进行任何分类,其目的是根据一定的规则,合理地划分记录集合,使组之间的差别尽可能大、组内的差别尽可能小。
现代物流的新理念包括反应快速化、服务系列化、作业规范化、目标系统化、手段现代化、组织网络化、经营市场化,这些都离不开完善的信息系统的支撑。随着数据量的剧增,数据挖掘技术将成为深化物流信息管理的最有效方法,在解决选址、仓储和配送等基础物流问题方面可以发挥出很大的作用。 2、选址问题 物流中心的选址属于最小成本问题,即求解为运输成本、变动处理成本和固定成本等之和的最小化问题。选址需要考虑到中心点数量和中心点如何分布等情况,尤其是多中心选址的问题。多中心选址是指在一些已知的备选地点中选出一定数目的地点来设置物流中心,使形成的物流网络的总费用最小。在实际操作中,当问题规模变得很大,或者要考虑一些市场因素(比如顾客需求量)时,数学规划就存在一些困难。针对这一问题,可以用数据挖掘中的分类树方法来加以解决。
分类树的目标是连续的划分数据,使依赖变量的差别最大。分类树的真正的目的是将数据分类到不同组或分支中,在依赖变量的值上建立最强划分。用分类树的方法解决这个问题时,通常需要以下四个方面的数据:中心点的位置、每个中心点的业务需求量、备选点的位置、在中心点和备选点之间的距离。
通过分类树的方法,不仅确定了中心点的位置,同时也确定每年各个地址间物品的运输量,使整个企业必要的销售量得到保证,企业长期折现的总成本也会达到最小值。 3、配送问题 配送问题,包括配送计划的编制、配送路线的设计优化以及配送过程中的配载(混载)问题。在许多配送体系中,管理人员需要采取有效的配送策略以提高服务水平、降低货运费用。其中首要的难题,就是车辆的路径问题。车辆路径问题是为一些车辆确定一些客户的路径,每一客户只能被访问一次,且每条路径上的客户需求量之和不能超过车辆的承载能力。
要合理解决这个问题,需要物流设计人员考虑到车辆的利用能力,如果车辆在运输过程中的空载率过高或整车的运力不完全利用,这些无疑会增加企业的运输成本。另外还涉及到车辆的运输能力,这就必须考虑到货品的规格大小和利润价值的大小。
在采取有效的配送策略时这些因素都必须同时考虑,这时如果能够对顾客的需求和运输路径综合起来进行分类,对整个配送策略中车辆的合理选择分派会有较好的作用。 ..
|