教务管理信息系统已经普遍应用在我国高校教学管理中,随着其使用频率的不断上升,系统中积累的数据越来越多。教务管理系统中包含了教学所有环节的数据信息,包括专业计划、开设课程、课程安排、学生信息、学生选课、学生成绩等,具有数据量大、数据杂、蕴含信息多、数据表间相互关联多等特点。
数据挖掘技术从一开始就是面向应用的,但在教育领域,数据挖掘还是一种全新的技术。它关注从教育环境产生的数据中发现隐含的知识,这些数据可以是从历史的或者正在运行的教育系统数据库中获得;它的主要作用是对数据库中的大量数据进行抽取、转换,通过数据分析发现其中隐藏的模式、关联、数据反常等对教育和教学决策的起到积极作用的关键性数据。数据挖掘更主要是为教学决策提供真正有价值的信息,进而获得更好的教学效益,例如利用数据挖掘分析结果可以改进教学效果,提高学生成绩,找到影响教师教学和学生学习的因素。随着这项技术的成熟,其在高校教学、管理中的应用更加广泛。
在数据挖掘教育实践应用过程中需要选择合适的数据挖掘功能建立对应模型来解决问题,数据挖掘的主要功能包括分类、估计、预测、关联、聚类、描述和可视化等,通过文献调研发现目前在教育教学管理中应用的主要有分类、预测、关联、聚类等。
分类是最常见的数据挖掘功能之一,分类过程实际上是建立某种模型,然后将其用于对未分类数据进行分类。决策树、最紧邻技术、神经网络等都是最常用的分类技术。
预测是利用历史数据找出变化规律,建立模型,并由此模型对未来数据的种类和特征进行预测。预测关心的是精度和不确定性,如由学生以往课程成绩预测学生转专业或学籍异动情况。预测通常使用回归分析、时间数列分析和人工神经网络等方法。
关联是要发现大量数据之间有趣的关联或相关联系,从而为某些决策提供必要支持,它是数据库中存在的一类重要的、可被发现的知识,被广泛应用于决策支持系统。例如,从学生选修课程的倾向可以了解学生需求从而为课程开设提供参考。
聚类是把一组个体按照相似性归成若干类型,它的目的是使同一类别之内的相似性尽可能大,而类别之间的相似性尽可能小。聚类技术主要包括传统的模式识别方法和数学分类学,例如,将成绩好的和成绩不好的学生分别聚类,分析不同类型学生特点。
数据挖掘在教育层面上的研究处于发展的初级阶段,但发展速度很快,已经应用于招生、就业、教学计划安排、课程安排、课程相关性分析、学生评价等多个方面,而且应用领域还在不断扩展。我国高校中对数据挖掘技术的应用起步较晚,但进入21世纪后发展相当迅速,已经开始应用于教育教学管理的各个方面。在国内教育研究领域主要利用数据挖掘进行计划、学籍管理、教学运行过程、招生、就业等数据的深层分析。
..
|