数据挖掘技术在教务管理系统中的应用研究
摘 要:简述数据挖掘技术在教务管理系统中的研究和应用,以及如何利用数据挖掘技术与数据库技术建立教务分析管理系统。
关键词:数据挖掘技术;教务管理系统;研究 引言
随着信息技术的不断发展与高等教育规模的快速增长,各高校都相继建立了自己的教务管理信息系统,这些信息系统的使用,很大程度上提高了教务管理的水平,而且积累了大量的教行数据。但是目前这些信息系统不能提供对所采集数据进行归类与深层次分析的功能,这使得管理人员在面对复杂情况时不能及时了解相关信息,领导决策时也不能得到切实的数据支持。而数据挖掘技术是对数据进行多角度展现的一类软件技术,大量应用于支持产品市场开发策略、信贷策略、经营决策的制定、客户分析等,已经取得了良好效果。
主要研究数据挖掘技术在教务管理系统中的研究和应用,以及如何利用数据挖掘技术与数据库技术建立教务分析管理系统。通过教务分析管理系统的使用,提高教务管理水平,实现教务管理的智能化与决策的科学化。 1 教务管理的现状
随着高等教育规模的大众化、普及化,生源质量出现了较大的落差,各高校开始重视学生间的个体差异,逐渐把提高教育教学质量提到议事日程上来。近年来,各高校纷纷实行不同程度的学分制,给学生最大限度的自由。教务管理作为高校管理的核心之一,从更新管理观念、应用以信息技术为主的先进的管理手段等方面进行了改革,逐渐从\"粗放型\"管理向\"精细化\"管理转变。
2 教务管理系统中应用数据挖掘技术的必要性
随着高等教育规模的扩大,高校教学改革的不断深入,教学管理逐渐以学分制模式为构建和运行的基础,更多的是针对学生个人的个性化管理,每个学生都可能有不同的学习进度、学习结果、不同的毕业年度,相应地,其教学组织形式较具灵活性和多样性。传统教务管理的方法与手段远远不能适应新形势的要求,必须有先进、高效、配套的教务管理系统才能保证教务工作的顺利进行。
通过各种数据挖掘工具的使用,不但方便了领导与相关业务管理人员间的信息沟通,而且减轻了信息人员的工作量,使得信息人员从日常的数据统计中解脱出来。相关业务人员与领导可以及时方便地进行繁杂数据的查看与分析,从而掌握教行现状。 3 数据仓库的概念和特征
数据仓库是一种新型的面向数据应用的数据管理技术,它以关系数据库管理系统(RDBMS)为基础,数据在从操作型数据库进入数据仓库之前必须经过清理、集成、选择、变换,从而使数据仓库能够提供集成的、历史化的数据管理功能,并支持综合性的数据分析,特别是战略分析。数据仓库的建设应着重考虑三个因素:
一是业务驱动。数据仓库需要根据业务需求来建设,要按轻重缓急,从较容易实现并且马上能见效从而赢得信心的部分开始。
二是保护投资。数据仓库在设计时就要考虑今后业务系统的更换和升级问题,要能保护原有投资;此外,业务系统和数据仓库之间要保持相对,任何主题的增加不要影响到数据仓库的建设与原有数据库系统的应用。
三是可扩充性。要想大做小。从教务部门起步的数据仓库能否从部门级扩充到学校级?数据仓库的结果就是为了减少信息孤岛,不能人为地制造两个新的孤岛。所以要有整体设计的思路,这是避免数据仓库失败的三个主要措施。 4 数据挖掘概述
在20世纪80年代末出现了一个新的术语:数据挖掘,即数据库中的知识发现。它泛指所有从源数据中挖掘模式或联系的方法,人们接受了这个术语,并用KDD来描述整个数据挖掘的过程。
数据仓库技术的发展与数据挖掘有着密切的关系。数据仓库的发展是促进数据挖掘越来越热的原因之一。但是,数据仓库并不是数据挖掘的先决条件,因为有很多数据挖掘可直接从操作数据源中挖掘信息。数据挖掘(Data Mining)的比较公认的定义是:数据挖掘就是从大型数据库的数据中提取人们感兴趣的知识,这些知识是隐含的、事先未知的、但潜在有用的信息,提取的知识可以表示为概念(Concepts)、规则(Rules)、规律(Regularities)、模式(Patterns)等形式。这种定义把数据挖掘的对象定义为数据库。而更广义的说法是:数据挖掘意味着在一些事实或观察数据的集合中寻找模式的决策支持过程。所以,数据挖掘的对象可以是结构化的,如关系数据库中的数据;也可以是半结构化的,如文本、图形和图像数据;甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳的。发现的知识可以被用于信息管理,查询优化,决策支持和过程控制等,还可以用于数据自身的维护。因此,数据挖掘是一门交叉学科,它把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识,提供决策支持。数据挖掘所得到的信息应具有先未知,有效和可实用三个特征。 5 数据挖掘工具
数据挖掘工具主要有两类:特定领域的数据挖掘工具和通用的数据挖掘工具。
特定领域的数据挖掘工具针对某个特定领域的问题提供解决方案。在设计算法的时候,充分考虑到数据、需求的特殊性。
通用的数据挖掘工具不区分具体数据的含义,采用通用的挖掘算法,处理常见的数据类型。面向大型数据库,包括采掘关联规则、分类规则、序列模式和相似序列等。 6 教务数据挖掘系统设计及核心技术
主要探讨教务数据中潜藏的知识和规律,在以前的教务系统中是无法找出这些规律的。教务系统仅仅是收集教学管理过程中的数据以及和教学、管理有关的基础数据,并没有起到分析数据的作用。分析数据可以有多种方法,如:分析、数据挖掘等。这里主要讨论的是挖掘教务数据,从中得出有效结论。这就需要一个挖掘工具,市面上已经有很多成品商业挖掘工具,如SPSS公司的Clementine、IBM公司的Intelligent Miner等等,这些产品都是通用的挖掘系统,算法上一般都是固定不变的。现在,我们需要一个面向特定领域的挖掘系统,该系统能够更适合教务系统数据挖掘。教务数据挖掘系统是在教务数据仓库系统的基础上建立的,系统将数据从数据集市中取出放入工作站,而后对这些数据进行预处理,对于处理后的数据进行分析、决策,以各种图和表的形式显示数据,最后应用适当的模型对数据建模,最终挖掘出知识,并对得到的知识进行解释。系统总共分为4个模块。 6.1数据仓库模块
该模块分两部分:一部分是事实表的生成。该部分设计了一个简单的工具,仅能对数据进行抽取和装载,转换和清洗留在了数据预处理模块,该部分生成各维表的层次关系表,手工维护各维表中的值。 6.2数据预处理模块
现实世界中的数据是脏的、不完整的、有噪声的,数据预处理技术可以改进数据质量。由于高质量的决策必然依赖于高质量的数据,因此数据预处理是知识发现过程的重要步骤。 6.3数据分析模块
经过预处理阶段,已经为数据挖掘建模准备好了数据,可以通过此模块以表的形式查看各数据集(训练样本、测试样本、源数据、属性列表),也可以以图的形式查看各因素。通过对这些数据的观察,可以得出一些指导性的结论。 6.4数学建模及结果分析模块
该模块是数据挖掘系统的核心,对经过预处理的数据进行挖掘,分类算法和聚类算法在这个模块中实现,使用合适的算法对数据挖掘库中的数据进行挖掘,通过修改算法中的参数,可以得到不同的挖掘结果,并在该模块中对结果进行分析,评价所得结果的可信度。 7 结论
数据挖掘是一门综合性的学科,其中用到了数据仓库、数理统计、计算机技术等很多知识。数据挖掘本身的方法也有很多:分类、聚类、关联规则、时间序列等等。不同的主题需要选择不同的方法进行分析,经过十多年的研究,每一种方法都踊跃出了大量的算法,这些算法中也各有利弊,在不同的问题上要选择不同的算法,才能最大限度的发挥数据挖掘的潜能。教学管理系统中含有大量有待挖掘的有用信息,在大力提倡科教兴国的今天,这些信息对校方更好地制定学生培养计划无疑具有重要的指导意义。
作者简介:孟薇,辽宁地质工程职业学,北方工业大学在读工程硕士。