当前位置:文库下载 > 所有分类 > 工程科技 > 信息与通信 > 数据挖掘在学生成绩分析中的应用
免费下载此文档侵权投诉

数据挖掘在学生成绩分析中的应用

学校里每年都存放着大量的学生信息,这些信息的大部分是用于今后查对,如果这些成千上万的信息只用于核对和备案,可以说这是一种信息浪费。为了充分利用这些信息资源.该文使用数据挖掘技术,对历年存储下来的大量学生成绩的相关数据进行挖掘,挖掘出一些现实中感兴趣的、有用的知识,通过这些知识,学校可以对教学内容进行调整和教学方法进行改进以适应学生的学习和教学质量的

IS 10 - 0 4 S N 0 9 3 4

E m i k j cc ec— a: f@cc. tn l y n. ht: w w. n s e .H t/ w d z. t p/ n C Te: 6 51 l+8—5—56 09 56 9 9 63 90 64

C mp ̄ K o l g n e h o g o u r n we ea dT c n/ y电脑知识与技术 d o Vo ,No7 l 7 ,Ma c 0 ,P 1 8—1 9, rh 2 1 P 6 9 6 0 1 1

数据挖掘在学生成绩分析中的应用 刘 .的 锋严兵 (徽大学计算机学院,徽合肥 2o3)安安 30 9

摘要:学校里每年都存放着大量的学生信息,些信息的大部分是用于今后查对,果这些成千上万的信息只用于核对和备案, 这如可以说这是一种信息浪费。为了充分利用这些信息资源 .文使用数据挖掘技术,历年存储下来的大量学生成绩的相关数据进行挖该对掘,掘出一些现实中感兴趣的、用的知识,挖有通过这些知识。学校可以对教学内容进行调整和教学方法进行改进以适应学生的学习和教学质量的提高 关键词:数据挖掘;关联规则;P增长; F一支持度;信度置中图分类号: P 7 T 24文献标识码: A文章编号: 0 9 3 4 (0 10~ 6 9 0 10— 0 42 1)7 1 8— 2

随着社会对保存数据的重视,自动数据收集工具和成熟的数据库技术使得大量数据被收集于数据库、数据仓库或特殊的存储

介质中以备以后查询。因此对于我们来说,们手上拥有大量的数据,却未被充分利用,了解决这一难题,丰富的数据中发掘我但为在感兴趣的知识 (则,律,式,束 )我们可以充分利用数据挖掘技术。该文在 S LS R E 0 5中,以加工好了的学生成绩规规模约, Q E V R 2 0对数据进行分析,用关联规则算法模型,据学生的成绩与学生的性别、龄以及其他特点来发掘感兴趣的、用的、含的模式或利根年有隐 知识。

1基于数据挖掘的学生成绩分析的基本步骤 许多人看来数据挖掘就是数据中的知识发现或 K D的同义词,是在产业界、体界与数据库研究界,们通常把数据挖掘 D但媒人视为

知识发现过程的一个基本步骤,文也以此作为研究的基础,中知识发现过程如图 1示。本其所 11数据清理与集成 .

作为数据挖掘的第一步的一个流行趋势就是将手中的信息进行预处理操作后存放在数据仓库中。数据预处理包括数据清理与 数据集成 .据清理的内容有消除噪声和不一致数据,于本文研究数对的学生成绩数据库,因为在学生成绩输入过程中可能出现输入失误 . 例如,生成绩大于满分,份证号码位数过多与过少等;据集成就学身数

是将多种数据源统一为一种存储方式,在研究的学生成绩信息大部分 是以电子表格 ( X E ) W P E C L和 s文件格式存储的,除此之外还有文本

格式 ( X )其它格式,研究多年来所有学生的信息,须把它们 TT与要必 放在一个统一数据库中以便数据挖掘系统进行挖掘。 12数据选择与变换 .

圄 懿据库

学生学习成绩库中的数据错综复杂,许多信息是与分析任务无有 关的,我们需要从数据库中删除无关数据,样可以有效的利用系统这资源。数据选择的目的就是从数据库中提取与分析任务相关的数据 .

例如,学生成绩分析中去除姓名字段 (i)班级字段 fd等与分析在 hd, c) i无关的字段;择成绩字段 ( d,份证号字段 (d等相关字段,为选 g )身 i i) i因

图 1

hd c i、i般来说与成绩无关的, i d一而 i d中包含了学生的年龄、别等重要信息,文研究的内容包括年龄,别与成绩的相关性。性本性 该文研究的学生成绩因为具体课程教学情况与满分表示方法不一样而存在差异需要对数据进行变换 .门课程优秀率占班级每人数 2%用 A表示, 0良好率 3%用 B表示, 0中等率 2%用 C表示,格率 2%用 D表示,合格率 5 5合 0不%用 E表示原始数据进行了离散化处理以便以后研究。为了方便以后进行数据挖掘,将所有处理好了的成绩放入一个数据库,且课程达到相应等级的学生成绩并用布尔表达式表示,如:成绩等级为 A的数据库中,0 1 0 0 l例在 t 0 0 0 l表示某一个学

生的第 l 4 9和 1、、 0科目成绩为 A,它科目成绩其非 A,上述成绩布尔表达式后面再添加两位,数第一位 1表示男性,示女性;数第二位 1示城市居民,示农村居民。在倒 0表倒表 0表

上面提到的最后两位数据可以通过提取相应身份证信息得到。同样每个学生的年龄也可以由身份证信息得到,然后关联到成绩表 示中。 1 .于关联规则的数据挖掘 3基

随着大量数据不停地收集和存储,多业界人士对于从他们的数据库中挖掘关联规则越来越感兴趣。对于学校数据库来说,许学校希望从多年堆积的数据信息中找到一些对于教学有用的信息以便作为今后改进教学的参考。例如,生学习科目成绩之间的关学

收稿日期:0 1 0 -2 21- 1 0

作者简介:锋 (9 2 )男,徽大学计算机学院硕士生导师,刘 16一,安教授,士,究方向为智能软件和并行计算,持国家自然科研资博研主 助计划项目(0 7 1 4;的兵 ( 9 9,,徽淮南卫生学校计算机讲师, 6 7 3 1 )严 1 7一)男安安徽大学计算机学院硕士研究生。 本栏目责任编辑:书梁 *;信息技术与谭程誓台 18 69

数据挖掘在学生成绩分析中的应用

第1页

免费下载Word文档免费下载:数据挖掘在学生成绩分析中的应用

(下载1-1页,共1页)

我要评论

返回顶部