数据挖掘技术在班级QQ群中应用探究.doc

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘技术在班级QQ群中应用探究

数据挖掘技术在班级QQ群中应用探究   摘 要:作者运用数据挖掘技术,通过基于QQ群的聊天记录,从发言频次、社会网络关系、情感分析、高频词统计四个方面分析该QQ群的整体交流互动状态,以期为同类研究提供一定的参考。 关键词:数据挖掘;社会网络分析;情感分析;高频词 中图分类号:G434 文献标志码:A 文章编号:1673-8454(2013)16-0085-03 当前的世界已经进入知识经济的时代,快速获取信息、掌握知识是在激烈竞争环境中脱颖而出的不二选择。然而,现实是人们处在信息大爆炸的时代却忍受着“知识的饥饿”。在这样的背景下,数据挖掘技术响应时代的召唤应运而生,通过对大量的、无序的、不明确的数据进行抽取,以获取有价值的信息和知识,是数据挖掘技术的重要特征。因而,该技术在商业、旅游、医疗等领域受到广泛的关注和应用,但在教育领域的应用正处于起步阶段。本文试图通过一个班级QQ群聊天记录,运用数据挖掘技术对隐含在聊天记录中的信息进行分析,以窥测该群在线学习交流的情况,为数据挖掘技术在教育上的应用做一些探索性的研究。 一、数据采集和研究方法 1.数据采集 本文的数据来自陕西师范大学2011级教育技术学硕士研究生班的QQ群,该群于2011年9月份申请成立,一共有20位群成员。群聊天记录选取时间从2012年9月份到2013年4月份,最后得到2572条记录。 2.研究方法及其工具 数据挖掘(Data Mining)是从大量不完整、有噪音、模糊、随机的数据中,抽取出隐含在其中的,人们事先不知道但又是潜在的、有价值的知识、模型或规则的过程,是一类深层次的数据分析方法。[1] 本文通过文本挖掘、社会网络分析同时结合访谈法展开本次研究。 (1)文本挖掘 文本挖掘又称为文本数据挖掘或文本知识发现,是指在大规模的文本中发现隐含的、以前未知的、潜在有用的模式的过程。[2]本文通过对QQ群的聊天记录的文本信息挖掘,对该群的情感状态、高频词进行统计分析。实现文本挖掘的工具是武汉大学沈阳博士领衔开发的ROST RM文本挖掘软件。[3] (2)社会网络分析 社会网络分析是指对社会行动者及其间关系的分析。通过社会网络分析,挖掘该QQ群体的核心参与者、边缘参与者以及旁观者的分布状况。本文实现社会网络分析的工具是UNICET 6.0,该软件是目前最为流行的社会网络分析软件。[4] (3)访谈法 主要对QQ群中的个体进行访谈,访谈所使用的工具是结构化的访谈大纲。通过访谈以了解群成员参与QQ群讨论的动机和想法等信息,弥补通过数据挖掘技术获取信息的不足。 二、统计与分析 1.群成员在线交流频次分析 在线交流频次在一定程度上反映了群成员在群中的活跃度,可以窥测出群成员在线交流的交互程度的状况。笔者将2572条数据导入到ROST CM软件中,得出了最后的频次统计数据。分析发现该数据服从正态分布,因此为了了解全成员在在总体发言的相对位置,笔者将最后的数据转换成了标准分数形式,如表1所示。 从表1可以看到,序号为2、3、10、12、14、15、18、19的群成员等频次标准分数呈现正值,说明他们在群里的发言较为积极,这些同学可能成为这个群里的核心成员或者说是意见领袖,对于整个群的凝聚度有较大的影响力。其中序号为2、18、19的同学是该班的班委成员;而3、12、10在现实的环境下同样较为活跃,喜欢与他人交流; 14、15在现实生活中是好友关系,通过聊天记录分析这两成员互相回应的次数很高;4、9、16成员发言的频次很低,但是这几位成员在现实环境中属于活跃型,可以发现这几位同学不适应在虚拟的学习环境下交流学习。通过访谈发现,这几位成员认为群里的讨论没意义、浪费时间,而且经常由于打字速度慢跟不上,因此对QQ聊天并不感兴趣。 2.群成员在线交流角色分析 万力勇等认为,“在一个虚拟社区互动中,有三种角色,分别为中心参与者、边缘参与者和旁观者”。[5]中心参与者处于“社会网络”的中心,对群的贡献较大;边缘者处于“社会网络”的边沿,对整个QQ讨论不太感兴趣;而旁观者一般不发言,不参与QQ群的讨论。笔者通过对该QQ群中集中的聊天片段中各成员的回复情况分析,进行邻接矩阵的构建,其中行列中的1表示选择关系,0表示无选择关系。如第i行的同学选择了第j列的学生,则i行j列上的数据为1。最后把邻接矩阵转换成社会网络关系图,如图1所示。 通过图1可以看出,处于网络核心地位的是2、7、11、12、17、18、19,这些成员在QQ群中与其他成员存在较多的互相交流现象。同时,我们对比表1发现,其中2、7、11的发言频次不高,标准分数为负,但这三位成员却成为了核心参与者。从这点可以看出, 2、7、

文档评论(0)

docman126 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档