测量、测试与评价.pdfVIP

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

我们在工作中经常用到“测试”、“测量”、“考试”、“测验”、“评价”等术语

或说法。它们之间既有联系,又有区别,不能混为一谈。

1.测量

什么是测量?Stevens(195)认为,“广义而言,测量(measurement)就是根据法

则赋予事物数量。”也就是说,按照一定的规则给事物的属性指派数字或符号的过程就是测

量。这是迄今为止公认的测量定义。

举例来讲,要测量一下桌子的高度,我们可以拿尺子来量一量,看看它有多高。尺子

是人们根据一定的法则制定的量具,利用它就可以把事物的属性,即桌子的高度用数字表示

出来,如,0.75米。这种测量属于客观测量,因为它基本上不受观察者的主观判断的影响。

由此可以看出,测量这一定义包含三个要素:

①事物及其属性

这是测量的对象或目标。上面提到的对桌子的高度进行测量,属于对物体进行测量,

其属性——高度,是可以观察到的,可以进行客观测量的。在外语教学领域,我们感兴趣的

是学生的语言能力,而学生的语言能力属于人的心理特征,是无法直接测量的,但是人的心

理活动会在人的具体活动和行为中体现出来,所以只能通过测量其外显行为或外在表现特征

来推论一个学生语言能力的高低。

②指派数字或符号

所谓指派数字或符号,就是用数字或符号来代表某一事物或事物的某一属性的量。如

张三在本次阅读考试中得了87分,李四得了92分,我们说李四比张三多考了5分。数字本

身没有意义,只是一种符号。我们用它来代表考生的阅读成绩,这时它就变成了量化的数,

可以对其进行解释和分析。在一定的条件下,还可以对数据进行运算从而对事物的属性进行

推测。

③法则

法则是指测量所依据的规则和方法,是测量的关键。法则不好或不可靠,得到的测量

结果就会出偏差,失去测量的意义。简单来说,尺子不准,测量的结果就无法使人信服。对

客观世界的物体进行测量时,由于有公认的测量法则或尺度,如测量物体的高度、重量等;

一般不会出现大的偏差。而对人的某些特性(心理特征)进行测量时,则往往会出现较大的

偏差。举例来讲,有几个评委对某学生的英语口语进行评定。评委A认为一个人的口语要好,

必须发音准确,而该学生的发音好,所以他给打了个5分。评委B认为流利性最能体现一个

人的口语水平,该同学尽管发音不错,但流利性差一些,所以她给他3分。同一名学生,让

不同的评委去打分,成绩出现了偏差。这也很自然,原因是他们没有按照一个评定口语成绩

的统一法则(rules)去给这名学生打分,结果造成了偏差。这个例子提醒我们,在对人的

某些心理特征,如口语表达能力、阅读理解能力等等进行测量时,首先要制定一个便于操作

的,稳定的法则或标准。这样得到的测量结果才可靠,才具有可比性。

2.测试

测试(test)又称测验。不同的心理学家对此下的定义不同。Anastasi(1982)认为,

“测试实质上是对行为样本所做的客观的标准化的测量。”这个定义是人们公认的最权威的

定义,它包含以下三个基本要素:

①行为样本

语言测试的目的是要测量受试者的语言能力。上面提到,语言能力是无形的,如何主

测量?只能测量它的有形表现,这里所说的有形表现,是指语言表现,如说出来的话,写出

来的句子,对测试题目所做的各种反应等等、这些行为,都是无形的语言能力的有形表现,

用心理学术语叫“表征”(manifestation)。所谓行为样本,是指对语言能力表现行为的

有效的抽样。我们知道,一个人的语言能力的表现行为会有各种各样的形式,测试时不可能

也没有必要把它的全部表现行为都测到,只能选取一部分有代表性的抽样进行测量,然后据

此对受试者的语言能力作出推测。

②客观的测量

所谓客观的测量是指测量的标准是否符合实际。对于一项测试的客观性程度可以从这

么几个方面去评价:⑴测试题目的难易度和区分度如何;⑵测试结果的可靠性程度如何?⑶

测试结果的有效性如何?这几项指标是衡量一项测试质量的重要指标。

③标准化的测量

标准化的测量是指在测试题目的编制、测试的实施、记分以及对分数的解释等方面有

一套严密的系统的程序。只有这样,测试才有统一的标准,对不同人的测量结果才有可比性。

凡是不标准化的测量,都没有可比性。

3.评价

Weiss(1972)认为,“评价(evaluation)是指为作出某种决策而收集资料,并对资

文档评论(0)

182****4918 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档