登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

老杨工作室

不傲视别人,不藐视自己 ,老老实实做人,认认真真做事,淡泊以明志,宁静以致远

 
 
 

日志

 
 

引用 引用 【转载】试题编制方法初探[转]   

2015-09-14 22:58:42|  分类: 教学科研 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
试题编制方法初探[转] - 管理真谛 - 中学教育管理博客
 

一、试题编制的基本原则

1、标准性原则;所编试题的内容和范围,必须以教学大纲和编题计划为准则,不得自行增减,试题的难易程度整体上要符合考试目的、类型及考生实际情况;以教学大纲规定的标准、选定的参考性标准为依据;题目的格式要规范,同类试题的编写格式应统一,以免应试者因格式不一而产生误解。

2、科学性原则:试题应保证内容的正确性,不能出现知识性错误;要用词恰当,文字简明,表意确切。

3、基础性原则(关注课程标准中最基础和最核心的内容,即所有学生在学习数学和应用数学解决问题过程中最为重要的、必须掌握的核心观念、思想方法、基本知识和常用技能)。

4、操作性原则:试题的作答要求和指导语要言简意赅,不致使应试者费解或误解;凡需以特殊方式解答的题应在指导语里明确写出;试题应各自独立,各题之间不得互有干扰性关联;试题正文和答案的表述,不能有重复现象;所编试题应便于作答,施测易行,阅卷评分省时省力,抗干扰性强。

4、创造性原则:力图通过新颖的试题,给试卷带来活力。题目具有一定的灵活性,既有思维的广度,又有思维的深度,还有选择解题路径的自由度。所编试题,不应存在与教材、公开印发的复习资料、参考资料中完全相同的文字表述或试题。选择题的备选答案,在性质上应有近似之处,具有迷惑感,但又要避免暗示或提供猜测的条件。

6、人文性原则(让不同层次的学生都能体验到成功的喜悦,同时适当结合现实中的人文性题材,编拟合适的数学试题,引导教学关注人类,关心社会,发挥试题的育人作用 

    7、公平性原则(考查内容、试题素材和试卷形式在总体上对每一位学生而言是公平的,不同生活环境的学生、不同思维特点的学生在理解题意上、思维切入上不存在大的差异)

    8、现实性原则(试题的背景来自学生所能理解的生活现实和社会现实,符合学生具有的数学和其他学科的知识水平和思维发展水平)。

二、按认知目标分类的命题依据

1、了解层次的试题

   试题的材料是考生经历过、学习过的具体事件、简单术语、方法、程序、定律、原理、学说等等事物。

考生解答的主要心理活动是再认或再现,再认或再现的内容是事物的

  原理――即可区别事物的外部特征;

  意义――有关事物的概念、法则、原理、性质、学说;

  变式――同一事物的不同表现形式或同一内容的不同表达方式。

2、理解层次的试题

   试题材料是半新半旧,和教科书上的材料相似而又不相同的事物。

考生的主要心理行为是应用熟悉的模型直接转换和规范处理类似情况中的类似问题。直接转换和规范处理的方式主要有:

领会――能够在交流中用自己的语言说明事物;

解释――对事物进行较充分和圆满的解释;

应用――用学过的知识解决类似的问题。

3、运用层次的试题

试题材料要求是新材料、新情境、新问题。解题的心智活动或行为是把知识(概念、原理等)当做纯工具,使用于具体问题情境。运用是一个收集、选择和处理信息的过程,必然随着较复杂的分析、综合活动,表现为能正确地使用概念、方法、定律或原理推断新问题的范畴和性质,对问题做出简化分解、并能通过若干不定式的转化,最后使问题得到解决。运用的主要形式有:

归纳――在接受、筛选信息的基础上整理和组织这些信息,使一组信息能反应事物内部的某种关系;

分析――收集归纳信息,使信息的组合能反应某一事物的基本结构;

转化――把较复杂的难度大的抽象的问题化解为若干较简单的难度小的具体问题并进行解决。

4、综合层次的试题。

试题的材料要求是新材料、新情境、新问题,且整体上是复杂的、综合性强的问题。解题的心智活动(或行为)是根据明确的目的或意向,有效联结不同部分或方面,组成新的整体或结构,并对组合的过程及产生的结果是否到达某种准则要求作出价值判断。

综合的主要途径有:

联系――把不同的成份联结为一个新的整体;

概括――把若干复杂的或具体的东西归结为一个简单的东西或抽象概念;

评价――根据特定的目的依据一定的标准对事物作出价值判断。

三、影响试题质量的因素

试题是组成试卷的基本因素。一份好的试卷总是按难易分低、中、高三个档次排列的。一般要求试题要难易得当,而且还能通过试题把不同学习水平的考生区分开来。一份好的试卷不仅仅取决于组成试卷的题目准确无误,评分标准严谨合理,而且要求整个试卷必须有很强代表性。也就是说,对于一组考生实施多次同一水平的测验,其成绩应当是稳定的,即保证了测验的一致性,同时还要保证这份试卷比较全面地概括这个学段所学习的内容。或者说,这份试卷应是本学段所学内容的一个好的样子,即保证了测验的准确性,即指反映试题质量的四项指标:试题的难度和区分度,试卷的信度和效度。

1、影响难度和区分度的因素。难度是试题难易程度的指标,区分度是指试题对应试者水平差异的鉴别能力。影响难度和区分度的因素有:

1)目标层次的影响。目标层次高低是决定题目难度的主要元素之一。一般来说,目标层次越高,

  题目难度越大;反之越小。

2)干扰因素的影响。干扰因素主要有:干扰因素的数量、深浅和思维定势的影响。

3)材料处理的影响。主要有:题设显隐程度,知识交叉状况,转换提问方式,题目绕弯情况,

  处理复杂程度,组合答案影响,教学薄弱领域和机械记忆影响等。

此外还有练习效应影响和猜测几率影响等。

2、影响信度的因素:试卷的信度亦即试卷测验的可靠性。影响试卷信度的因素主要有:

(1)试卷的分量。试卷分量大,题目多,信度就会高。

(2)试题的同质性。如果题目考的是同一种能力倾向,信度也会增加。

(3)题目的区分度。区分能力强的题目越多,信度也越高。

(4)考生的差异性。考生的能力差异越大,信度越高。

(5)考试时量。有足够的考试时间,信度也高一些。

3、影响效度的因素。试卷的效度也就是指试题测试的有效度。影响试卷效度的因素主要有:

(1)题目和试卷的指令是否清楚;

(2)用词和句子结构是否确切;

(3)试题的难度是否合适;

(4)试题内容是否科学;

(5)试题与考试目的是否相符;

(6)题量太小是否合适;

(7)题次排列是否从易到难。

四、测前难度估算

1、难度水平的确定

 试卷难度水平的高低取决于测量的目的、性质和试题的组合。

(1)对于常模参照测验,目的是选拔和比较。对试题的难度有一定要求。

如果测验目的是选拔性的,难度值应与录取率相适应。当录取率为10%时,难度可定在0.1左右;录取率在20%时,难度值在0.2左右等等。

如果测验目的是为了比较,难度值控制在0.5左右。

试题的难度值接近0或1时,即被试在该题上全答对或全答错时,该题便无法提供个体差异的任何信息。但难度值接近于0.5时,题目才能将考生作最大的区分。实际上,若每道题的难度值均为0.5,那么测验可能只能区分好与差两种极端的差异,却不能对考生进行更精细的区分。一般来说,难度在0.7以上的为较易的题;在0.4~0.7之间的为中等难度题;在0.4以下的为较难题或难题。因此一般只要求试卷的整体难度控制在0.5左右,而各题难度可分布在0.3~0.7之间。

(2)对于目标参照测验,目的是测量考生达标的情况。题目难度不要求统一,目标要求简单的测验,试题难度低一些;目标难度要求高,试题难度也高一些。

(3)测验分数的分布,试题难度分布值对其产生影响。一般情况下,试题难度普遍较高,考生得分普遍较低,使得低分端出现高峰,分布曲线呈正偏态分布。试题难度普遍较低,考生得分普遍较高,使得高分端出现高峰,分布曲线呈负偏态分布。

分布曲线的分布状态可通过试题难度分布调整或试卷难度值精细调节,使之大体上呈正态分布。但值得指出的是,不是所有测验都要求其分数分布为正态分布,如目标参照性测验,其分布就经常是偏态的。 

2、试题难度估算

假如在考试前预知试题和试卷的难度,则有利于根据试题设计要求和目的调节试题难度值,提高试卷设计质量。试题和试卷难度真值只能在考试评卷后通过统计分析才能知道,但在考试前大概估算试题难度不是不可能的。

对于试题的难度,首先依照下面四个影响试题难度因素的程度进行等级估算:

(1)熟悉程度。当考生不熟悉该试题的形式和内容,比如该试题不与课本和练习册上的试题相近,且教学中没引起足够重视,则试题的难度程度就高;否则,试题难度程度就低。

(2)信息数量。当试题内容的信息量大,需要多次阅读才能把握试题内容,为解答试题增大了难度,则试题的难度程度就高;否则,试题难度程度就低。

(3)试题结构。当试题形式新颖、知识综合程度高、计算复杂时,试题难度程度就高;否则,试题难度程度就低。

(4)干扰因素。当试题干扰因素的数量多、影响深,而且容易产生思维定势的影响,则试题的难度程度就高,否则,试题难度程度就低。

其次,将上述四个因素按照其程度高低评定为三个等级:高程度指数为3,中等程度指数为2,低程度指数为1。例如考生对某试题的熟悉程度为1,而试题信息数量程度为2,试题结构程度为3,干扰因素程度为2,则该试题难度程度的综合指数为:1+2+3+2=8

按照此方法需要对试卷的所有试题进行难度程度估算,具体见下表所示:

试  题

熟悉程度

信息数量

试题结构

干扰因素

综合指数

难度指数

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

再次,上表中各试题的难度则需要从下表中根据该试题难度程度的综合指数判断并找出相应的难度值来。

程度等级

较  高

中等1

中等2

中等3

较  低

难度程度

11~12

9~10

7~9

6~7

4~5

难度指数

~0.4

0.4~0.5

0.5~0.65

0.65~0.75

0.75~

 

3、试卷难度估算

试卷的整体难度的估算,需要按照各试题的权重分值与相应的难度指数的积除上试卷的总分得出。计算公式为:

试卷难度=Σ(某试题权重分值×相应难度指数)/试卷总分

五、编写试题的要领及注意事项

(一)客观题

1、填空题

(1)题意简单明了,不致引起不同的理解;

(2)填空内容是重要的内容和关键词;

(3)答案内容清楚明了,具有唯一性;

(4)空白处线段的长短要避免对答案的暗示作用;

(5)可对有些答案给予填空导向,以利答案的规范性。

2、是非题

(1)试题应主要是理解层次的考试内容;

(2)试题内容应是重要的概念、原理和规律等内容;

(3)试题设计应具有一定的迷惑性。

3、配对题

(1)问题组合备选项各自的性质要相同;

(2)同一次测试中作答的格式要一致;

(3)备选项要尽可能按逻辑顺序排列;

(4)问题组的项目和备选项数目要适当。

4、选择题

(1)题干简练、准确、清楚;

(2)干扰项应看似可能;

(3)备选项与题干衔接在逻辑和语法上要完整;

(4)备选项应随机排列或按逻辑顺序排列。

(二)主观题

(1)试题用来测量什么能力要鲜明;

(2)题目内容要典型且有一定代表性;

(3)注意适当的限定,使考生对试题要求有一致性的理解;

(4)题意述说要明确,指令要明了;

(5)解答题目时量要恰当;

(6)要做好标准答案和评分细则。

六、标准答案与评分标准的编制

编制标准答案基本要求是:作为判断考生答案正误唯一准则的标准答案,必须标准客观、用词简练、表意确切、简明易行,不存在含糊不清、模棱两可的现象,评卷时限制主观因素的影响,能客观公正地鉴别考生答案的正误和正确程度。

编制评分标准的基本要求是:要对考生考试分数的评定准确、客观,能真实反映考生的水平。

评分标准编制的主要任务是制定计分的标准,对于主观性试题的计分标准,在于评分方法的制定,主观性试题的评分方法有两种:

1、分解法。此法要为阅卷员提供一个详细的评分标准,在评分标准中,把题目的要求分解为若干部分,并对每一部分所占的比重都做出规定,按照评分表评分的方法信度较高,但是要注意一些问题:

(1)很难制订一种一劳永逸的评分表,每次命题都要重新制订。

(2)评分表的分数比重应该是解题过程中的关键点和重点,而不是在无关紧要的地方占很大的比重。

(3)要防止阅卷员容易受先入为主的印象所影响,不能正确执行分解法所规定的评分标准。

2、印象法。其方法是让阅卷员较快地通读一份答卷,形成自己的印象,然后评出分数等级,采用印象法一般不给出具体的评分标准,而只给出原则性的规定。在评卷前需要组织阅卷人员试评或“插标”,以统一思想。凭印象评分要考虑的一个问题是怎样分级?从方便分类的角度来看,有人用过三级或四级,但亦有证据表明,如果试卷测量的是知识或分量很重的科目如历史、自然等,阅卷员能够区分九个等级。一般来说,等级越多,评分的信度就越高。采用印象法,阅卷员的“印象”也会因人而异,不一定比分解法好多少。但是它省时间,有可能的话,让两个或更多的阅卷员评阅同一试题,以提高信度。

原载《考试研究》95年1、2合刊。

转自:http://blog.sina.com.cn/s/blog_532a6b2601009u1g.html

  评论这张
 
阅读(102)| 评论(0)

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2018