2018年第6期 (总第71期) 考试研究 EXAMINATIONS RESEARCH NO.6.2018 Genera1 No.71 高考选考科目等级赋分方案设计的理论探索与 实证研究 仲进仲夏阳 [摘 要] _Yt-.在施行的高考选考科目等级赋分制,由于忽视各选考科目考生群体的分布差异, 导致学业能力水平相近的考生群体在不同选考科目上的得分落差十分明显,从而产生诸多负面影 响。本研究以语数外考试为锚测验,采用频数估计法,计算选考科目分数在假设总体上的频数分布 及百分等级,并依据该百分等级进行赋分。实证研究表明,该方案能够解决跨选考科目分数的可比 性问题,使得选考科目分数的解释和高考总分的呈现更加科学合理。 [关键词] 选考科目考试;等级赋分;假设总体;分数可比性 [中图分类号] G424.74[文献标识码] A [文章编号] 1673—1654(2018)06—074—011 在2014年9月4日发布《关于深化考试 招生制度改革的实施意见》后,上海市和浙江省于 2014年秋学期先行高考综合改革试点,北京、天津、 山东、海南四个省市成为第二批高考综合改革试点 省市,于2017年秋学期进入高考综合改革实施阶 浙沪选考科目等级赋分方案设计的初衷足,既 能解决由于学科属性差异分数无法等值的问题,义 一、现行的选考科目等级赋分制存在的问题 段,其中山东和天津已公布的高中学业水平等级性 考试科目(以下简称“选考科目”)计分方式与上海、 能解决高考科目的原始分与选考科F1的等级两类成 绩混合使用而导致平行志愿投档的难题,有利于招 生录取工作的平稳过渡和顺利实施。但是笔者认为 实施效果并未达到预期,原因如下。 1.浙沪选考科目赋分性质及其负面影响与“』 ‘ 东标准分”相似 浙沪两地高考选考科目等级赋分制没计的细 有所不同,但都遵循“原始分数一百分比例一等级一 浙江类似,均采用等级赋分制。在“3+3”新高考模 式下,高考总成绩由统一高考的语文、数学、外语三 门成绩和三门选考科目成绩合成,而选考科目的计 分方式是否科学公平,是新一轮高考改革方案设计 的核心问题之一。本文首先剖析浙江、上海等省市 新高考选考科目等级赋分方案存在的问题,然后依 据教育统计测量理论,提出能够实现高考选考科目 转化分数”的路径。从计分过程不难看出,选考科l1 的原始分对应的等级和赋分取决于原始分数在该选 考科目中的百分等级,而考生取得选考科目 分等 级的高低,既取决于考生学习该选考科目的能力水 分数可比性的等级赋分方案设计,并用实证数据进 行验证。 作者简介 仲进,中学高级教师,江苏省东台市唐洋中学。江苏盐城,224233。仲夏阳,讲师,苏州技师学院 江苏苏州, 215009。 ----——74....—— 平,又与选考科目群体的总体实力、内部的竞争激烈 程度有关,这一特征与标准分相同。 高中物理是高校理工科专业学习必备的基础, 物理学科也因被认为是在所有选考科目中最能有效 传递学生认知能力的信号而备受高校青睐,选考物 理学科能够获得更宽的专业选择面和更多的教育收 益,因而物理学科成为优秀考生聚集的选考科目是 必然的。然而,广东省在2001至2006年期间实行标 准分,许多本来成绩不错而选考物理、化学的学生因 为选考科目计分不公平,高考综合分反而不如一些 选考其它科目的成绩平平的学生。在信息传递效应 作用下,选考理科科目的学生比例相比文理分科时 代有明显下滑的“理科萎缩”现象逐年加剧。广东省 至2006年选考物理化学的考生人数只占两成,尤其 是物理,选考人数不足考生总数的1/10,而政治、历 史、生物选考人数不断上升 J。“广东标准分”导致 的“理科萎缩”现象在目前施行选考科目等级赋分制 的浙江省和上海市重演。浙江省2014级高中生选 考物理的比例仅占4l%,低于化学10个百分点以 上,且低于地理学科,仅位居第三位;2015级学生选 考物理的比例较2014级又有明显下降 。由“理科 萎缩”导致的学生科学综合素养下降,必然会带来高 校人才培养的难题 。 2.现行选科等级赋分与“广东标准分”问题性 质相同 现行的选考科目按等级转换得到的赋分与当年 广东选考科目标准分一样,均是基于原始分数排名、 与原始分数百分等级完全相关的导出分数。“百分 等级是相对于特定的被试团体而言的,所以,解释时 不能离开特定的参照团体。”_5 。“对某一受测者分 数的解释要与这一受测者所属团体的常模作比较, 才能说明该受测者分数的意义。” 由于各选考科 目考生群体存在显著差异,分别构成各自的常模团 体,各选考科目原始分及其导出的百分等级和标准 分(或赋分)形成各自的常模量表。但在“广东标准 分”及浙沪等级赋分制下,这些特征各异的选考科目 常模团体,被当成全体考生常模团体中的6个或7个 随机样本,并且将各选考科目常模量表当作同一量 表处理。严格地讲,这不是技术层面上的估计误差 问题,而是违背教育测量学基本原理的做法。无论 高考选考科目等级赋分方案设计的理论探索与实证研究 是当年广东选考科目的标准分,还是现在浙沪方案 选考科目赋分,只有在各自的科目中比较才有意义, 跨选考科目常模量表上的百分等级及相应的标准分 (或赋分)不具有可比性。将不在同一常模团体中不 具有可比较性的各选考科目分数转换为同一常模团 体中可比较的分数,是解决这一问题的有效途径。 3.标准差等项统计指标的确定似乎没有统一 依据 浙江省等级赋分方案共分21个等级,每个等级 分差为3分,起点赋分40分,每门满分100分 , 理论平均分71.26,标准差13.75,偏态系数一0.066, 峰态系数一0.753,赋分呈现明显低阔峰、略显负偏 态的分布。上海方案 选考科目分为11个等级,赋 分区间为40—70分,赋分极差为3O分,理论平均分 为55.o0,标准差为8.75。山东省方案¨ 选考科目 划分为8个等级,赋分区间是20—100分,极差为80 分,理论平均分为6O.5,标准差为15.7,偏态系数0, 峰态系数一0.314。上海方案的赋分区间较小,标准 差偏低,选考科目在高考总分中的权重较小,这样固 然弱化了选考科目赋分不公平产生的矛盾,但也削 弱了选考科目在中学教学中应有的地位和作用,影 响了基础教育的健康发展。 三省市选科等级赋分方案的共同点是,获得的 赋分大致呈正态分布,但标准差等项统计指标的确 定似乎没有统一的依据。 总之,上述选考科目等级赋分方案缺乏足够的 理论支撑,未能解决跨选考科目赋分的可比性等 问题。 二、选考科目等级赋分方案设计 1.设计方案评价指标 选考科目成绩的呈现方式以及在高考录取中的 使用方式是此次高考改革的一个关键问题,直接涉 及到对于考生的公平性、高校招生的选拔性、对于基 础教育的导向性以及高考自身的科学性,是本次改 革中不可回避的问题¨ 。选考科目等级赋分方案应 力求达到以下四项指标: (1)严谨的科学性 选考科目等级赋分方案应以现代教育测量理论 一75— 《考试研究}2018年第6期(总第7l期) 为依据,实现将不在同一常模参照中的各选考科目 原始分转换为在同一常模参照下可比较的分数。应 根据选考科目在基础教育中的地位和作用,确定选 核心内容是,依据选考科目原始分数在假设总体上 的百分等级(而不是学科内的百分等级)确定选考科 目等级和赋分。具体实施步骤如下: 考科目分数在高考总分中的权重,从而控制好平均 值、标准差等项指标,并且尽可能细化等级划分,控 制同一等级下覆盖的原始分数区间,减小赋分误差。 (2)良好的公平性 第一步:依据考生高考原始分数,以语数外三门 总分为锚测验,应用频数估计法计算在假设总体 选考科目分数的频数分布。 第二步:依据选考科目分数在假设总体上的频 在科学公平的选考科目等级赋分制下,具有相 数分布,计算在假设总体上选考科目原始分对应的 近基本学业成就水平的考生群体在不同的选考科目 上应该获得相近的分数,所有竞争者得以用同一条 准绳检验,这种检验把基于努力和才能的学业成就 作为人才选拔的最高标准 。 (3)有效的选拔性 考试制度中计分方式和总分合成的科学性、公 平性,可以保证招生有效的选拔性。 (4)积极的导向性 科学公平的选考科目等级赋分制与选考科目量 表化的实施预期一致。在科学公平的选考科目等级 赋分制下,滋生科目选考投机取巧、“田忌赛马”乱象 丛生的土壤被彻底铲除,考生惟有选考自己最有竞 争优势的学科,通过不懈努力,才能实现个人选考科 目分数和高考总分的最大化。这样的等级赋分制既 能有效引导高中学生摒弃投机心理、功利主义,使得 选科取向回归到个人特长爱好、未来人生规划与社 会发展需求三者相互兼顾的核心价值观,激励学生 弘扬公平竞争、拼搏进取的高考精神,也能促进高中 学校全面贯彻教育方针,积极推进素质教育,培养合 格加特长的人才。 2.理论探索及方案设计 (1)依据选考科目分数在假设总体上的百分等 级划分选科等级 高考选考科目量表化普遍适用于各种形式的“3 +x”高考方案,其相关的理论依据、操作流程等在 《高考选考科目量表化必要性和可行性研究》 一 文中有详细阐述。高考选考科目量表化是以语数外 考试为锚测验,采用频数估计等百分位法 , ],将不 同的选考科目分数转换到同一量尺上,从而实现跨 选考科目分数的可比性。本文研究的选考科目等级 赋分方案以高考选考科目量表化原理为理论基础, 在浙沪等级赋分方案的基础上进行改进,其改进的 76一 百分等级。 第三步:依据选考科目原始分在假没总体上的 百分等级,按照预先设置的等级划分比例确定选科 等级,再按等级赋分。 (2)依据选考科目期望有效权重设计等级垤式分 规则 基于选考科目赋分呈正态分布的等级划分比例 及赋分规则设计步骤如下: 第一步:估计选考科目赋分的标准差。 目前,“3+3”新高考方案招生录取总成绩由三 门统一高考科目成绩和三门选考科目成绩合成,总 分750分。其中,统一高考科目语文、数学、外语满 分150分,总分450分;选考科目每科卷面满分1O0 分,转换为等级分按满分100分计入,等级考试科H 总分300分。统考三门与选考三门总分权重比为 0.6:0.4。考生个人高考成绩由语数外必考三¨总 分Y和选考三门科目总分x合成为高考总分z。没 语数外总分的标准差为盯 ,有效权重为∞ ,选考科 目总分的标准差为o- ,有效权重为∞ (co =1一∞ ), 两者的相关系数为P…那么,已知盯 、o- 和P 计算 选考科目总分有效权重ok 的数学表达式¨钊为 (0-x:—2 ——2+—2p—(1)+‘ xyO.xO.y 由(1)式可以看出,分测验在总分中的有效权重 与各分测验的标准差及相关系数有关。 当必考三门总分与选考三门总分的相关系数P 趋向于1,则两者的有效权重之比趋向于标准差之 比,即在相关系数足够大的情形下,考试科目的有效 权重主要取决于标准差。 假设某省语数外三门总分的标准差估计值仃 = 50.0,必考三门总分与选考三门总分的相关系数 P =0.800,设定(|) =0.400,根据(1)式求得盯 = 高考选考科目等级赋分方案设计的理论探索与实证研究 34.7。根据经验,平均值和标准差比较接近,且相关 性较好的几个科目分数合成的总分的标准差等于各 科标准差之和的0.95倍左右。据此,选考3门科目 每科标准差估计值为盯=叮 ÷3÷0.95 12。 第二步:选考等级百分比划分和赋分设计。 继续前文的示例,进行选考等级百分比划分和 等级分差为2分,赋分按正态分布设计。取标准差 or=12、平均值tx m--70,相应赋分与正态分布概率密 度函数值见表1第1、2列。由于等级分差为2分,每 个等级的人数比率应为相应赋分的概率密度值的2 倍。在理论计算的基础上作合理的调整,得到的31 等级实际赋分方案见表1右侧。按实际方案计算得 赋分设计。以浙江方案为基础,为提高赋分的精度, 将21等级改为31等级,赋分区间仍然为40—100, 到的赋分平均值为70.0,标准差为12.0,偏态系数 0,峰态系数一0.464。 表1 等级赋分理论计算与实际设计方案 理论计算 实际方案 赋分正态 概率 甏 ≥100 98 96 94 92 90 88 o.00385 0.00219 o.00318 0.00450 o.00619 o.00829 o.01079 o.8 0.4 o.6 0.9 1.2 1.7 2.2 等 级 1 2 3 4 5 6 7 赋 分 lO0 98 96 94 92 90 88 百分 比% 累积比 率% 百分 等级 o.2 0.5 0.8 1.O 1.5 2.0 2.5 lOO.o 99.8 99.3 98.5 97.5 96.o 94.0 99.9 99.6 98.9 98.0 96.8 95.0 92.8 86 84 82 80 78 76 74 72 70 68 66 64 O.0l367 0.01683 0.02016 0.02349 0.02662 o.02934 0.03145 o.03279 o.03325 0.03279 o.03145 0.02934 2.7 3.4 4.0 4.7 5.3 5.9 6.3 6.6 6.6 6.6 6.3 5.9 8 9 10 11 12 13 14 15 16 17 l8 19 86 84 82 80 78 76 74 72 70 68 66 64 3.0 3.5 4.0 4.5 5.0 5.5 6.o 6.5 7.O 6.5 6.o 5.5 91.5 88.5 85.0 81.o 76.5 71.5 66.0 60.0 53.5 46.5 40.o 34.o 90.o 86.8 83.0 78.8 74.o 68.8 63.0 56.8 50.o 43.3 37.o 31.3 62 60 58 56 54 52 50 o.02662 0.02349 o.02016 0.01683 o.01367 o.01079 0.00829 5.3 4.7 4.o 3.4 2.7 2.2 1.7 20 21 22 23 24 25 26 62 60 58 56 54 52 50 5.0 4.5 4.o 3.5 3.0 2.5 2.o 28.5 23.5 19.o 15.o 11.5 8.5 6.o 26.0 21.3 17.o 13.3 10.0 7.3 5.o 一77— 续丧 论计算 ‘§ 永ji繁 ‘ 48 46 44 42 ≤40 l 怎分 密度 率 理论“ 分比 1.2 0.9 0.6 0.4 0.8 呲 缎 27 28 29 30 31 “分 比% 1.5 1.() 0.8 ().5 0.! fj L 半 4.() 2.5 I.5 0.7 ().! “分 级 3.3 2.0 1.1 0.5 ().1 分 48 46 44 4 40 ().006l9 0.0【 5() 0.003l8 0.002l9 0.00392 合汁0.50000 1O0.0 l0(】.() Ju精细 以L没 / ̄fl<j 31等级赋分 ‘案与浙江2l等级 案 段和低分段等级划分生!J卡l】比,一足等级划分更加接近正念分布,二是在高分 案的父系 I liJ ̄,j 沦汁算 =艾际力 _图1 等级赋分理论计算与实际设计方案 3”方窠的J 址/f 分史 科,芦 足选 科H 数 和成绩汁人总分的 ‘式三、实证研究 2007 苏岛号考叶 选考 J,选芎利 H原始 科闷为『从jf J,选孑科l I成绩以 始分汁人总分,而浙 江、_f 海新I 号芍 选号科¨为 f按等级呲分计入总分 小义涉及的数据及案例来源于2007年汀苏省某 分先转换为 级.{}县级ff『高考成绩数抓2003至2007年江苏高考实行 样小总数(孑,t-.人数)8194,符项 小数据统汁 『fI的选 ‘科¨分数flI每 满分150分处 “3+2”号试科H没 方案”,“3”为语文、数学、外语 表2、丧3,』()()分,以他于模拟浙 高孑选亏科I 1赋分 J, :科,“2”为住政治、历史、地 、物理、化学、生物 理为满分l6 f J学科巾ft1考牛自主选择的两门考试科目,不分文 案以及小义没汁的选号科¨l腻分 集, 1然考 的 利. {年的 苏高号方案与浙f12、卜海新高号“3+ 选考科『I仍然址Il^j ,尤法模拟 】_ 78— 高考选考科目等级赋分方案设计的理论探索与实证研究 表2 2007年某市高考成绩统计基本数据 学科 语文 数学 英语 语数外总分 物理 化学 历史 地理 政治 生物 总分 参考人数 8194 8194 8194 8194 31l0 4339 2334 983 2602 3020 8194 平均分 100.1 89.6 106.3 296.1 66.7 70.8 74.6 73.7 66.6 75.0 508.7 标准差 10.2 27 21.3 50.6 l3.9 l5.3 13.1 12.1 8.1 13.0 80.3 偏态系数 一0.328 —0.814 —1.014 —0.771 —0.493 —0.887 —1.276 —0.989 —1.027 —1.086 —0.813 峰态系数 0.218 0.108 0.753 0.156 —0.077 0.502 1.364 0.697 1.253 1.106 0.343 表3语数外总分与选考科目考生人数累计分布比率(%) 语数外 考生人数 各选考科目考生人数累积分布比率(%) 总分分数段 累积比率(%) 物理 化学 历史 地理 政治 生物 >35O 11.4 23.0 17.4 5.2 2.3 4.7 4.6 >320 37.9 57.8 48.1 26.2 19.1 25.4 28.9 >290 61.4 79.1 71.3 48.3 42.4 49.2 55.6 分析表3可以看出,在语数外总分的高分段,选 模拟浙江21等级赋分方案获得的各选考科目的 考物理、化学的学生比率明显高于其它学科。例如, 中心矩差异很小,与理论值也十分接近,这种形式上 在选考物理的考生群体中语数外总分320分以上比 的平均看似合理,但由于忽视了选考科目的群体差 率为57.8%,而选考生物的考生群体中只占28.9%。 异,实际上并不合理。根据模拟浙江21等级赋分方 语数外成绩是学生基本学习能力最主要的反映,显然 案获得的选考科目实得分在假设总体上的频数分布, 选考物理及化学学科的考生群体是优秀生源密集的 计算出在假设总体上各选考科目赋分中心矩,如表4 群体。 所示。表4中数据客观反映了不同选考科目得分的 下面从不同层面比较不同选考科目计分方式产 真实差异,其中物理、化学学科的平均分明显低于其 生的结果。 它学科,这足以说明浙江2l等级赋分方案的不合理 1.考生总体中心矩比较 之处。 表4模拟浙江21等级赋分在假设总体上的中心矩 物理 化学 历史 地理 政治 生物 平均值 64.1 65.7 68.1 69.9 69.4 68.9 标准差 13.9 13.5 13.4 13.5 13.5 14.1 偏态 0.883 0.937 1.132 1.063 1.009 0.991 峰态 一0.603 —0.496 —0.432 —0.554 —0.559 —0.591 本文设计的31等级赋分方案,是依据选考科目 总体上的中心矩。这些数据表明,在假设总体上的各 原始分在假设总体上的百分等级进行赋分。表5所 选考科目赋分分布是比较接近的,也与设计方案的中 列数据是模拟该方案获得的各选考科目赋分在假设 心矩相近。 ..———79-—-—— 《考试研究}2018年第6期(总第71期) 表5模拟31等级赋分在假设总体上的中心矩 物理 化学 历史 地理 政治 生物 平均值 标准差 偏态 峰态 69.0 12.0 0.000 一0.474 69.1 12.0 0.000 —0.518 69.2 12.0 0.OHDO —0.500 70.8 11.9 0.000 —0.438 69.0 12.1 0.000 —0.482 69.1 l2.O 0.000 —0.467 表6所列数据是模拟新设计的31等级赋分方案 目考生群体分布相一致的得分分布,足合理的得分 获得的各选考科目考生实际得分的中心矩,其中物 分布。 理、化学学科的平均分高于其它学科,这是与选考科 表6模拟31等级赋分方案实际得分中心矩 物理 参考人数 3098 化学 4296 历史 2311 地理 980 政治 2597 生物 2994 选考两门总分 8l94 平均值 标准差 偏态 峰态 73.9 11.4 一0.098 一0.425 72.2 11.8 —0.107 —0.449 67.2 12.6 0.108 —0.544 66.0 l2.0 0.190 —0.526 67.4 l2.3 0.137 —0.544 68.2 l1.5 0.042 —0.394 139.8 22.8 —0.125 ~0.336 2.不同层次考生赋分比较 出这种赋分方案带来的不公平,对占总数90%以上的 对模拟浙江21等级赋分方案产生的考生成绩进 中等层次考生的影响尤为明显,通常物理、化学学科 行统计,获得不同层次考生在各选考科目上的实际得 的得分低于其它学科5—10分。 分,统计数据见表7。横向比较表7中的数据,不难看 表7 语数外总分与模拟浙江21等级选考科目赋分均分分布 语数外总分 400~391 390~381 380~371 370~361 360~351 350~341 340~331 330~321 人数 14 35 134 300 455 627 776 767 物理 92.1 88.5 86.8 83.3 80.3 77.3 73.8 70.7 化学 91.9 91.5 88.5 84.9 83.5 79.8 76.3 74.5 历史 地理 政治 生物 97.0 92.5 90.2 87.1 85.1 85.8 82.2 78.7 94.0 97.0 88.5 79.7 84.3 84.6 80.7 87.7 85.6 84.4 84.2 82.1 80.0 94.9 88.6 87.6 83.7 82.4 79.5 320~311 310~301 672 68l 68.9 66.9 71.0 69.0 78.1 76.2 8O.2 77.5 78.2 76.2 76.8 73.6 合计 8194 70.9 70.5 70.1 70.6 70.6 70.2 模拟新设计的31等级赋分,统计语数外总分各分数段实际样本考生取得的选考科目赋分的平均分, 80— 高考选考科目等级赋分方案设计的理论探索与实证研究 统计数据见表8。分析表8中的数据可以看出,在考 就水平的考生群体在不同的选考科目上获得相近分 生样本分布密集区,语数外总分同分数段考生取得的 数的方案设计目标。 选考科目分数相当接近,实现了具有相近基本学业成 表8模拟新设计的31等级赋分各选考科目均分分布 语数外总分 400~391 390~381 380~371 370~361 360~351 350—341 340~331 330~321 320~311 310~301 总人数 14 35 134 30O 455 627 776 767 672 681 物理 91.7 88.8 87.2 84.2 81.5 79.0 76.2 73.7 72.2 70.7 化学 90.9 90.1 87.1 84.1 82.9 79.7 76.7 75.3 72.4 70.8 历史 地理 政治 生物 92.0 89.0 85.6 82.9 81.2 81.8 77.8 74.5 73.9 72.2 91.5 82.7 73.5 78.1 78.6 74.4 74.2 71.7 91.0 82.9 81.1 80.1 79.6 77.6 75.7 73.9 72.1 89.6 83.6 83.0 78.9 77.9 75.3 73.1 70.5 3.考生个体得分比较 于其它选考科目,其结果是:物理一化学组合选考科 政治组合11.4分,在高考竞争中处于最不利地位。 在上述两种选考科目赋分方案下,语数外总分在 目总分平均分低于化学一生物组合5.3分,低于历史 321—330之间的考生在选考科目上的得分和高考总 一成绩分布统计见表9,其中物理一化学组合240人,化 模拟新设计的31等级赋分,不同选考科目组合考生 学一生物组合198人,历史一政治组合167人(还有 群体在各选考科目上得分的平均分相当接近,高考五 其它组合162人)。在浙江选考科目等级赋分制下, 门总分的平均分相差也很小,在高考竞争中处于平等 由于选考物理、化学科目的考生群体中优生比率较 地位。高,组内排名竞争激烈,获得的选考科目赋分明显低 表9语数外总分相近的三种不同组合考生在不同选科计分方式下的成绩分布 语数外 考生 总分 物理 原始分 化学 模拟浙江21 等级赋分 模拟新设计的 31等级赋分 化学 五门总分 78 477 五门总分 物理 474 76 化学 五门总分 物理 79 478 76 A1 323 71 80 A2 326 59 80 465 61 79 466 66 78 470 A3 324 77 89 490 82 91 497 82 90 496 240人平均 325.9 68.6 76.8 471.3 72.1 75.5 473.6 74.9 76.2 477.1 —81— 《考试研究))2018年第6期(总第71期) 语数外 考生 总分 化学 生物 原始分 模拟浙江2l 等级赋分 模拟新设计的 31等级赋分 生物 80 五门总分 化学 488 67 生物 五门总分 化学 85 482 70 门总分 480 Bl 330 71 87 B2 324 65 89 478 64 88 476 66 84 474 B3 322 87 95 503 88 100 510 86 96 504 198人平均 325.6 74.7 83.2 483.4 73.2 79.7 478.4 74.1 75.6 475.2 语数外 考生 总分 C1 C2 329 325 原始分 历史 77 79 模拟浙江21 等级赋分 模拟新设计的31 等级赋分 政治 72 68 政治 71 69 五门总分 历史 477 472 70 73 政治 五门总分 历史 76 73 475 471 66 68 门总分 467 461 C3 322 89 76 487 94 91 507 88 86 496 167人平均 325.5 82.1 71.8 479.5 78.8 80.2 484.5 74.6 75.9 476.1 4.不同计分方式下相关系数与测验信度比较 目总分 的信度,其余各符号的意义与前述公式棚 成套测验的综合分数的信度¨ 与各分测验的 同。显然,高考总分的信度p 与选考科目总分 的信 信度、标准差及各分测验分数问的相关系数有关。高 度p ,以及语数外总分Y和选考科目总分 的相关系 考总分的信度p 计算公式可以表示为: 数p 密切相关。 表10统计的是不同的选考科日计分方式下语数 P :l~, l~— ——— —氅 _— —_ _——————一 ,t4)斗, 外总分Y与选考科目总分X的相关系数。 其中p 表示语数外总分Y的信度,Pxx"表示选考科 表10不同计分方式下语数外总分与选考科目总分相关系数 选考科目计分方式 原始分 浙江21等级赋分 语数外总分与选考科目总分相关系数 0.730 0。757 新设计31等级赋分 基于假设总体的量表化 0.801 0.818 高考语数外三科与各选考科目存在较强的相关 高考总成绩表统计得到两门选考科目原始分总分 性,说明高考的各学科考试不仅测量了具体学科的心 语数外总分的相关系数为0.730,模拟浙江21等级赋 理特质,也测量了某种反映所有学科共同特点的心理 分方案这一相关系数为0.757,而模拟新设计的31等 特质,如学习的过程与方法,情感、态度与价值观,即 级赋分方案这一相关系数上升为0.801,这表明 1I 高考各科目具有一定广泛意义上的的同质性。依据 假设总体上百分等级的选考科目赋分具有较好的 r 一82一 高考选考科目等级赋分方案设计的理论探索与实证研究 比性和可加性,选考科目总分的意义能够得到较好的 首先需要解决的问题是改变高考方案中选考科目的 解释。基于假设总体的选考科目量表化后,这一相关 计分办法,尽量做到各选考科目计人总分的分数是公 系数上升到0.818,显然,选考科目量表化是更好的计 平的,确保高考制度本身不会对学生的选科产生消极 分方式。 的影响。 需要指出的是,科学合理的选考科目计分方式, 不仅能够提升选考科目总分与语数外总分的相关系 数,而且使得跨选考科目分数更具有可比性和可加 性,直接提高了选考科目总分x的信度,并且这两方 参考文献: [1]回顾广东高考方案调整路11年4次变脸都有理由[EB/OL]. 面因素同步影响高考总分信度。以选考科目的原始 分计人总分,高考总分的信度是最低的,实施浙江21 等级赋分方案会稍有改善,施行基于假设总体上百分 等级的选考科目赋分将显著提升高考总分信度,而基 于假设总体的选考科目量表化是更好的计分方式,可 以获得更高的高考总分信度。 5.实证研究结论 应用与高考选考科目量表化相似的原理而设计 的以语数外考试为锚测验、基于选考科目原始分数在 假设总体上百分等级的赋分方案,将不在同一常模参 照中的各选考科目原始分转换为在同一常模参照下 可比较的分数,解决了跨选考科目分数的可比性问 题,使得选考科目分数的解释和高考总分的呈现更加 科学公平,同时也提高了高考的信度。不仅如此,在 赋分方案设计中依据语数外三门总分分布的标准差 以及其它参数估计出选考科目赋分的标准差,从而保 证选考科目总分在高考总分中的有效权重在适当的 范围内,既能提升高考的选拔功能,又能发挥调整语 数外学科与学业水平测试科目在中学教学中的相对 地位的积极导向作用,有利于促进基础教育的健康发 展和学生的健康成长。 四、结语 由高考科目调整引发的不同科目成绩之间的可 比性问题,已成为高考改革面临的一个难题 j。不分 文理科的新高考模式下,实施现行的选考科目等级赋 分方案,如果选考物理、化学人数比例过低的状况得 不到有效控制,短期会影响大学相关专业的教学,长 远则会影响人才的培养和社会经济发展。因此,目前 https://www.51test.net/show/374695.html,2008,11(8). [2]选考物理化学人数仅占两成[EB/OL].http://news.sina.corn. cn/o/2006—03—28/09528548779s.shtml,2006,3(28). [3]浙江新高考选考:技术成最不受待见科目[EB/OL].http:// hangzhou.xueda.corn/News/218751.shtml,2016,10(14). [4][8]浙江高考改革实施细则出台选考科目21个等级赋分 [EB/OL].http://edu.qq.corn/a/20141114/105163.html,2014,l1 (14). [5][6][14儿l8]戴海崎,等.心理与教育测量[M].广州:暨南 大学出版社,2011. [7]浙江省深化高校考试招生制度综合改革试点方案[EB/OL]. http://edu.163.corn/14/0919/09/A6GEBAMH00294MBE—。al1.html, 2014,9(19). [9]上海市深化高等学校考试招生综合改革实施方案一360百科 [EB/OL].http://baike.SO.com/doc/7601111—7875206.html,2018,10 (8). [1O]山东省高考综合改革30问之一(1—10)[EB/OL]. http://www.sdedu.gov.en/sdjy/一ztzl/1222993/1222997/1226617/index. html,2018,3(27). [11]新高考中学业水平考试成绩转换的研究[EB/OL].http:// gaokao.eo1.cn/beijing/d0“gtai/2018Ol/t2O180126—1582644.shtml, 2018,1(26). [12]高考改革不应使选择高度复杂化[EB/OL].http://opinion. caixin.corn/2018—02—26/101213962.html,2018,2(26). [13]仲进.高考选考科目量表化必要性及可行性研究[J].考试 研究,2018,(3):19—26. [15][16][19]Kolen,M.J.,Brennan,R.J.Test Equating, Scaling and Linking:Methods and Practices(3nd ed.)[M].New York: Springer—Verlag,2014. [17]江苏省2006年普通高等学校招生工作意见[EB/OL]. http://www.zxxk.corn/article/16330.html,2018,lO(30). [2O]章建石.关于选考科目等级赋分的改进:历史经验、现实 与可能方向[J].华东师范大学学报(教育科学版),2018,(3):79一 R6 —83— 《考试研究}2018年第6期(总第71期) A Theoretical Exploration and Empirical Study on the Design of Percentile Band Score for the Elective Subject Tests of the Gaokao Zhong fin Zhong Xiayang。 Tangyang High School,Yancheng,Jiangsu,224233 2 Suzhou Technician Institute,Suzhou,Jiangsu,215009 Abstract:The percentile band score system of the elective subject tests of the Gaokao is being implemented. Because of neglecting the differences in the distribution of the examinees in the various elective subjects,there is great difference of the scores of students with similar academic ability in the different elective subjects,which exerts many negative effects.In this study,taking Chinese,Mathematics and foreign language tests as the anchor measures, the ̄equency estimation equipercentile method is used to calculate the ̄equency distribution and percentile rank of the elective subjects scores on the hypothetical population,and the scoring system is designed according to the percentile rank.The empirical study shows that the system can solve the problem of the comparability of the results of the subject tests,SO that the interpretation of the scores of the elective subject tests and the presentation of the total score of the Gaokao are more scientific and reasonable. Key words:Elective Subject Tests,Percentile Band Score,Hypothetical Population,Scores Comparable (责任编辑:吴茳) 84