新葡亰4473官网-www.4473.vip-澳门新葡亰娱乐

2016考研大纲:心理学专业基础综合考试(7)

日期:2020-04-21编辑作者:新葡亰4473官网

图片 1

图片 2
扫码关注考研圈微信

高考“一年多考”的“分数等值”研究与实践发布时间:2016-10-09

  • 新浪教育考研栏目征稿启示
  • 2016全国高校硕士研究生招生简章
  • 2016推荐免试攻读研究生申请指南
  • 2015中国大学研究生院排行榜
  • 2015新浪五星金牌教师评选启动
  • MBA提前面试进行中,立即申请

成果公报

  8.  定向遗忘实验

华南师范大学心理学院张敏强教授主持完成了课题高考一年多考的分数等值研究与实践。课题组主要成员为:王蕾、关丹丹、焦丽亚、黎光明、简小珠、方杰和张洁婷。

  9.  提取诱发遗忘实验

内容与方法

  (六)情绪实验

1 研究内容

  1.情绪的生理指标测量

本项目通过研究及模拟数据实验找到一种有理论基础、为广大考生所接受的分数等值方法,并应用于一年多考的高考实践中去,以解决一年多次考试的不同难度的考卷分数比较及转换。基于此研究目的,开展以下研究。

  2.面部表情的测量

研究经典测验理论和项目反应理论在规模考试中分数等值的理论依据,分别基于两种测验理论探讨适用于大规模考试的分数等值理论,并进行实证比较。

  3.情绪的主观体验测量

基于IRT模型在测验等值中的应用优势,进一步探讨IRT模型框架下的等值方法。

  (七)注意实验

通过以下子研究达到目的:

  1.过滤器模型及其双耳分听实验

1构建测验等值的流程化思路;

  2.注意资源有限理论及其实验

2探讨题组测验局部依赖性的模型解决方法,优化测验等值的参数估计步骤;

  3.双加工理论及其实验

3比较和归纳量表化与等值方法,为等值方法的选用提供参考性建议。

  4.注意的促进和抑制及其正负启动实验

针对测量模型的优化、等值误差的测量与控制以及测验数据的纵向特点,分别对测量的方差分量估计、混合模型和认知诊断模型的应用与纵向数据分析方法进行拓展研究。

  5.注意的返回抑制实验

本课题研究思路如下:

  6. 刺激反应一致性理论及其冲突效应实验

2研究方法

  (八)常用心理实验技术

本研究在各等值理论方法的比较归纳基础上,结合使用实证研究与模拟研究对各等值方法进行比较。

  1. 眼动技术

2.1 等值方法

  2. 事件相关电位技术(ERP)

2.1.1基于经典测量理论的等值方法

  3. 功能性磁共振成像技术(fMRI

经典测验理论假设能力特质是潜在而相对稳定的,某能力特质的真正水平的数值为真分数T,实测的结果会围绕着真分数随测量的随机误差而在某范围内波动,即观察分数是真分数和随机误差分数的线性组合。在CTT理论框架下构成了信度、效度、难度和区分度这四个指标对测验的质量和特性进行评价,分别反映测验的稳定性、有效性和测验项目的难易程度、区分能力。基于CTT的传统等值方法包括平均数等值、线性等值、等百分位等值等。

  心理统计与测量

2.1.2 基于项目反应理论的等值方法

  【考查目标】

项目反应理论,又称潜在特质理论,采用非线性模型,建立考生对题目的作答反应与潜在特质之间的非线性关系。该测验理论有两大基本假设:1对考生所测试的潜在能力具有单维性;2在考虑了考生的能力之后,考生对各个项目的反应是相互独立的。项目反应最大的特点是,考生的能力估计不依赖于项目的难度参数,即考生的分数不会由于试题的难或容易而产生高估或低估。基于IRT的等值方法在数据收集后根据题目和数据类型选择合适的IRT模型进行IRT参数估计;然后使用某种方法,如动差方法、特征曲线转换方法(characteristic curve method)、同时校准方法进行IRT量表转换,使参数估计置于同一个量尺上;最后进行测验原始分数向量表分数的转换。

  1.正确理解心理统计与心理测量的基本概念,掌握心理统计与心理测量的基本方法。

2.2 Monte Carlo模拟研究方法

  2.掌握有关统计分析的原理和方法,能正确解释统计分析结果。

Monte Carlo模拟方法已经在应用物理、原子能、固体物理、化学、生物、生态学、社会经济学以及经济行为等领域中得到广泛应用。特别是在计算机上用Monte Carlo模拟方法解决很多理论和应用科学问题,在很大程度上可以替代许多大型的、难以实现的复杂实践或社会行为过程。

  3.掌握各种测量理论和各种测量指标的计算方法;能够正确使用各种测验,并对其结果进行解释。

结论与对策

  一、描述统计

1 基于两种测量理论的等值方法比较

  (一)统计图表

通过实证与理论研究,对经典测量理论与项目反应理论下的等值方法进行比较,得到如下结论。

  1.统计图

经典测验理论的测验等值方法存在不少困难与局限:首先,它们确定的转换关系依赖于样本,会随被试样组的不同而变化,等值条件的唯一性要求不能满足,无论哪种方法,都难以确保求出的转换关系是对称的、公平的。其次,经典测验等值方法应用重点又都在被试观察分数等值上,很难妥善解决难度、区分度这类项目参数等值的问题。最后,更重要的是,即使在线性等值的情况下,经典等值理论所认定的应予等值的测验分数间的线性转换关系,也是假设能够存在的,而不是必然能够具有的。项目反应理论却根本不同,在所选反应模型与实测资料适合良好的情况下,按项目反应理论方法所确定的被试特质与项目参数间的转换关系,就是必然应该具有的,这是因为特质与项目参数本应具有不变性。也正由于转换关系是来自模型的理论性质本身,所以,能够保证全面地较好满足唯一性、公平性、对称性等要求。另外,由于项目反应理论能同时估出特质与项目参数,特别是,项目难度又是直接定义在特质参数量纲上,因而,就能同时解决特质水平与项目参数的等值问题。所以,项目反应理论等值不仅在理论上具有优良的性质,而且在实用上具有极强的功能。项目参数等值问题的解决为大型题库的建设提供了有力的技术保证。

  2.统计表

因此,本项目进一步重点对IRT理论框架下的等值方法进行研究。

  (二)集中量数

2 基于IRT的等值技术

  1.算术平均数

2.1 IRT测验等值的流程化操作思路构建

  2.中数

测验等值是测验研究中相对薄弱的一个环节,许多重要的考试都尚未实现统计等值。造成这种窘境的原因,皆因等值操作困难化。在参考国内外关于测验等值的相关文献的基础上,构建出IRT测验等值的流程化操作思路,包括等值设计、数据收集、参数估计、量表化及测验等值等五个步骤,如下图所示。

  3.众数

进一步,对参数估计、量表化和测量等值环节作方法上改进。

  (三)差异量数

2.2 题组测验中处理局部项目依赖性的模型发展

  1.离差与平均差

在教育和心理测验领域中,题组是常用的测验建构、测验实施和评分的单元。题组是指共用同一个背景材料的一组题目。由于同一题组内的多个题目共用一个刺激材料, IRT模型的局部项目独立假他设往往难以满足,出现局部项目依赖。局部项目依赖是指对于特定能力的被试,其在某个题目上的作答影响在其他题目的作答或受其他题目作答情况的影响。

  2.方差与标准差

本研究在评述题组测验中处理LID的标准IRT方法、多级评分IRT方法、题组随机效应方法和两因子方法的基础上,以参数估计精度作为准则,对这4 种处理LID方法的效果和适用条件进行了归纳并作出相应的评析。

  3.变异系数

依据前人关于处理LID方法的研究,总结如下:当题组长度较短且题组型题目所占比例较小时,可以采用标准IRT模型进行数据分析;当题组LID为中等程度且测验包含很大部分相互独立项目时,采用多级计分IRT模型来处理LID也是可以的;当题组存在较大LID时,应当采用TRT模型和两因子模型。二者各有优点,相比两因子模型, TRT模型更节俭,但两因子模型参数估计软件运行更加简单和高效。但是,如果测验中存在局部独立项目,采用TRT模型会得到更为精确的参数估计值。

  (四)相对量数

2.3 IRT与MIRT在测验垂直等值中的应用

  1.百分位数

常用的测验等值是水平等值,是对测量同一心理特质的多个测验形式进行分数转换,要求各个测验形式之间具有同质性、等信度、难度相近、对称性、样本不变性等特点。但是,在实际应用中,常面临多个测验的难度水平有明显差异,或被评价团体的能力水平差异较大等情况。垂直等值则是针对这种情况的等值,将测试同学科、同一种心理特质的不同水平测验转换到同一个分数量尺上。它要求测验具有相似结构与高信度,但不要求测验难度相同、被试水平一致。IRT与MIRT是实现垂直等值的主要方法。

  2.百分等级

IRT的垂直等值步骤及其适用方法总结如下。

  3.标准分数

模型选择。研究者通常根据数据类型、参数估计精度和等值误差选择合适的IRT模型进行垂直等值。主要有:用于0-1 计分测验的单参数、两参数以及三参数逻辑斯蒂克模型,用于多级计分的测验的等级反应模型、分部评分模型、拓广分布评分模型、称名反应模型和评定量表模型。

  (五)相关量数

参数估计与标定。通过标定把不同的能力测验转换到同一尺度上, 即构建共同量表。常用的标定方法有同时标定和分别标定。

  1.积差相关

最常用的能力分数估计方法有极大似然估计、期望后验估计和极大后验估计。

  2.等级相关

MIRT是在IRT和因素分析的基础上发展起来的一种测验理论。两者方法和步骤类似,但仍存在以下区别:首先,模型选择方面,IRT适合单维数据,MIRT适合多维数据;其次,标定方法选取方面,数据满足单维性假设时,同时标定更具优势,一旦数据无法满足单维性假设,若采用IRT方法,分别标定优于同时标定,若采用MIRT方法,同时标定则更具优势;第三, 能力估计方法方面,关于IRT方法的研究较多,MIRT相关的研究较少。

  3.肯德尔等级相关

2.4 非等组锚题设计的IRT等值方法及其应用分析

  4.点二列相关与二列相关

本研究在非等组锚测验设计下,根据前人的模拟与实证研究,针对常用的0-1计分三参数IRT模型,对的同时参数标定、线性参数转换和固定参数标定这三大类等值方法的优缺点总结归纳如下。

  5.Φ相关

当锚题数量为中等或较大水平时,群体能力分布没有差异或差异很小时,CC和LSC的等值效果都很好,测验工作者可根据实际需要等值到哪个量尺上来选择不同的方法:当需要等值到基准组被试群体的量尺上时,可选用LSC;当需要等值到基准组和目标组合并后的被试群体的量尺上,应选用CC。

  二、推断统计

当锚题数量为中等或较大水平时,若群体能力分布差异较大时,采用CC等值效果更佳,若需转换到基准测验量尺上,可先采用CC方法估计出项目参数,再采用矩估计法转换到基准测验量尺上。

  (一)推断统计的数学基础

当锚题数量为较小水平时,使用LSC中的特征曲线法时等值效果较好。

  1.概率

当构建大型题库时,采用FIPC更为灵活、有效、省时。

  2、概率分布

样本量越大,不同等值方法的差异越小,当样本量较大时,不同等值方法的等值精度均较高,且差异很小,测验工作者可灵活选择等值方法,若对等值样本量没有信心,可参照上述四条选择合适的等值方法。

  3. 样本平均数分布

2.53PLM和3PTM对题组测验的参数等值比较研究

  4. 抽样原理与抽样方法

考虑题组形式在实际考试中的普遍性和意义,本课题基于前人研究以及课题前阶段的研究成果,引进基于题组的TRT模型-三参数题组模型。该模型由三参数逻辑斯蒂模型加入了与每个题组相关的随机影响参数扩展而来的,考虑了题组测验中的局部依赖性。对其与3PLM的参数等值效果进行比较,考察3PTM在题组等值中是否具有优越性。

  (二)参数估计

本研究给出了利用IRT特征曲线法求解等值系数的方法和具体步骤。以等值系数估计值的误差大小作为衡量标准,以Wilcoxon符号秩检验为依据,进行了Monte Carlo模拟实验。实验结果表明,对含题组的测验等值:

  1.点估计、区间估计与标准误

从被试人数、题组相依性程度,猜测度等方面比较3PTM和3PLM用于题组等值的效果,表明考虑了局部相依性的题组模型3PTM绝大部分情况下都比未考虑相依性的局部独立模型3PLM等值更为精确,绝大部分情况下优势显著。

  2.总体平均数的估计

采用6种不同的等值准则对3PTM对题组测验的等值进行研究。研究结果表明,等值系数A取值0.5-1.0之间时,SLcrit表现优于其他的等值准则。A取值为1.4-2.0之间时,Hcrit的表现最好,SQRcrit在A取值1.0-1.3之间时表现较好。SREcrit、COScrit、Wcrit占优的情况不多,胜出的范围也没有规律。

  3.标准差与方差的区间估计

3 与等值相关的一些基础研究

  (三)假设检验

针对等值误差的控制、垂直等值和等值的测验模型等问题,本项目拓展了与等值相关的基础研究。

  1.假设检验的原理

3.1概化理论的方差分量估计

  2.样本与总体平均数差异的检验

本部分研究主要探讨改善GT方差分量估计,为各种分数分布形态下测量误差的估计及误差来源的控制提供更精确的方法,进而优化等值误差。结论如下:

  3.两样本平均数差异的检验

在各种参数分布形态下,采用GIRM模型进行IRT参数估计和GT方差分量估计是可行的;在被试能力参数为标准正态分布时,GIRM模型对被试变异的估计准确性高于传统GT方法,但在均匀分布和伽马分布下略差于传统GT方法;在题目难度参数为偏态分布时,GIRM方法对题目变异估计的准确性不及传统GT方法。

  4.方差齐性的检验

Traditional方法估计正态分布和多项分布数据的方差分量相对较好,估计二项分布数据需要校正,Jackknife方法准确地估计了三种分布数据的方差分量,校正的Bootstrap方法和有先验信息的MCMC方法估计三种分布数据的方差分量结果较好。

  5.相关系数的显著性检验

关于方差分量估计及方差分量估计变异量的研究结果,不论何种数据分布形态,Bootstrap方法最优,校正的Bootstrap方法相比未校正的Bootstrap方法估计结果更为可靠。

  (四)方差分析

3.2纵向数据方法探讨

  1.方差分析的原理与基本过程

一年多考所涉及的垂直等值需要考虑数据的纵向性分析以及数据的整合分析。因此通过对纵向数据的方法性研究,开拓垂直等值的统计分析思路。结论如下:

  2.完全随机设计的方差分析

对于追踪研究的方法,样本量、测量次数和持续时间应依据理论模型和研究条件确定,当样本量受限,可适当增加测量次数和持续时间降低对样本量的要求,但样本量和测量次数应满足理论模型和统计模型的最低要求。对数据缺失问题可从研究设计、研究过程和缺失原因分析等多方面进行准备和干预。

  3.随机区组设计的方差分析

加速追踪设计可以在大型发展心理、教育研究的应用,这不但具有ALD的其他优点, 而且可获得更广泛的信息, 有利于系统探索复杂心理与行为发展的外在和内在影响因素及作用机制。

  4.协方差分析

整合数据分析有以下优点:1提高了结论的论证强度和效应的评估力度;2增加样本的异质性,提高研究的外在效度;3构建广泛的心理评估,提高对心理结构的评估力;4扩展发展研究的时间段。

  5.多因素方差分析

3.3混合模型在测验中的应用

  6.  事后检验

混合模型与测量模型的结合有助于考虑测验中的个体质化差异,使模型更贴近实际的测量数据。因此,对混合模型的理论、方法、应用以及与测量模型的结合展开研究。结论如下:

  (五) 统计功效与效果量

基于混合因素模型的方法是潜变量空间研究的主导趋势之一,而模型选择是判断潜变量空间的关键。模型选择主要受类别间的重叠程度、外显变量数目、计分方式和样本量的影响,对群组分类时应根据群组下的平均样本量nk选择模型指标。当nk40时,首选AIC3,其次是BIC,且nk最好达到50;当nk30时,建议选用BIC*或AIC,但无法保证很高的正确率。此外,在抽样中,尽可能详细地记录各种人口学变量,进而考虑群组水平样本的差异。

  (六)一元线性回归分析

混合IRT 在IRT 与LCA 的基础上继承和发展了新的优势:不仅可以通过构造分类潜变量发掘潜在的类别,还可以对不同潜在类别之间的连续潜变量进行对比研究。同时,与传统的DIF 分析方法相比,可以提炼出被试的潜在分类信息, 而不用事先假定被试的分组信息。

  1.一元线性回归方程的建立、检验及应用

成果与影响

  2.可化为一元线性回归的曲线方程

本项目针对高考一年多考的分数等值问题展开一系列的理论和方法研究。首先对基于两大测量理论下的等值方法进行比较,发现IRT等值方法的优点。然后,进一步对IRT的等值思路流程进行梳理,总结出等值的五大步骤,分别是等值设计、数据收集、参数估计、量表化及测验等值。这五步骤中的每一步所采取的方法都会影响等值的结果,其中,对于高考这种大规模考试形式基本上确定了等值设计与数据收集的方法,而对于参数估计、量表化和测验等值的方法还有待研究,这也是本项目的研究问题的关键。一方面,通过改善测量模型,来提高参数估计的精确度,例如建立适用于题组测验的题组项目反应模型,适用于垂直等值的多维项目反应模型,适用于能力的混合分布,根据不同的计分方式选择罗吉斯蒂模型、等级反应模型等。另一方面,对于等值方法的选取,需要根据锚题数量、群体能力分布差异等因素分而治之。此外,还基于概化理论这一现代测量理论,对测量误差的估计以及误差来源的控制提供更精确的方法,为等值误差的估计与控制提供研究的理论和技术铺垫。

  (七)卡方检验

本项目一般结论为:

  1.拟合度检验

第一,对于高考一年多考的分数等值,可以基于经典测量理论,通过原始分转换为标准分并使用线性转换的方法进行等值,只要对考试难度做较好的控制,等值的结果可靠,并易于被考生接受。

  2.独立性检验

第二,采用IRT的理论方法,有效地控制测量误差,建立题库,入库题目可以采用本研究中提供的等值方法,建设基于项目反应理论的项目参数等值的考试题库,在编制试题时选用等值的题目组成试卷,从而实现报告分数的等值。

  (八)非参数检验

改进与完善

  1.独立样本均值差异的非参数检验

本项目重点对等值中的参数估计与等值方法进行理论与应用研究,对于方法的理论探索,还可在以下方面进行改进完善:

  2.相关样本均值差异的非参数检验

第一,对不同的等值方法的比较,未来可考虑高考的不同题型和数据分布所形成的不同IRT模型,并基于不同模型下对等值方法进行更系统的比较。

  (九)多元统计分析初步

第二,对于不同等值方法得到的等值函数,还可以通过求取等值函数均值的方法得到新的等值函数,以减少等值误差,提高等值稳定性。未来的模拟研究可将求取等值函数均值的方法,与CC、LSC和FIPC进行比较研究。

  1. 多元线性回归分析

第三,对于含题组的测验等值问题,目前仅考察了被试人数、题组相依性以及猜测度等影响因素,还有其他一些影响因素如题组数量、参数估计误差等,还可进一步探讨。对于更为复杂的多级评分模型,如何与题组模型相结合,也是值得将来深入研究的问题。

  2. 主成分分析

第四,对于垂直等值,未来研究应纳入更多变量条件进行比较研究, 拓展方法的应用。同时,垂直等值现阶段多是在直接等值的条件下进行的,对于间接等值下不同等值方法还有待系统比较。

  3. 因素分析

此外,虽然多数模拟研究会采用等值结果对真值的修复程度、RMSD等指标,但是等值效果的评价标准问题一直是等值研究中的难点,不同的研究采用的评价标准不完全一致,确定或者寻找一种评价等值研究的一致评价标准是值得进一步研究的议题。

  三、心理测量的基本理论

五、成果统计一览表

  (一)心理测量的基础

课题组成果统计一览表

  l。心理测量的基本概念

本项目完成了由此项目资助的学术论文共28篇,其中《IRT与MIRT在测验垂直等值中的应用》是唯一指向的成果。在发表的论文中,CSSCI论文21篇,SCI 1篇;此外,硕士论文1篇。参加国际会议1次,共被收录论文23篇,同时被SSCI杂志摘要收录;参加国内学术会议2次,共被收录论文26篇。在学术期刊发表的论文列表如下,其中由负责人作为第一作者或通讯作者的文章有21篇:

  2.心理测量的特征与分类

注:* 为通讯作者。

  (二)经典测量理论

1.成果形式请注明为论文、编著、专著或教材

  1.经典测量理论模型

2.获奖情况请填写政府颁发的、省部级二等奖以上的奖励,奖项名称应与课题名称对应。

  2. 测量的信度与效度

3.决策采纳指被省部级以上党政领导机关完整采纳吸收,并附有基本材料和相关证明。

  信度的定义;信度系数的估计;信度的影响因素与改进。

  效度的定义;效度的估计;效度的影响因素与改进。

  信度和效度的关系。

  3. 心理测量的误差

  测量误差的定义;测量误差的来源及控制;测量误差的估计。

  4. 心理测验的项目分析

  难度;区分度;项目的综合分析和筛选。

  (三)项目反应理论

  1. 单维性假设与项目特征曲线

  2. 单参数模型、双参数模型和三参数模型

  3. 项目信息函数与测验信息函数

  (四)概化理论

  1. 方差分量的估计

  2. 概化系数与可靠性指数

  3. G研究与D研究

  四、心理测验及其应用

  (一)心理测验的编制技术

  1.心理测验编制的基本程序

  2.测验目标与命题双向细目表

  3.题目编制技术

  4.  测验标准化

  5.  测验等值技术

  (二)心理测验的施测

  1.测验的设计

  2.施测的程序和步骤

  (三)测验常模

  1.常模与常模团体

  2.分数转换与合成

  3.常模的编制

  4.几种常用的常模

  (四)标准参照测验

  1.标准参照测验的定义与作用

  2.标准参照测验的题目分析

  3.标准参照测验的信度与效度

  4.标准参照测验的分数解释

  (五)常用心理测验

  1.  成就测验

  2.  智力测验

  3.  能力倾向测验

  4.  特殊能力测验

  5.  创造力测验

  6.  人格测验

  7.  态度测验

  8.  兴趣测验

  9.  心理健康量表

  10. 发育量表

  (六)心理测验的应用

上一页1234567下一页

本文由新葡亰4473官网发布于新葡亰4473官网,转载请注明出处:2016考研大纲:心理学专业基础综合考试(7)

关键词:

2015年深圳中考民办普高和中职学校扩招及补录录

每个地区教育部、新区公共工作局,各有关高校: 经市教育厅批准,现将笔者市二〇一四年有的合资高花月首级职务...

详细>>

兰州中招政策引争议:高分生落榜低分可读名校

我市中考统配政策实施九年之久,统配比例从最初的5%,扩大到今年的60%,成效显著。正如十一中学生家长顾焕秀所说...

详细>>

甘肃高考改革实施方案全文 2019年启动改革

平行志愿巧设梯度提高录取率 专业选不好 危害大 少数民族地区高考招生改革研究——以云南省为例发布时间:2016...

详细>>

当前我国高校联考制度研究

自主招生高校改革不到位或被取消资格 当前我国高校联考制度研究发布时间:2016-09-13 2013年的高校自主招生即将进入...

详细>>