《中华行为医学与脑科学杂志》2026年4月发表程灶火等教授的文章《心理行为量表编修质量调查分析与建议》。该文对2020-2024年国内4种核心期刊383篇论文、390项心理行为量表进行质量调查,发现我国量表以引进汉化为主(78.7%)、理论构建严重不足(82.1%模糊/无),过度依赖EFA/CFA而忽视内容效度、实证效度、重测信度,且51.8%样本为非目标学生群体、代表性差等问题。作者从理论构建、条目调适、信效度、抽样方法等方面深度思考,提出规范化改进建议。
Q1:我国心理行为量表编修最突出的结构性问题是什么?
A1:最突出问题是研发模式依赖引进汉化(78.7%)、理论构建严重缺失(82.1%模糊/无),且文化调适比例极低(仅3.6%),导致量表本土化与科学性不足。
Q2:量表效度验证存在哪些明显缺陷?
A2:过度依赖EFA/CFA(报告率77.4%/94.9%),但CFA不合格率高达49.6%;内容效度严重缺失(仅5.6%报告);实证效度证据薄弱,最低效标效度不合格率达82.8%,效标选择不规范。
Q3:量表抽样与样本代表性存在哪些问题?对结果有何影响?
A3:95.9%采用方便取样,51.8%样本为非目标学生群体,仅27.4%来自目标群体;导致样本代表性差、结果外推性低,信效度指标无法真实反映量表在目标人群中的性能。
Q4:引进/汉化量表只做翻译够吗?正确流程是什么?
A4:不够。必须遵循ITC国际测验修订指南,完整流程:
(1)明确构念与文化适配性
(2)双向翻译+文化调适
(3)认知访谈+专家评审
(4)跨文化等效性验证
(5)完整信效度检验
Q5:量表编修为什么必须有理论基础?
A5:理论决定量表测什么、维度怎么设、条目怎么写,是科学性的前提。
无理论→构念模糊→效度存疑→结果不可靠。
Q6:理论构建薄弱该怎么改进?
A6:(1)明确构念定义与理论模型
(2)修订时重新审视原理论是否适配中国文化
(3)用文献、访谈、专家咨询建立理论框架
(4)维度结构必须与理论一致
Q7:条目只靠删指标行不行?正确做法是什么?
A7:不行。不能只简单删除,要先修改再筛选。正确做法:
(1)多途径生成条目
(2)用难度、区分度、CR、CITC、项删α等多指标评价
(3)对差条目优先修改,而非直接删除
(4)做认知访谈与专家评审
Q8:只做EFA/CFA够不够?为什么要补内容效度?
A8:不够。结构效度≠全部效度。
内容效度是基石,必须用I-CVI、S-CVI量化,保证内容代表性与专业性。
Q9:EFA和CFA怎么做才规范?
A9:(1)EFA:先做KMO、Bartlett;用碎石图+平行分析/MAP定因子数;报告因子负荷、方差解释。
(2)CFA:必报χ²/df、CFI、TLI、RMSEA、SRMR;报告载荷、CR、AVE;做模型比较与跨组不变性。
Q10:实证效度差、效标不准怎么改进?
A10:(1)选用公认金标准效标
(2)同时做聚合效度+区分效度
(3)报告预测效度、筛查效能、增量效度
(4)可用多质多法(MTMM)设计
Q11:只报告Cronbach’sα够吗?
A11:不够。内部一致性≠全部信度。
必须完整报告:
(1)分维度α
(2)分半信度
(3)重测信度(含间隔时间、样本)
(4)评定者信度(如需要)
Q12:重测信度常出问题,怎么改进?
A12:必须报告,不能缺
(1)间隔7–30天为宜
(2)样本来自目标人群,不随意
(3)尽量≥0.60,优秀≥0.75
Q13:用学生样本代替目标人群有什么问题?
A13:样本不具代表性,信效度不能外推到真正应用人群,结论不可靠。
Q14:抽样怎么改进才规范?
A14:(1)优先分层整群/多阶段抽样
(2)必须来自目标人群
(3)样本量满足因素分析要求(EFA+CFA建议≥500)
(4)避免方便取样、单一学生样本
Q15:量表编修最核心的改进方向是什么?
A15:(1)强理论:先有理论,再做量表
(2)全效度:内容+结构+实证一起做
(3)全信度:补齐重测信度
(4)好样本:目标人群+科学抽样
(5)规范化:遵循COSMIN、ITC等国际指南
(撰稿:高立 责编:张敬美 终审:冯学泉)

