重点文章推荐 |心理行为量表规范化编修：15个核心Q＆A

发布者：行为医学研究所发布时间：2026-04-15浏览次数：41

《中华行为医学与脑科学杂志》2026年4月发表程灶火等教授的文章《心理行为量表编修质量调查分析与建议》。该文对2020-2024年国内4种核心期刊383篇论文、390项心理行为量表进行质量调查，发现我国量表以引进汉化为主（78.7%）、理论构建严重不足（82.1%模糊/无），过度依赖EFA/CFA而忽视内容效度、实证效度、重测信度，且51.8%样本为非目标学生群体、代表性差等问题。作者从理论构建、条目调适、信效度、抽样方法等方面深度思考，提出规范化改进建议。

Q1：我国心理行为量表编修最突出的结构性问题是什么？

A1：最突出问题是研发模式依赖引进汉化（78.7%）、理论构建严重缺失（82.1%模糊/无），且文化调适比例极低（仅3.6%），导致量表本土化与科学性不足。

Q2：量表效度验证存在哪些明显缺陷？

A2：过度依赖EFA/CFA（报告率77.4%/94.9%），但CFA不合格率高达49.6%；内容效度严重缺失（仅5.6%报告）；实证效度证据薄弱，最低效标效度不合格率达82.8%，效标选择不规范。

Q3：量表抽样与样本代表性存在哪些问题？对结果有何影响？

A3：95.9%采用方便取样，51.8%样本为非目标学生群体，仅27.4%来自目标群体；导致样本代表性差、结果外推性低，信效度指标无法真实反映量表在目标人群中的性能。

Q4：引进/汉化量表只做翻译够吗？正确流程是什么？

A4：不够。必须遵循ITC国际测验修订指南，完整流程：

（1）明确构念与文化适配性

（2）双向翻译+文化调适

（3）认知访谈+专家评审

（4）跨文化等效性验证

（5）完整信效度检验

Q5：量表编修为什么必须有理论基础？

A5：理论决定量表测什么、维度怎么设、条目怎么写，是科学性的前提。

无理论→构念模糊→效度存疑→结果不可靠。

Q6：理论构建薄弱该怎么改进？

A6：（1）明确构念定义与理论模型

（2）修订时重新审视原理论是否适配中国文化

（3）用文献、访谈、专家咨询建立理论框架

（4）维度结构必须与理论一致

Q7：条目只靠删指标行不行？正确做法是什么？

A7：不行。不能只简单删除，要先修改再筛选。正确做法：

（1）多途径生成条目

（2）用难度、区分度、CR、CITC、项删α等多指标评价

（3）对差条目优先修改，而非直接删除

（4）做认知访谈与专家评审

Q8：只做EFA/CFA够不够？为什么要补内容效度？

A8:不够。结构效度≠全部效度。

内容效度是基石，必须用I-CVI、S-CVI量化，保证内容代表性与专业性。

Q9：EFA和CFA怎么做才规范？

A9:（1）EFA：先做KMO、Bartlett；用碎石图+平行分析/MAP定因子数；报告因子负荷、方差解释。

（2）CFA：必报χ²/df、CFI、TLI、RMSEA、SRMR；报告载荷、CR、AVE；做模型比较与跨组不变性。

Q10：实证效度差、效标不准怎么改进？

A10:（1）选用公认金标准效标

（2）同时做聚合效度+区分效度

（3）报告预测效度、筛查效能、增量效度

（4）可用多质多法(MTMM)设计

Q11：只报告Cronbach’sα够吗？

A11:不够。内部一致性≠全部信度。

必须完整报告：

（1）分维度α

（2）分半信度

（3）重测信度（含间隔时间、样本）

（4）评定者信度（如需要）

Q12：重测信度常出问题，怎么改进？

A12：必须报告，不能缺

（1）间隔7–30天为宜

（2）样本来自目标人群，不随意

（3）尽量≥0.60，优秀≥0.75

Q13：用学生样本代替目标人群有什么问题？

A13：样本不具代表性，信效度不能外推到真正应用人群，结论不可靠。

Q14：抽样怎么改进才规范？

A14：（1）优先分层整群/多阶段抽样

（2）必须来自目标人群

（3）样本量满足因素分析要求（EFA+CFA建议≥500）

（4）避免方便取样、单一学生样本

Q15：量表编修最核心的改进方向是什么？

A15：（1）强理论：先有理论，再做量表

（2）全效度：内容+结构+实证一起做

（3）全信度：补齐重测信度

（4）好样本：目标人群+科学抽样

（5）规范化：遵循COSMIN、ITC等国际指南

文章链接：孙金荣,吴越,程灶火.心理行为量表编修质量调查分析与建议[J].中华行为医学与脑科学杂志,2026,35(4):380-388. DOI:10.3760/cma.j.cn371468-20260205-00082.

（撰稿：高立责编：张敬美终审：冯学泉）