常包含实验设计、被试、工具及统计方法描述,实验设计明确研究框架与变量关系;被试部分说明参与者来源、数量及特征;工具介绍测量或观察所用具体材料、设备;统计方法则阐述如何分析数据,如使用t检验、方差分析等,以检验假设、确定变量间关系,这些要素共同构成实验基础,确保研究科学、有效。
被试、工具与统计方法
被试选择与控制
-
代表性取样
被试需代表目标人群特征,明确界定纳入标准(如年龄、性别、教育水平)和排除标准(如精神疾病史),学习困难研究需定义“学习困难”的量化标准(如IQ分数、学业成绩排名),盲聋儿童研究需区分先天性与后天性障碍。 -
匹配与分组
实验组与对照组需在关键变量上匹配(如认知能力、社会经济背景),单被试实验设计通过重复测量同一被试,消除个体差异干扰,但需控制顺序效应(如交替呈现实验条件)。 -
样本量与伦理
预先通过功效分析确定最小样本量,避免因样本不足导致统计效力低下,实验需遵守伦理原则,包括知情同意、隐私保护及退出权。
实验工具与技术
-
刺激呈现与反应记录
- E-Prime软件:全球广泛使用的实验设计平台,支持文本、图像、视频、声音的毫秒级精确呈现,兼容EEG、眼动仪等生理设备同步记录。
- Chronos硬件:配套设备,验证显示器时序、捕捉被试反应时间及声音刺激 onset 时间,确保数据可靠性。
- 远程实验:通过E-Prime Go实现线上数据收集,被试完成实验后数据自动加密上传,适应特殊时期或大规模研究需求。
-
多模态数据整合
结合行为数据(如反应时、正确率)与生理信号(如EEG、fNIRS),通过LSL(Lab Streaming Layer)协议实现多设备时间同步,提升研究生态效度。
统计方法与数据分析
-
描述性统计
计算均值、标准差、频率等指标,初步探查数据分布(如反应时是否符合正态分布),识别异常值(如通过箱线图、Z分数检验)。 -
推论性统计
- t检验:比较两组独立样本(如治疗组 vs. 对照组)或配对样本(如同一被试前后测)的均值差异。
- 方差分析(ANOVA):处理多组比较(如单因素ANOVA)或重复测量设计(如球形性假设检验及Greenhouse-Geisser矫正)。
- 混合效应模型:分析层级数据(如被试内重复测量+被试间分组),控制个体差异与时间效应。
-
效应量与置信区间
报告Cohen's d(组间差异)、η²(ANOVA效应量)或标准化β系数(回归分析),结合置信区间评估结果实际意义,避免仅依赖p值。 -
高级分析技术
- 贝叶斯分析:利用先验信息更新后验概率,适用于小样本或复杂模型,提供直观的不确定性描述。
- 非参数检验:当数据不满足正态性假设时,采用Mann-Whitney U检验、Kruskal-Wallis检验等。
- 重抽样方法:通过自助法(Bootstrap)估计置信区间,提升对非对称分布的鲁棒性。
实验设计类型与适用场景
-
被试间设计
不同被试分配至不同实验条件,适用于耗时较长或可能产生学习效应的任务(如技能训练研究),需通过随机化控制组间差异。 -
被试内设计
同一被试接受所有实验条件,节省样本量且控制个体差异,但需抵消平衡顺序效应(如ABBA顺序呈现刺激)。 -
混合设计
结合被试间与被试内变量(如“组别×时间点”),分析主效应与交互效应,适用于纵向干预研究(如药物治疗前后对比)。 -
单被试设计
通过基线期(A)与干预期(B)的重复测量,评估自变量对个体行为的影响,适用于罕见行为研究(如自闭症儿童社交反应)或反例验证(如推翻“强化增加反应”假设)。
数据质量与结果解释
-
数据清洗
处理缺失值(多重插补、模型层面处理)、异常值(鲁棒统计方法)及数据变换(如对数变换改善正态性)。 -
结果透明性
预先注册研究计划(如OSF平台),公开数据与代码,避免“数据挖掘”导致的假阳性,报告时区分统计显著性与实际意义,结合效应量与置信区间讨论结果。 -
局限性讨论
分析样本代表性、测量工具信效度及潜在混淆变量(如年龄、性别)对结果的影响,提出未来研究方向。
示例:一项关于正念训练对焦虑影响的研究中,研究者通过E-Prime设计实验,记录被试在基线期与干预期的反应时与EEG数据,采用重复测量ANOVA分析时间主效应,并通过η²评估干预强度,最终结合置信区间讨论结果的临床意义。



微信扫一扫打赏
支付宝扫一扫打赏

