文献计量分析论文的关键词共现网络构建:CiteSpace操作指南
一、数据准备与预处理
数据来源
WoS:选择“Full Record and Cited References”,导出为纯文本格式(.txt)。
CNKI:选择“Refworks”格式,导出文件命名规则为 download_XXXX.txt。
核心库检索,使用英文引号限定关键词组合(如 "case study" AND "management")。
手动剔除无关文献(如会议摘要、书评、综述等)。
推荐数据库:Web of Science(WoS)、中国知网(CNKI)、Scopus等权威学术数据库。
检索策略:
导出格式:
数据清洗
去重:使用CiteSpace自带功能或Excel宏删除重复文献。
标准化:统一关键词拼写(如“management”与“managements”合并)。
筛选:保留核心期刊文献,确保数据质量。
二、CiteSpace软件操作流程
软件安装与启动
下载地址:CiteSpace官网(支持Windows/Mac)。
安装注意:Mac用户需处理“app已损坏”问题(参考官网FAQs代码修复)。
数据导入与转换
创建文件夹结构:
主文件夹/├── data/ # 存储转换后的数据├── input/ # 存储原始下载数据├── output/ # 存储转换中间文件└── project/ # 存储项目文件
格式转换(以CNKI为例):
点击菜单栏 Data → Import/Export → CNKI。
选择 Input Directory(input文件夹)和 Output Directory(output文件夹)。
点击 CNKI Format Conversion(3.0),将转换后的文件复制到 data 文件夹。
新建项目与参数设置
Time Slicing:根据文献时间范围设置(如2010-2025年,Years Per Slice=1)。
Node Types:选择 Keyword(关键词共现分析)。
Pruning:选择 Pruning sliced networks(简化网络结构)。
项目创建:
参数配置:
点击 New,设置项目名称、Project Home(project文件夹)、Data Directory(data文件夹)。
选择数据源(如CSSCI)。
生成关键词共现网络
节点大小:反映关键词出现频率(越大越高频)。
标签大小:通过 Labels → Keyword 调整。
颜色映射:使用 Colormap 区分不同关键词簇。
运行分析:
点击 GO,再点击 Visualize,生成初始网络图。
调整可视化参数:
三、网络分析与解读
关键节点识别
度中心性(Degree):节点连接数,反映重要性。
介数中心性(Betweenness):节点作为桥梁的能力。
特征向量中心性(Eigenvector):节点与高影响力节点的连接强度。
中心性分析:
操作:在左侧数据栏查看 Centrality 值,筛选高值节点(如 Centrality > 0.1)。
聚类分析
Silhouette值(S值):>0.5表示聚类合理。
模块化指数(Modularity Q):>0.3表示网络结构显著。
自动聚类:
结果解读:每个聚类代表一个研究主题(如#0 战略管理、#1 人力资源管理)。
点击聚类图标(🔵),输入 K 启动自动聚类。
评估指标:
时间轴分析
操作:选择 Timeline View,展示关键词随时间演变的趋势。
应用:识别研究热点的兴起与衰落(如“数字化转型”在2015年后成为热点)。
突现词检测
Year:首次出现年份。
Strength:突现强度(值越高,关注度越高)。
红色线段:关键词成为热点的时间段。
操作:点击 Burstness,设置参数(如降低 Y[0,1] 值以获取更多突现词)。
结果解读:
四、结果导出与报告撰写
导出格式
图片:支持PNG、SVG、PDF等格式。
数据:导出节点和连边数据(如GML格式)供进一步分析。
报告撰写建议
结合网络图与表格,展示高频关键词、中心性指标、聚类结果。
通过时间轴与突现词分析,揭示研究趋势与前沿。
研究背景:明确研究问题与目的。
方法部分:详细描述数据来源、CiteSpace参数设置。
结果部分:
讨论部分:对比现有文献,解释结果的理论与实践意义。
五、常见问题与解决方案
数据量过大导致卡顿
解决方案:缩小时间范围或增加切片长度(如 Years Per Slice=2)。
关键词歧义问题
解决方案:手动合并同义词(如“HR”与“Human Resource”)。
网络结构复杂难解释
解决方案:结合聚类分析与时间轴,分主题、分阶段解读。