数字人文视域下,文学论文摘要的元数据规范受关注,元数据作为描述数据的数据,对文学论文摘要的检索、利用与管理意义重大,在数字人文背景下,传统元数据规范面临挑战,需适应新环境,制定科学合理的元数据规范,涵盖论文基本信息、研究主题、方法、成果等关键要素,能提升摘要质量与利用效率,促进文学研究数字化发展,为学术交流与知识传播提供有力支撑 。
在数字人文视域下,文学论文摘要的元数据规范需兼顾学术资源的结构化描述需求与数字人文研究的跨学科特性,其核心规范框架可归纳为以下方面:
元数据核心元素构成
-
基础标识类
- 题名:需包含论文主标题及副标题(如有),支持多语言版本标注。
- 唯一标识符:采用DOI(数字对象标识符)或机构内部唯一编码,确保资源可追溯性。
- 资源类型:明确标注为“文学论文摘要”,支持细分如“古代文学”“比较文学”等学科标签。 描述类**
- 摘要文本:结构化呈现研究目的、方法、结果及结论,建议分段标注(如“研究背景”“文本分析方法”)。
- 选取3-5个核心术语,优先使用《中国图书馆分类法》或《汉语主题词表》规范词,支持自定义标签(如“数字修辞”“赛博文本”)。
- 主题分类:结合数字人文研究维度,增设“文本形态分析”“算法审美”“跨媒介叙事”等特色类别。
-
创作与出版信息
- 作者:包含姓名、所属机构、ORCID(开放研究者与贡献者身份识别码),支持多作者排序及角色标注(如“第一作者”“通讯作者”)。
- 出版信息:记录期刊名称、卷期号、出版年份、页码范围,电子资源需标注URL及访问日期。
- 版权声明:明确开放获取协议(如CC-BY 4.0)或使用限制,保障数据合规性。
-
数字人文关联信息
- 研究方法:标注是否使用LDA主题模型、文本挖掘、可视化工具(如Gephi)等数字技术。
- 数据来源:说明文本语料库名称(如“中国现当代文学作品库”)、数据规模及获取方式。
- 技术参数:记录算法模型参数(如主题数量、迭代次数)、可视化图表类型(如词云图、共现网络图)。
元数据扩展规则
-
横向扩展
- 允许新增元素以描述数字人文特色,
数字工具:记录使用的软件名称及版本(如“Python 3.8”“Stanford CoreNLP”)。跨学科关联:标注相关学科领域(如“计算机科学”“认知语言学”)。
- 新增元素需避免与核心元素语义重复,并参考Dublin Core、MARC等国际标准。
- 允许新增元素以描述数字人文特色,
-
纵向扩展
- 通过修饰词细化元素语义,
主题.数字人文:限定主题领域为数字人文研究。日期.数据采集:区分论文发表日期与数据采集日期。
- 编码体系修饰词需采用控制词表(如ISO 8601日期格式、ISO 639-2语言代码)。
- 通过修饰词细化元素语义,
元数据应用规范
-
多载体兼容性
- 支持印刷版与电子版论文摘要的统一描述,电子版需额外标注:
格式:PDF/A、XML、EPUB等。文件大小:以KB或MB为单位。校验码:MD5或SHA-1值,确保文件完整性。
- 支持印刷版与电子版论文摘要的统一描述,电子版需额外标注:
-
附加资源管理
- 对论文相关的实验数据、代码、多媒体材料(如音频解读、动态可视化)进行关联描述:
附加资源.题名:记录资源名称(如“《红楼梦》人物关系网络数据”)。附加资源.格式:标注资源类型(如“.csv”“.mp4”)。附加资源.访问路径:提供下载URL或持久化标识符(如Handle系统链接)。
- 对论文相关的实验数据、代码、多媒体材料(如音频解读、动态可视化)进行关联描述:
-
权限与伦理规范
- 明确数据使用权限(如“仅限学术研究”“禁止商业用途”)。
- 对涉及个人隐私或版权保护的文本内容,标注脱敏处理说明或授权信息。
实践案例参考
- 学位论文元数据规范:
复用Dublin Core的12个核心元素(题名、作者、主题等),并增设“学位”“馆藏信息”等个别元素,支持印刷本与电子版的混合描述。 - 非遗数字资源元数据:
根据资源类型(如民间文学、传统手工艺)定义特色元素,同时兼容国际通用标准(如CDWA、LIDO),实现跨领域数据共享。
标准化挑战与趋势
- 技术挑战:需适应人工智能、区块链等新兴技术对元数据结构的影响,例如通过智能合约自动验证数据来源。
- 国际合作:推动中文元数据标准与DCMI、Schema.org等国际体系的互操作,提升全球数字人文资源整合效率。
- 用户友好性:开发可视化元数据编辑工具,降低研究者标注门槛,促进规范普及。



微信扫一扫打赏
支付宝扫一扫打赏

