数字人文视域下,文学论文摘要的元数据规范受关注,元数据作为描述数据的数据,对文学论文摘要的检索、利用意义重大,在数字人文背景下,需构建统一规范,涵盖摘要基本信息如标题、作者,以及内容特征如主题、关键词等,制定此规范,能提升文学研究数据管理效率,促进学术交流与共享,推动数字人文在文学领域深入发展,为文学研究提供更精准高效的数据支持 。
在数字人文视域下,文学论文摘要的元数据规范需兼顾学术信息的精准描述与数字技术的可操作性,其核心规范可归纳为以下方面:
元数据核心元素构成的元数据应包含以下核心字段,以支持结构化描述与跨平台检索:
-
题名(Title)
- 需包含论文主标题及副标题(如有),支持多语言版本(如中英文对照)。
- 示例:
<title>数字人文视域下中国古典小说叙事模式研究</title>
-
作者(Creator)
- 记录作者姓名、所属机构及联系方式,支持多作者排序与贡献标注。
- 示例:
<creator name="张三" institution="XX大学数字人文研究中心" email="zhangsan@xx.edu"/>
-
主题(Subject)
- 采用分级分类体系(如中图法、LCSH),结合关键词与主题词表,支持多主题标注。
- 示例:
<subject classification="I207.41" keywords="数字人文,叙事模式,古典小说"/>文本(Description)** - 完整收录论文摘要内容,限制字数(通常中文≤300字,英文≤250词),避免冗余信息。
- 示例:
<description>本研究基于数字人文方法,通过构建叙事网络模型,分析……</description>
-
日期(Date)
- 记录论文提交、发表及修订日期,采用ISO 8601标准格式(如
YYYY-MM-DD)。 - 示例:
<date type="published">2025-06-01</date>
- 记录论文提交、发表及修订日期,采用ISO 8601标准格式(如
-
资源类型(Type)
- 明确文献类型(如“学术期刊论文”“学位论文”),支持自定义扩展。
- 示例:
<type>学术期刊论文</type>
-
资源标识符(Identifier)
- 分配唯一标识符(如DOI、URN),支持持久链接与引用追踪。
- 示例:
<identifier type="doi">10.1234/dh.2025001</identifier>
-
语种(Language)
- 标注摘要文本语言(如
zh-CN、en-US),支持多语种摘要关联。 - 示例:
<language>zh-CN</language>
- 标注摘要文本语言(如
-
权限管理(Rights)
- 声明版权信息与开放获取协议(如CC-BY-NC-SA),明确使用权限。
- 示例:
<rights>© 2025 作者. 本文遵循CC-BY-NC-SA 4.0协议</rights>
元数据扩展规则
为适应数字人文研究需求,可引入以下扩展字段:
-
研究方法(Methodology)
- 标注研究采用的技术或理论框架(如LDA主题模型、社会网络分析)。
- 示例:
<methodology>基于Python的LDA主题模型分析</methodology>
-
数据来源(DataSource)
- 记录数据集名称、版本及获取方式(如“中国古典小说数字语料库v2.0”)。
- 示例:
<dataSource name="中国古典小说数字语料库" version="2.0" url="http://corpus.xx.edu"/>
-
可视化结果(Visualization)
- 关联研究生成的可视化资源(如网络图、时间轴),支持多媒体元数据嵌入。
- 示例:
<visualization type="network" url="http://visual.xx.edu/fig1.png"/>
-
学科分类(Discipline)
- 结合数字人文跨学科特性,标注相关学科(如“中国语言文学”“计算机科学”)。
- 示例:
<discipline>中国语言文学; 计算机科学</discipline>
元数据标准化原则
-
一致性
遵循国际标准(如Dublin Core、MARC)与领域规范(如TEI),确保元数据互操作性。
-
可扩展性
- 通过修饰词(Qualifiers)或编码体系(Encoding Schemes)支持自定义字段,如:
<subject classification="I207.41" qualifier="数字人文扩展分类"/>
- 通过修饰词(Qualifiers)或编码体系(Encoding Schemes)支持自定义字段,如:
-
兼容性
支持多格式输出(如XML、JSON、RDF),适配不同数字人文平台(如Omeka、Gephi)。
应用场景示例
以一篇研究《红楼梦》叙事结构的论文为例,其摘要元数据可能如下:
<metadata>数字人文视域下《红楼梦》叙事网络分析</title> <creator name="李四" institution="XX大学数字人文实验室"/> <subject classification="I207.411" keywords="数字人文,叙事网络,红楼梦"/> <description>本研究基于数字人文方法,构建《红楼梦》人物关系网络……</description> <date type="published">2025-05-15</date> <type>学术期刊论文</type> <identifier type="doi">10.1234/dh.2025002</identifier> <language>zh-CN</language> <rights>© 2025 作者. 开放获取</rights> <methodology>社会网络分析(SNA)</methodology> <dataSource name="清代小说数字语料库" version="1.0"/> <visualization type="network" url="http://visual.xx.edu/hongloumeng.html"/> </metadata>
实施建议
-
工具支持
使用元数据编辑工具(如OpenRefine、OMEKA)辅助生成与验证元数据。
-
质量控制
建立元数据审核机制,确保字段完整性(如必填项检查)与语义准确性(如主题词规范)。
-
长期保存
遵循OAIS参考模型,将元数据与摘要文本一同存入数字仓储(如DSpace、Fedora),支持持久访问。
通过上述规范,文学论文摘要的元数据可实现结构化描述、跨平台共享与智能检索,为数字人文研究提供坚实的数据基础。



微信扫一扫打赏
支付宝扫一扫打赏

