在语言学论文中,规范说明语料库来源与例句编号是确保研究可重复性和学术严谨性的关键环节,以下从语料库来源标注和例句编号规范两方面进行说明:
语料库来源标注规范
-
需明确语料库的名称、版本、建设机构及获取方式。- 语料库名称:HSK动态作文语料库(1.1版)
- 建设机构:北京语言大学
- 获取方式:公开下载(网址:xxx)
-
引用格式
根据论文引用规范(如APA、MLA或GB/T 7714),语料库应作为数据集引用。- APA格式:
张宝林. (2009). HSK动态作文语料库(1.1版)[数据集]. 北京语言大学.
- GB/T 7714格式:
张宝林. HSK动态作文语料库(1.1版)[DB/OL]. 北京: 北京语言大学, 2009[2025-10-12]. http://xxx.
- APA格式:
-
特殊说明
- 若语料库为自建,需说明语料收集方法(如抽样比例、时间范围)、标注规则及质量控制措施。
- 若语料库需授权使用,需注明授权来源及使用限制。
例句编号规范
-
编号原则
- 唯一性:每个例句需有独立编号,避免重复。
- 连续性:同一章节内例句编号连续,跨章节可重新编号或沿用全局编号。
- 层次性:若例句包含子例句,可用主编号加子编号(如(1a)、(1b))。
-
标注格式
- 独立段落:例句单独成段,段首不缩进,左右缩进4个全角字符。
- 编号位置:编号后接英文句号,再接例句内容。
(1) 今天天气很好。
- 错句标注:若例句存在错误,在编号后加星号(*)或问号(?)。
(*2) 我昨天去学校。
-
来源标注
- 若例句引自其他文献,需在句末标注出处。
(3) 他正在学习中文。(王力, 2000: 45)
- 若例句来自自建语料库,可标注语料库名称及编号。
(4) 我喜欢苹果。(自建语料库:Corpus-2025-001)
- 若例句引自其他文献,需在句末标注出处。
完整示例
语料库来源标注
本研究使用HSK动态作文语料库(1.1版)(张宝林, 2009),该语料库包含5000万字汉语学习者书面语料,覆盖初、中、高三级水平,数据通过北京语言大学官网公开获取。
例句编号与标注
(1) 我每天早上跑步。
(2) *他昨天去北京了。(时态错误)
(3) 我喜欢看电影,也喜欢听音乐。(自建语料库:Corpus-2025-002)
(4) “你吃饭了吗?”她问。(转引自吕叔湘, 1980: 23)
注意事项
- 一致性:全篇编号格式、来源标注方式需统一。
- 可追溯性:确保例句编号与语料库原文能精准对应。
- 伦理规范:若涉及个人隐私数据(如学习者信息),需匿名化处理。