参考文献聚焦“AIGC检测”中AI生成内容的标注规则,其旨在为准确识别和标注AI生成内容提供规范指导,通过明确具体的标注规则,助力区分AI生成与人工创作内容,这些规则涵盖多种场景与内容类型,涉及文本、图像等不同形式AI生成内容的判定标准与标注方式,有助于提升AIGC检测的准确性与可靠性,为相关领域研究与应用提供重要依据 。
AIGC检测中AI生成内容的标注规则
标注核心原则:透明性与可追溯性
-
显式标识
- 文字声明:在论文正文、脚注或图注中明确标注AI生成内容,
- 标注:“本段由DeepSeek生成/润色,修改占比约30%。”
- 图表标注:“Figure created using DALL-E (prompt: '光催化反应机理图'),人工验证数据准确性。”
- 格式规范:需包含工具名称、版本、使用时间及内容占比(如“AI生成内容占比15%”)。
- 文字声明:在论文正文、脚注或图注中明确标注AI生成内容,
-
隐式标识
- 技术嵌入:通过元数据或数字水印记录生成信息(如内容来源、生成时间、模型参数),确保内容可追溯至源头。
- 平台责任:AI服务提供者(如绘图平台、营销工具)需在生成内容中添加隐式标识,违反者将面临警告、罚款或暂停服务。
分场景标注规则
-
- 允许范围:文献综述润色、语法修改、非核心章节(如方法学描述)。
- 禁止范围:研究假设、创新点分析等核心内容。
- 标注要求:
- 明确工具名称及用途(如“Text generated by ChatGPT”)。
- 提供修改前后对比表(如被替换词汇与修改后词汇)。
-
图像/图表
- 允许范围:示意图、分子结构图等辅助性内容。
- 禁止范围:直接使用AI生成的实验数据图像。
- 标注要求:
- 在图注中说明生成工具及参数(如“Figure created using MidJourney (prompt: '纳米材料结构')”)。
- 声明人工验证过程(如“数据经实验复核”)。
-
数据/代码
- 允许范围:算法代码生成、统计分析辅助。
- 禁止范围:直接使用AI生成的实验数据。
- 标注要求:
- 在方法部分详细描述工具名称、版本及参数(如“代码由GitHub Copilot生成,版本v2.0”)。
- 开源代码需注明AI辅助部分(如“本代码第3-5行由AI生成”)。
学术场景特殊规则
-
期刊投稿
- SCI期刊要求:
- 禁止AI作为作者,通讯作者需对内容准确性负责。
- 启用双重审查机制(AI检测+人工复审),重点核查AI生成段落与作者贡献的匹配度。
- Elsevier政策:
- 仅允许AI用于提高可读性(如语法修改),需在致谢部分披露使用情况。
- 禁止将AI列为作者或合著者。
- SCI期刊要求:
-
高校规范
- 南京大学要求:
- 使用AI前需向导师报备,记录使用时间、指令及输出结果。
- 保留AI生成内容修改前后的版本,作为复查证据。
- 检测阈值:
- 本科论文:AIGC占比≤15%(允许少量辅助)。
- 研究生论文:AIGC占比≤5%(仅限非核心章节)。
- 关键部分(如结论)必须完全由作者独立完成。
- 南京大学要求:
违规后果与法律责任
- 学术不端认定:未标注的AI生成内容可能被判定为剽窃,触发学术审查程序。
- 法律惩戒:根据《人工智能生成合成内容标识办法》,删除或篡改标识的行为将面临警告、罚款,情节严重者追究刑事责任。
- 平台责任:AI服务提供者未履行标识义务的,需承担连带责任。
操作建议
- 使用前报备:向导师或期刊编辑说明AI使用目的、工具及环节。
- 过程留痕:记录AI交互日志(如聊天记录、操作截图)。
- 合规标注:
- 文本:在正文或脚注中说明工具及用途。
- 图表:在图注中添加生成信息及验证声明。
- 数据:在方法部分详细描述AI工具及参数。
- 人工复核:对AI生成内容进行学术可信度评估,确保内容真实性。