跳转到内容

COE:面向教育的 CO

应用 COE 状态 分析阶段(试点筹备中) 许可 CC BY 4.0 基础 CO v1.1

COE 是 CO 在教师一侧的领域应用。它不禁止 AI 的使用,而是重新设计评估,使得学生与 AI 的协作过程让学生的判断力更加清晰可见,而非被掩盖。

核心洞见在于:既然学生无论如何都会使用 AI,就应设计这样的评估,使得「学生如何使用 AI」本身成为有价值的信号。COE 光谱为教师提供了四个层级的递进式自主度,每上升一层,评估的侧重点也随之改变。

四个评估层级,自完全由教师把控,逐步过渡到完全由学生自主:

层级名称教师设定学生设定评估对象
1完全约束五项系统组件(代理、知识、护栏、工作流、学习)仅限提示词与决策在既定约束下的思考质量
2部分自由L3 护栏、L4 工作流L1 代理、L2 知识库代理设计 + 知识架构 + 产出
3完全自由仅最基本的安全约束其余全部完整 CO 配置 + 产出 + 审议日志
4元层级不设限为他人使用而设计的配置配置的可用性(知识转移能力)
层级 1层级 2层级 3层级 4
遵循指令设计实验设计方法论教授他人

每上升一层,学生对 AI 协作配置的设计责任即相应增加。在第 4 层级,学生需为其他学生设计一套可用的配置。这是最困难的评估:它要求学生对学科与方法论均具备真正的理解。

COE 部署两类代理:

学生端(由教师配置,由学生使用):

代理角色
学科专家根据课程层次校准的学科知识
方法论向导引导学生完成作业工作流

评估端(教师侧,用于评估学生作品):

代理角色
量表评分员对照已校准标准,对每一量表维度评分
模式检测员在学生提交作品之间识别协作模式
异常标记员检测提交作品在统计特征上的异常
质量评估员对照课程基准,评估作品整体质量
摘要生成员为教师审阅生成评估摘要

COE 在架构层面应对「学生会让 AI 全部代劳」这一问题:

评估焦点发生迁移。 在第 1 层级,产出本身是关键;在第 3 层级,审议日志比产出更为重要;在第 4 层级,学生所设计配置的可用性即是评估对象。让 AI「全部代劳」必然导致审议日志贫乏、所设计的配置也难以为他人所用。

审计痕迹完整留存。 学生与 AI 的每一次交互均生成日志。模式检测员识别出偏离既定工作流的情形;异常标记员捕获统计上的离群值(例如:完成时间异常短,或各量表维度的质量异常一致)。

量表完全透明。 学生在开始作业前即可看到量表。这并非陷阱,而是明确信号:值得关注的要点在此。若所考察的是判断力,则学生必须展现其判断;AI 无法代为完成。

COE 定义两条并行工作流:

学生工作流(五阶段):

  1. 准备:接收作业、理解量表
  2. 探索:借助 AI 辅助开展主题研究
  3. 构建:产出交付物
  4. 精炼:基于自评进行修订
  5. 提交:打包并提交作品

教师工作流(四阶段):

  1. 校准:拟定量表、设定评分标准、配置反博弈参数
  2. AI 评分:评估代理对全部提交作品进行打分
  3. 审阅:教师审阅 AI 评分,在判断不一致之处进行调整
  4. 仲裁:评分者一致性核验(阈值:校准与评分之间相关度 > 0.7)

三道审批关卡要求教师在成绩最终确定前作出判断。

每一项学生动作均可追溯。COE 借助密码学审计痕迹(基于 EATP(英文)信任协议),使教师能够完整核验提交作品回溯至学生原始提示词与决策的整条链路。

  • 每一项学生动作均追溯至学生本人(而非 AI)
  • 规则定义在各 COE 光谱层级下 AI 可执行的操作范围
  • 抗篡改记录完整记载整个协作过程
  • 教师可核实:谁在何时作出了何种决策

COE 与 COL 互为补充:

  • COE 属于信任平面:教师设计约束、量表与评估标准
  • COL 属于执行平面:学生在这些约束内开展工作,产出交付物

这一分工对应 CARE(英文)中的 双平面模型(英文)。

COE 目前处于分析阶段,试点筹备中。以下链接提供当前研究版本的访问方式。

  1. 下载 COE 工作区(来自 GitHub),解压缩
  2. 打开 Claude Desktop,切换至 Cowork 选项卡,打开已解压的文件夹
  3. 输入 /start,描述你的课程与评估目标

完整安装指南(英文)逐步介绍各项步骤。