跳转到内容

CARE:协作自主反思企业

版本 2.1 状态 已发布 许可 CC BY 4.0 类型 哲学

随着自主系统承担越来越多具有后果的工作,组织面临一个结构性问题:如何在不牺牲自主带来的收益的前提下,维持人类的监督。既有的做法(伦理指引、合规清单、监控仪表盘)处理的是表象,而非架构。Jobin、Ienca 与 Vayena(2019)分析了全球 84 份人工智能伦理指引,发现这些文件在高层价值上趋同,在实施路径上却持续分歧。

CARE 回应这一问题的方式,是界定一套治理架构,而不是再提出一组原则。

两个运行平面。 信任平面治理政策、约束与监督。执行平面处理实际工作。这种分离确保治理决策是被审慎做出的,而不是运营逻辑的副产品。

五个约束维度。 每一个自主行为都在以下五个维度定义的边界之内运行:

  1. 财务: 支出限额、预算分配、成本阈值
  2. 运营: 允许动作的范围、资源访问、系统边界
  3. 时间: 时间限额、调度约束、截止期执行
  4. 数据访问: 可读取、写入或共享的数据范围
  5. 沟通: 系统可以联系的对象,以及可使用的渠道

反思性改进。 CARE 并非一套静态的政策框架。它包含反馈回路,使治理能够基于观察到的结果持续演化:在风险浮现处收紧约束,在信任得到验证处适度放宽。

CARE 规定治理架构。它不规定信任验证的密码学机制(那是 EATP)、代理协调的工作流模式(那是 CO),也不规定组织应当采用的具体政策。CARE 提供政策得以运作的结构;具体政策本身仍是组织自身的决定。

这套架构能否在真实的机构压力下、在规模化条件下成立,目前仍是经验问题。基金会的自托管提供了一个数据点,但不是可推广性的证明。

CARE 规范按 CC BY 4.0 发布。参考实现为 PACT Platform(英文),以 Apache 2.0 许可的可用开源软件形式提供。

完整规范

CARE 论文完整版:形式化的治理架构、双平面模型、镜像命题、约束维度、反思性改进、可证伪条件与限制。

阅读完整规范 →