数据注释 SLA:供应商合同中应包含哪些内容

弱合约的成本比注释本身还要高。以下是在工作开始前保护您的人工智能项目的每一条条款。

9 min read由 DataX Power 团队提供
数据注释 SLA 供应商合同审查 — 法律文件和桌上的笔记本电脑

为什么大多数注释合约都非常薄弱

企业人工智能团队通常要花几个月的时间来选择数据注释供应商——评估质量分数、审查案例研究、协商每个标签的定价——然后签署一份两页纸的合同。该合同很少定义“98% 准确度”的实际含义、合作期间谁拥有数据,或者供应商错过最后期限时会发生什么。

结果是:争议在项目中期浮出水面,重新谈判成本高昂,而且转换几乎不可能。解决生产中的质量问题的成本比第一次获得正确注释的成本高出十倍,而一旦工作开始就修复合同条款,在商誉和项目动力方面的成本甚至更高。

本指南涵盖了数据注释 SLA 应包含的每个条款,由买方编写,并提供特定的语言和基准要求。

质量准确性条款:定义指标,而不仅仅是数字

最常见的 SLA 条款是准确度目标 – 通常为“95% 准确度”或“98% 准确度”。如果不定义测量方法,这些数字就没有意义。要求您的供应商在合同中指定以下所有内容。

  • 注释者间一致性 (IAA) 方法:Cohen 的 Kappa、Krippendorff 的 Alpha 或简单百分比一致性 - 每个方法都会为同一数据集提供不同的结果。
  • 黄金标准基准:谁创建了真实数据集、它有多大(至少 200-500 个项目)以及它的刷新频率。
  • 抽样率:根据黄金套装审核生产批次的百分比(行业标准:每批次 5-10%)。
  • 准确率下限与平均值:98% 的目标是每批次的下限还是项目平均值?每批次的地板更具保护性。
  • 缺陷分类:区分严重错误(错误的标签类别)、次要错误(边界框 5% 折扣)和外观错误(注释注释格式)。只有严重错误才应触发修复 SLA。
  • 测量频率:每天、每批次或每个里程碑——每周是生产运行可接受的最低频率。

周转时间承诺:层级和升级路径

周转 SLA 应反映您的实际业务节奏,而不是供应商的首选批量大小。根据紧急程度分层构建周转承诺,并要求合同指定错过这些级别时会发生什么。

数据标注服务的标准层级结构:

  • 标准层(默认):最多 10,000 件商品的批次在 3 至 5 个工作日内送达。
  • 优先级(激增):最多 2,000 件商品在 24-48 小时内送达,费率溢价 20-40%。
  • 批量层(> 50,000 个项目):每个项目商定的基于里程碑的交付计划以及每周进度检查点。
  • 延迟交货罚金:需要特定的罚金条款——通常每延迟一个工作日扣减 5% 的罚金,上限为批次价值的 25%。
  • 不可抗力的排除:明确定义哪些事件可以原谅迟到(停电、自然灾害),哪些事件不能(内部人员短缺)。

修改和返工政策:质量失败时谁买单

每个供应商合同都需要一个返工条款来回答三个问题:返工在什么精度水平下触发,谁承担费用,以及返工必须在什么时间范围内完成。

行业标准返工条款协商:

  • 返工触发阈值:如果批次精度低于合同约定的 SLA 下限,供应商将返工受影响的批次,无需额外付费。
  • 返工周转:返工应在该批次层原始周转时间的 50% 内完成。
  • 根本原因报告:对于任何需要返工的批次,要求在识别后 48 小时内提供书面根本原因分析。
  • 升级为更换:如果连续两个批次低于准确度下限,合同应授予在修复期间以主要供应商的费用聘请二级供应商的权利。
  • 免费返工周期上限:明确是否涵盖无限制返工,或者是否最多包含 2 次返工,额外返工按成本计费。

数据安全和合规条款

对于任何涉及个人身份信息 (PII)、医疗记录、财务数据或专有产品图像的项目,数据安全 SLA 都是不可协商的。这些是书面规定的最低限度的认证和义务。

  • ISO 27001 认证:需要当前认证的证明(不仅仅是声明),包括认证范围和最近的审核日期。
  • GDPR / PDPA / HIPAA 适用性:明确说明根据数据类型和来源地理位置管辖哪些法规。
  • 数据驻留:指定可以存储和处理数据的国家或地区。越南供应商应该能够确认数据在未经书面同意的情况下不会离开约定的司法管辖区。
  • 注释者 NDA:要求处理您的数据的所有注释者签署单独的 NDA,而不仅仅是供应商实体。
  • 数据删除协议:定义项目完成后安全数据删除的时间表和方法(最终交付后最多 30 天,提供删除证明)。
  • 违规通知:要求在发现任何可疑违规行为后 24-72 小时内发出通知,无论已确认的影响如何。
  • 子处理者披露:供应商必须披露用于处理您的数据的任何第三方工具或平台(注释平台、云存储提供商)。

定价、付款条件和范围变更条款

定价争议是注释项目失败的第二大常见原因,仅次于质量问题。使用有关报价中包含的内容以及如何处理范围变更的明确条款来保护自己。

  • 全包费率与基本费率:确认报价是否包括 QA 审核、项目管理、工具费和数据传输,或者这些费率是否单独计费。
  • 数量承诺和最低数量:许多供应商要求最低数量承诺(例如,每月 5,000 件)。了解低于它的惩罚。
  • 利率锁定期:协商在初始项目期间(通常为 6-12 个月)锁定利率。年度CPI挂钩调整合理;项目中期的临时增加则不然。
  • 变更单流程:任何范围变更(新注释类型、附加属性、格式更改)都必须在工作开始前以书面变更单形式正式确定,并附有修订后的速度和时间表。
  • 里程碑付款时间表:对于大型项目,将付款与交付里程碑和质量验收挂钩,而不仅仅是日历日期。

数据所有权、IP、模型训练权

最常被忽视的合同部分之一是知识产权所有权。许多供应商合同中的违约行为都是含糊不清的——这是故意的。明确这些条款。

  • 原始数据所有权:客户端始终保留所有输入数据的完全所有权。供应商收到有限的、可撤销的许可,仅出于注释目的处理数据。
  • 注释输出所有权:根据约定生成的所有标记数据集在交付和付款后均归客户所有。
  • 禁止培训使用:明确禁止供应商使用您的数据(原始数据或带注释的数据)来培训任何内部模型、改进自己的工具或与第三方共享。
  • 工作产品分配:在注释者可能拥有创作者权利的司法管辖区,合同应包括将所有权利分配给客户的雇佣工作条款。
  • 幸存者条款:数据所有权和禁止使用条款必须在合同终止后继续有效。

试点项目条款:单一最佳合同保护

在任何注释供应商合同中,最有效的风险缓解方法是结构化试点条款。在投入全部生产量之前,需要在标准生产条件下对 200-500 个项目进行付费试运行 - 相同的注释器、相同的工具、适用于主要项目的相同的 QA 流程。

试点结果应触发二元决策:如果准确性满足 SLA 下限,则主要参与会自动进行。如果没有,客户可以终止而不受处罚,或者通过修改质量计划协商延长试点。

如果供应商对自己的流程充满信心,并且可以避免客户犯更大的错误,那么结构良好的试点条款不会给供应商带来任何成本。任何抵制试点条款的供应商都在告诉您一些关于他们对自身质量信心的重要信息。

Data Annotation Service

Looking to operationalise the dataset thinking in this post? Our data annotation services Vietnam pod handles collection, cleaning, processing, and pixel-precise annotation across image, video, text, audio, document, and 3D point-cloud data.

携手打造 下一个里程碑

告诉我们您的挑战 – AI、数据或基础设施。我们将为项目梳理范围,并为您配置合适的团队。