越南人工智能国家战略:第 57 号决议对数据标注外包意味着什么

越南的目标是到 2030 年成为东盟人工智能前三名,并已投入政府资源以实现这一目标。这对于注释服务的国际买家意味着什么。

9 min read由 DataX Power 团队提供
越南人工智能国家战略——河内科技工作者开发人工智能标注服务

第 57 号决议实际上说了什么

越南共产党中央委员会于 2024 年底发布的第 57-NQ/TW 号决议将人工智能和数字技术发展确定为国家战略优先事项,其政治影响力相当于 20 世纪 80 年代的经济改革计划。该决议设定了具体的、可衡量的目标,而不是雄心勃勃的语言。

总体目标包括:到2030年将越南跻身东盟人工智能能力排名前三的国家之列,到2030年培养10万名人工智能专业工程师和研究人员,将GDP的2%至3%用于科学技术研究(历史上这一比例不到0.5%),并将越南打造成人工智能数据服务的区域中心。

这些不是预测,而是带有相关预算分配、部级实施责任和绩效报告要求的政策承诺。实施工作已经开始。

越南人工智能劳动力:现状

在评估第 57 号决议将产生什么结果之前,了解越南当前的人工智能和技术劳动力状况很有用。这些数字比大多数国际买家意识到的要强。

  • 目前,越南科技行业雇用了 650,000 多名 IT 专业人员,使其成为全球排名前五的软件外包目的地之一。
  • 越南软件工程师的人工智能工具采用率高达 94.3%,是东南亚最高的国家之一,与发达市场的工程人口相当。
  • 目前已有 57 所大学和机构提供人工智能相关学位课程,自 2022 年以来,入学人数每年增长 30-40%。
  • 越南的人均人工智能研究论文数量(相对于研究人口)排名全球第六,高于几个七国集团国家。
  • 具体而言,注释劳动力:目前越南各地估计有 80,000-120,000 人从事人工智能数据服务工作,主要集中在河内(技术中心)、胡志明市(初创生态系统)和岘港(新兴技术走廊)。

第 57 号决议对注释供应商质量的影响

对于数据注释服务的国际买家来说,第 57 号决议最直接相关的影响是对未来 3-5 年可用注释劳动力的质量和深度。三项具体政策变化已经产生了可衡量的效果。

第一,强制性人工智能课程整合。从 2025 年开始,所有越南大学工程课程都必须至少包含人工智能和数据科学部分。这意味着注释器管道越来越多地由具有真正机器学习背景的毕业生组成——他们了解注释的用途,而不仅仅是如何执行机械标记任务。

二是标注平台投入。科学技术部资助了越南语注释平台和质量工具的开发,减少了对针对英语注释工作流程优化的西方市场平台的依赖。

三是大力推进ISO认证。作为国家人工智能战略的一部分,越南政府为数据服务中小企业提供 ISO 27001 和 ISO 9001 认证补贴。这催生了更多满足企业买家所需的安全认证要求的供应商。

数据安全和知识产权保护:国际买家需要了解的内容

国际买家在考虑越南注释供应商时最常见的担忧之一是数据安全和知识产权保护。第 57 号决议通过具体的政策变化直接解决了这一问题。

越南于2019年颁布了《网络安全法》,并随后发布了实施条例,使技术服务提供商的数据安全义务符合国际标准。处理外国客户数据的服务提供商的数据处理义务现在受到明确监管,而不是临时监管。

越南知识产权法的知识产权保护显着改善。越南是《伯尔尼公约》、《TRIPS 协定》和多项双边知识产权保护条约的签署国。执法仍然不如发达市场司法管辖区可靠,但合同知识产权保护(包含在任何结构良好的合作的供应商合同部分中)在法律上是可执行的。

  • 数据驻留:越南供应商可以根据明确的数据驻留协议进行运营,规定客户数据不会离开商定的司法管辖区。这得到了越南数据本地化监管框架的支持。
  • ISO 27001:现在越来越多的越南注释供应商持有 ISO 27001 认证。验证认证的货币和范围,而不仅仅是声明。
  • GDPR 合规性:对于越南供应商处理的欧洲客户数据,GDPR 的传输机制适用。标准合同条款 (SCC) 是大多数业务的实用机制。
  • 合同 IP 分配:结构良好的供应商合同将所有注释输出所有权分配给客户端,并明确禁止供应商将客户端数据用于模型训练或任何其他目的。

成本比较:越南与其他主要注释市场

注释成本由三个变量驱动:注释者所在位置的劳动力成本、质量(以该成本可实现的准确度水平)和通信开销(跨时区和语言障碍工作需要多少协调成本)。

越南在全球注释市场中的地位与众不同,因为它在所有三个方面都对亚太地区买家具有有利的竞争优势。

  • 每小时注释人工成本:越南 8–18 美元/小时(专业、质量管理团队)、菲律宾 7–15 美元/小时、印度 6–14 美元/小时、东欧 18–35 美元/小时、美国/英国/澳大利亚 40–90 美元/小时。
  • 准确度为 98% 的有效成本(包括返工):由于特定文化注释任务的返工率较低,在亚太地区特定内容上,越南的管理团队通常比同等印度团队便宜 20-35%。
  • 亚太地区买家的时区优势:越南(UTC+7)与澳大利亚买家(AEST UTC+10/11)、泰国买家(UTC+7)和新加坡/马来西亚买家(UTC+8)有5-8小时的工作日重叠。印度供应商(UTC+5:30)与该买家群体的重叠时间减少了 2-3 小时。
  • 英语水平:越南英语水平指数得分为 563(中等水平)——高于东盟平均水平,足以进行所有注释指南沟通和项目管理,无需翻译开销。

第 57 号决议没有解决的问题:诚实的限制

对越南人工智能战略地位的可信分析必须承认政策雄心尚未弥合的差距。

第一,专业领域深度。越南的注释队伍在通用计算机视觉、自然语言处理和标准分类任务方面实力雄厚。对于高度专业化的领域——ADAS LiDAR注释、DICOM医学成像、复杂的法律文件注释——专业劳动力比印度或成熟的西方市场要浅。这一差距正在缩小,但尚未缩小。

其次,一级客户参考。越南的注释供应商通常拥有亚太地区的企业客户,而不是《财富》500 强北美或欧洲客户。对于采购流程需要全球品牌参考客户的买家来说,这仍然是一个限制。

三是厂商集中度风险。越南标注产业发展迅速,但仍集中在河内和胡志明市。任何一个城市的重大供应方中断都会同时影响多个供应商,而全球分布的供应商基地则不可能做到这一点。

这些限制是真实存在的,应该考虑到大型、长期注释项目的风险评估中。它们并不能抵消大多数亚太地区注释工作负载的成本、质量和时区优势,但值得诚实地承认而不是最小化。

选择越南注释供应商:要验证什么

鉴于越南注释供应商市场的快速增长,质量参差不齐。第 57 号决议扩大供应商供应的速度快于市场为买家发出可靠质量信号的速度。这些是最重要的验证步骤。

  • ISO 27001 证书:在认证机构的公共登记处验证证书编号、颁发机构和到期日期。 ISO 27001 的许多声明只是一种愿望,而不是经过认证的。
  • 团队任期数据:询问平均注释者任期和自愿离职率。真正的管理团队供应商将分享这一点。无法生产这种产品的供应商可能会在人群密集的地方进行营业额较高的业务。
  • 您所在地区和领域的参考客户:为您所在行业或数据类型的客户请求 2-3 个参考联系人。对于大多数买家来说,亚太地区的参考资料比全球的参考资料更相关。
  • 试点项目协议:任何可靠的越南注释供应商都应在生产承诺之前提供结构化付费试点。对此的抵制是一个危险信号。
  • 数据处理演示:要求供应商使用您的数据类型演示他们的数据摄取、注释、QA 和交付流程。演练揭示了文档所没有的操作成熟度。
Data Annotation Service

Looking to operationalise the dataset thinking in this post? Our data annotation services Vietnam pod handles collection, cleaning, processing, and pixel-precise annotation across image, video, text, audio, document, and 3D point-cloud data.

携手打造 下一个里程碑

告诉我们您的挑战 – AI、数据或基础设施。我们将为项目梳理范围,并为您配置合适的团队。