澳鹏Appen:自动驾驶浪潮下,如何给技术迭代插上数据的“翅膀”?

(全球TMT2021年12月23日讯)作为澳大利亚的一家上市公司,澳鹏自1996年创建至今,始终专注于人工智能训练数据的领域,目前在语音、文字、图像和视频等标注领域已积累了25+年的经验。服务范围覆盖170多个国家,235+种语言。全球正式员工 1100+,拥有100万+全球众包资源。截至2020年,公司营收已达4.1亿的美金。

其中国分公司成立于2019年,总部位于上海,在无锡、大连、北京设有交付中心和分公司,业务广泛覆盖全中国及亚太地区,拥有1000+名交付人员。目前,澳鹏合作客户已遍及国内领先大型互联网公司与高科技企业。

作为数据行业的优质典范,澳鹏拥有强大的交付产能及资源管理优势,服务的客户和项目数以百计。澳鹏无锡、大连交付中心经验丰富的交付团队,处理过2D、3DLiDAR等各种数据和不同客户的业务需求,汽车2D和3D点云的周交付能力超过百万帧;卓越运营中心的管理模式可保证持续的高质量交付。

在自动驾驶领域,澳鹏高精度高性能的自动驾驶工具套装也是其为客户构筑海量数据资产的利器,这也是澳鹏的核心优势之一。

为了适应高速变化的市场形式,澳鹏构建了完整的数据质量全生命周期管理体系,可以从数据的采集、标注、模型训练、数据可视化、模型的部署及再训练等全过程,实现实时自动的模型再训练和改装。

其自主研发的人工智能辅助数据标注平台可支持像素级语义分割、2D图像复合标注、3D点云拉框及语义分割等功能。采标一体的任务能够实现采集-质检-标注-质检-客户验收的双向协同流程,让整个数据生产线上的各个环节实现无缝衔接。内置的多轮质检模块可以按需配置,满足不同复杂度项目的需求。

2D图像复合标注是全结构化的模型训练利器,支持点、线、框、多边型融合标注(常见工具是单模式的,点、线or折线,多边形)与连续帧;另外,此工具还支持像素级语义分割,可将图片中目标对象实例标记出来,并保证像素级的质量。其中丰富的可配置选项可灵活进行id处理,实战中可以做到10分钟/张图。

澳鹏Appen中国区市场拓展高级总监 董成介绍,澳鹏利用ML辅助标注等技术手段提高数据质量,通过预识别系统,让算法先进行预识别,再根据结果进行人为调整,最终在成本控制和质量上实现显著提升。

比如在3D点云数据中,由于车道线本身的多样性(环岛、交叉线)以及外界光照、车辆遮挡等影响,3D点云数据中的车道线标注一直是一个困难且耗时的课题。澳鹏3D点云车道线自动识别的研发是解决这一难题的重大突破。

澳鹏Appen 3D点云车道线自动识别 模型效果展示
澳鹏Appen 3D点云车道线自动识别 模型效果展示

“我们3D点云拉框可支持自动贴合、连续帧映射,及3D/2D的融合标注,具备目标预识别功能,能灵活配置数据有效性验证规则,可直接在线上让客户做最低交付粒度的验收且可无缝打回。实战中能够做到99.9%准确率, 1秒/帧的极速质检。”澳鹏Appen中国区市场拓展高级总监 董成表示。

此外,澳鹏的每个项目中除了配备专职的项目经理,还有专门的QA/质检人员,Team Leader、等层层把关质量控制;大多数项目都采用多轮质检的方案,保障数据质量无限接近完美。

值得一提的是,澳鹏内部对于安全合规的要求非常高,除了有健全的数据安全管理流程外,澳鹏还为了保障数据安全专门设置了DPO(Data Privacy Officer,数据合规官)。

所有的项目在签单、立项前都需要通过数据合规官的审核、批准,并根据数据合规的要求在项目执行中采取相应的数据保障措施。

“我们对人工智能模型所使用的数据给予最大限度的关注和保护,致力于为客户提供最高级别的数据安全标准,符合全球多项严格的数据安全资质认证。同时,我们的平台每天都会进行漏洞扫描,最大限度的保证客户数据资产安全。”澳鹏Appen中国区市场拓展高级总监 董成表示。

平台中设有权限管控、数据加密传输、PII信息加密存储等严格的数据安全管控策略,交付管理具体包括:平台进行周期性系统漏洞扫描以免受恶意代码/病毒攻击; 24x7的全球IT支持团队和紧急响应小组确保对IT事件及时响应等等。

目前,澳鹏已在全球获得ISO 27001安全认证,包括位于上海的商务和研发总部、以及无锡和大连的数据服务交付中心。全球范围内,澳鹏亦通过了GDPR,SOC 2 Type II,HIPAA等全球不同国家和地区的数据安全合规认证。