
《国际人工智能安全报告》发布关键更新,揭示AI能力提升与风险管理新动态
(全球TMT2025年10月17日讯)《国际人工智能安全报告》首次关键更新已发布,就先进人工智能的能力与风险提供了最新信息。该报告由图灵奖得主、计算机科学家Yoshua Bengio总体负责,汇集了100多位国际专家,并得到30多个国家以及包括欧盟、经合组织和联合国在内的国际组织的支持。

首个《关键更新》涵盖能力提升和风险影响:
人工智能模型在复杂问题解决能力上持续提升:例如,领先的系统现已能完成一组现实世界软件工程问题中超60%的任务。到2025年初,他们只能解决约40%的相关问题,而在2024年初他们尚无法解决任何问题。
行业参与者已经采取了新的预防性保障措施:多家主要人工智能开发商在无法完全排除其新模型可能被用于协助开发化学、生物、放射和核风险的情况下,主动为最新模型增加了额外安全措施后发布。
人工智能模型在评估过程中日益表现出策略性行为,给监管带来挑战:人工智能模型越来越可能意识到自己正在接受评估,并据此调整输出结果,这对开发人员和测试人员在部署新模型之前准确评估新模型能力的能力提出了重大质疑。
文章评论(0)