新加坡推出开源的生成式人工智能测试工具包

新加坡推出开源的生成式人工智能测试工具包

(全球TMT2024年6月3日讯)新加坡通讯及新闻部部长Josephine Teo推出了AI Verify- Project Moonshot,这是一个易于使用的测试工具包,旨在解决与使用大型语言模型(LLM)相关的安保与安全挑战。它是世界上首批开源工具之一,将红队测试、基准测试和基线测试整合在一个易于使用的平台上。

作为一个开放的测试版,Project Moonshot旨在以一种通俗易懂的方式提供有关模型或应用程序质量和安全性的直观结果。它是通过与DataRobot、IBM、新加坡电信(Singtel)、淡马锡(Temasek)等合作伙伴合作开发的。人工智能测试机构AI Verify Foundation (AIVF)和MLCommons已经签署了一份意向备忘录(MOI),以合作打造一个通用的安全基准套件。