亚马逊云科技为端到端机器学习服务Amazon SageMaker推出八项新功能

(全球TMT2022年12月5日讯)亚马逊云科技在2022 re:Invent全球大会上宣布,为端到端机器学习服务Amazon SageMaker推出八项新功能。

Amazon SageMaker 机器学习治理新功能

Amazon SageMaker Role Manager 可以更轻松地控制访问和权限:Amazon SageMaker Role Manager 让管理员可以更轻松地控制访问并为用户定义权限。管理员可以根据不同的用户角色和职责选择和编辑预建模板。之后,该工具会在几分钟内自动创建具有必要权限的访问策略,持续降低添加和管理用户所投入的时间和精力。

Amazon SageMaker Model Cards简化模型信息收集:Amazon SageMaker Model Cards在亚马逊云科技控制台提供了单独的位置存储模型信息,从而在整个模型生命周期中简化文档管理。新功能会自动将输入数据集、训练环境和训练结果等详细的训练信息直接输入到 Amazon SageMaker Model Cards。用户还可以使用自助问卷的形式保存模型信息(如精度目标、风险评级)、训练和验证结果(如偏差或精准度指标)以及供将来参考的观察结果,用以进一步提升治理水平、支持负责任地使用机器学习。

Amazon SageMaker Model Dashboard 提供集中界面以跟踪机器学习模型: Amazon SageMaker Model Dashboard 可以全面概览已部署的模型和端点,让专业人员只需在一个地方就可以跟踪资源和模型行为。通过模型看板,客户还可以使用内置集成的Amazon SageMaker Model Monitor(具备模型与数据偏移监控功能)和Amazon SageMaker Clarify(具备机器学习偏差检测功能)。这种对模型行为和性能的端到端可见性为简化机器学习治理流程、快速解决模型问题提供了必备的信息。

下一代Notebook

Amazon SageMaker Studio Notebook 为专业人员提供了从数据探索到部署的全托管Notebook体验。 亚马逊云科技推出三项新功能帮助客户协调和自动化Notebook代码,进一步为用户提供最佳Notebook体验。

简化数据准备:Amazon SageMaker Studio Notebook提供内置的数据准备功能,让专业人员只需点击几下即可直观地查看数据特征、修复数据质量问题,所有这一切都直接在Notebook环境中进行。当用户在Notebook中显示data frame(即数据的表格形式)时,Amazon SageMaker Studio Notebook 会自动生成图表帮助用户识别数据质量问题,提供数据转换建议帮助解决常见问题。专业人员选择数据转换后,Amazon SageMaker Studio Notebook 会在Notebook中生成相应代码,可供每次运行Notebook时重复应用。

加速整个数据科学团队的协作:Amazon SageMaker 现在为团队提供了一个工作区,成员可以在其中实时阅读、编辑和运行Notebook,简化协作和沟通。团队成员可以一起查看Notebook结果,立即了解模型性能,无需反复传递信息。Amazon SageMaker Studio Notebook支持 BitBucket 和 Amazon CodeCommit 等服务,团队可以轻松管理不同的Notebook版本,比较版本变更。实验和机器学习模型这样的附加资源也会自动保存,让团队工作井井有条。

Notebook代码自动转换为生产就绪作业:Amazon SageMaker Studio Notebook 现在让专业人员可以选择一个Notebook,将其自动化为可以在生产环境运行的作业。Notebook选择完成后,Amazon SageMaker Studio Notebook 会建立整个Notebook的快照,将其依赖项打包到容器,构建基础设施,按照专业人员设定的时间表将Notebook作为自动化作业运行,当作业完成时释放基础设施,如此可以将Notebook投入生产所需的时间从数周缩短到数小时。

使用实时推理请求自动验证新模型

Amazon SageMaker Inference让专业人员可以更轻松地实时使用相同的真实推理请求数据,将新模型的性能与生产模型的性能进行比较。现在,他们可以轻松地将测试同时扩展到数千个新模型,无需构建自己的测试基础设施。首先,客户选择想要测试的生产模型,Amazon SageMaker Inference 随后会将新模型部署到具有完全相同条件的托管环境。Amazon SageMaker 将生产模型收到的推理请求副本路由到新模型,并创建控制面板显示关键指标之间的性能差异,客户便可以实时了解每个模型的不同之处。客户一旦验证了新模型的性能并确信它没有潜在错误,就可以安全地部署它。

Amazon SageMaker全新的地理空间功能让客户可以更轻松地使用卫星和位置数据进行预测

Amazon SageMaker将客户丰富数据集、训练地理空间模型并将结果可视化的时间从数月缩短到数小时,从而加速和简化地理空间机器学习预测的生成。客户只需几次点击或使用 API就可以使用 Amazon SageMaker访问各种地理空间数据源,例如亚马逊云科技的位置服务Amazon Location Service、开放数据集Amazon Open Data、客户自有数据和来自Planet Labs等第三方供应商的数据。当专业人员选择了想要使用的数据集,他们可以利用内置的运算器将这些数据集与自己的专有数据合并起来。为了加快模型开发,Amazon SageMaker 提供了预训练的深度学习模型,其支持的用例包括通过精准农业提高作物产量、监测自然灾害后区域恢复以及改善城市规划等。训练完成后,内置的可视化工具在地图上显示数据,揭示新的预测。