AWS发布三项全新的数据分析功能

(全球TMT2020年12月2日讯)在亚马逊云服务(AWS)举办的年度盛会 -- AWS re:Invent上,AWS宣布了三项全新的数据分析功能,这些功能可以大幅提升Amazon Redshift数据仓库的性能,使客户在数据存储间的移动和合并数据变得更加容易,并且使终端用户更便捷地利用机器学习从业务数据中获得更多价值。

Amazon Redshift AQUA(高级查询加速器)将计算能力引入存储层,提供比任何其它云数据仓库快10倍的查询性能。

AQUA for Amazon Redshift是Amazon Redshift的分布式、硬件加速缓存,这一创新可以提高新时代数据规模下的分析性能。AQUA将计算能力带到存储层,数据不必在两者之间来回移动。这使得Amazon Redshift的运行速度是其它云数据仓库的十倍。AQUA缓存可在众多节点上并行扩展和处理数据。每个节点都拥有一个由AWS设计的分析处理器组成的硬件模块,可大幅加快数据压缩、加密,以及扫描、聚合和过滤等数据处理任务。AQUA还为客户带来了额外的好处,即能够在原始存储上进行计算,节省了原本需要花费在移动数据上的时间。有了这一新的架构,以及它所带来的10倍以上的性能提高,Redshift的客户可以拥有更新的数据仪表盘,节省开发时间,他们的系统也更容易维护。AQUA的预览版现已向所有客户开放,AQUA将于2021年1月全面上市。

AWS Glue Elastic Views让开发人员可以轻松构建物化视图,在多个数据存储中自动组合和复制数据

AWS Glue Elastic Views为开发人员提供了一种新的能力,可以轻松构建物化视图(也称为虚拟表),在多个数据存储中自动组合和复制数据。AWS Glue是一种无服务器的数据准备服务,可以轻松运行用于数据分析和机器学习的提取、转换和加载(ETL)作业。通过AWS Glue Elastic Views,客户可以使用SQL创建从不同数据存储中组合数据的物化视图,AWS Glue Elastic Views负责从不同数据源来复制数据以创建物化视图。例如,客户可能会创建一个物化视图,从Amazon Aurora中提取餐厅位置信息,并将其与存储在Amazon DynamoDB中的客户评论相结合,然后在Amazon Elasticsearch Service上按位置建立一个餐厅评论搜索引擎。AWS Glue Elastic Views 将数据从每个源数据库复制到目标数据库,自动保障目标数据库中的数据更新。Elastic Views会持续监控源数据库的变化,并在几秒钟内更新目标数据库。如果其中一个源数据库中的数据模型发生了变化,Elastic Views会主动提醒开发人员,这样他们就可以更新他们的物化视图以适应变化。客户还可以使用Elastic Views将运营数据从运营数据库复制到数据湖中,近乎实时地运行数据分析。AWS Glue Elastic Views可以自动扩缩以适应工作负载的增减,确保目标数据库中的物化视图保持最新。

Amazon QuickSight QAmazon QuickSight的机器学习功能,用户可以用自然语言键入有关其业务数据的问题,并在几秒钟内获得高度准确的答案

Amazon QuickSight 是专为云计算而构建的可扩展、无服务器、可嵌入机器学习的商业智能 (BI) 服务。Amazon QuickSight 提供了现代的、交互式、自助服务式 BI 解决方案的所有优势,其功能可以轻松地将仪表盘嵌入到应用程序中,以高性价比的方式扩展,支持成千上万的客户。Amazon QuickSight的“自动叙述”功能为客户提供自动生成的简述,用通俗的语言解释和描述BI仪表盘中数据的含义,使所有用户对数据有共同的理解。客户喜欢这些通俗易懂的叙述,因为这使他们能够快速解读共享仪表板中的数据,并专注于最重要的见解。客户也喜欢用通俗的语言向他们的数据提出业务问题,并得到近乎实时的答案。

Amazon QuickSight Q让用户可以用自然语言对其所有数据提出任何问题,并在几秒钟内收到答复。要提出问题,用户只需在Amazon QuickSight Q搜索栏中输入问题。当用户开始输入问题时,Amazon QuickSight Q会提供带有关键短语和业务术语的自动补全建议,自动执行拼写检查、缩写词与同义词匹配,因此用户不必担心错别字或记不住数据的准确业务术语。Amazon QuickSight Q使用深度学习和机器学习(自然语言处理、模式理解和SQL代码生成的语义 解析)来生成数据模型,自动理解业务数据的含义和它们之间的关系,因此用户的业务问题可以得到高度准确的答案,而无需等待几天或几周来建立数据模型。由于Amazon QuickSight Q无需BI团队建立数据模型,因此用户也不限于只提出一组特定的问题。此外,因为查询会应用于所有数据,而不仅仅是预设模型中的数据集,用户可以得到更完整、更准确的答案。Amazon QuickSight Q预先根据来自不同领域和行业的数据进行了训练,如销售、营销、运营、零售、人力资源、医药、保险、能源等,因此它已被优化来理解复杂的商业语言。例如,销售用户可以问“我的销售任务完成得如何?”,或者零售用户可以问“按地区划分的周销量增长最快的产品是什么?”Amazon QuickSight Q 通过从用户互动中学习,随着时间的推移不断提高其准确性。如果Amazon QuickSight Q不理解问题中的某个短语,会提示用户从搜索栏中的建议选项下拉菜单中选择,Amazon QuickSight Q会记住该短语,以便下次交互。