亚马逊云科技提供Meta两款Llama 3基础模型
(全球TMT2024年4月19日讯)亚马逊云科技宣布,Meta刚刚发布的两款Llama 3基础模型Llama 3 8B和Llama 3 70B现已在Amazon SageMaker JumpStart中提供。这两款模型是一系列经过预训练和微调的生成文本模型,上下文长度为8k,能够支持广泛的用例,并在推理、代码生成和指令跟随等方面有所改进。
Llama 3使用了仅含解码器的Transformer架构,以及高达128k规模的新型分词器,极大提升了模型的性能。此外,Meta改进的训练后处理程序大幅降低了误拒率,提高了模型响应的一致性和多样性。Amazon SageMaker JumpStart提供预训练的模型、内置算法和预构建的解决方案,帮助客户快速开始机器学习项目。Meta Llama 3基础模型现已在Amazon SageMaker Studio的美东(北弗吉尼亚州)、美东(俄亥俄州)、美西(俄勒冈州)、欧洲(爱尔兰)和亚太(东京)区域提供部署和推理服务。
文章评论(0)