浪潮信息发布基于“源1.0”大模型生成的4个技能大模型

(全球TMT2022年7月1日讯)近日,浪潮信息发布了基于"源1.0"大模型生成的4个技能大模型(Skill Model),分别为对话模型"源晓问"、问答模型"源晓搜"、翻译模型"源晓译"、古文模型"源晓文"。这些技能大模型在各自细分领域的精度业界领先,可直接应用于人机交互、知识检索、语言翻译和文学创作等领域,模型运行速度最高提升9倍。更重要的是,基于大模型快速生成特定领域的技能大模型(Skill Model),也意味着"源"的AI生产力大幅升级,能够帮助商业组织和研究机构实现对AI技术的高效、快速和低成本应用,加速产业AI化。

对话模型("源晓问")在源大模型基础上,又采用了2660万条医疗、法律、保险等不同行业,历史、电影、娱乐等不同场景的对话语料数据进行强化训练,在高频闲聊、知识问答等开放式问答对话上表现突出。翻译模型("源晓译")基于源大模型阅读的海量高质量数据集,采用维基百科、书籍、联合国文件及字幕组等近80G高质量数据集进行强化训练,因此翻译不但流畅准确,同时更符合中文表述,在中译英时表述更加专业地道,可轻松应对日常对话、新闻、哲学、小说等日常的语言翻译任务。问答模型("源晓搜")链接了包含了维基百科、书籍等知识的数据库,根据用户提问的内容,利用高性能检索方法,快速地从知识数据库中检索到与提问内容相关的内容作为背景知识,在相关专业知识背景下回答问题,能够生成符合人类语言习惯的专业答复。古文模型("源晓文")在源大模型精读了5000GB高质量中文的基础上,又学习了先秦到近代几乎所有诗词,并精选其中最优秀的10万首进行强化训练。海量学习兼针对性强化训练使得古文理解模型能够精通古诗词的用词、文法及平仄格律等规则,还擅长营造意境、引经据典,同时兼具古文解析的能力。