移远通信与RWKV共同推动大模型在端侧设备的低资源占用部署

移远通信与RWKV共同推动大模型在端侧设备的低资源占用部署

(全球TMT2025年7月28日讯)7月27日,移远通信宣布与RWKV公司建立全面合作关系,双方将依托移远的算力平台,优化并支持RWKV最新模型架构,共同推动大模型在端侧设备的低资源占用部署。此次合作成果于2025世界人工智能大会(WAIC)首次亮相。

RWKV(Receptance Weighted Key Value)是全球领先的RNN大模型架构,它成功结合了递归神经网络(RNN)的恒定复杂度和高效串行推理,以及Transformer的并行处理优势,使其在文本生成、时间序列、图像和视频、语音和音乐等领域表现出色,推理成本和训练成本显著低于Transformer。这项技术的核心突破在于引入RWKV算子替代Transformer的位置编码和多头注意力机制。

在本次世界人工智能大会(WAIC)上,基于高通QCS8550平台的两大RWKV联合解决方案登场:RWKV Chat是一款离线AI聊天应用,无需联网即可实现推理、深度对话与文本续写,支持个性化会话配置,成为用户的“口袋级”生产力伙伴。RWKV数独则展示了20M超小参数模型在超长链式推理(CoT)下的数学解题能力。

移远通信的SG885G基于高通QCS8550平台开发,其AI综合算力高达48 TOPS,能够支撑7B左右参数级的多模态模型在本地化推理。移远率先实现对Llama、通义千问、DeepSeek等主流开源模型的全方位兼容,兼容的参数范围覆盖0.5B至8B。此外SG885G支持运行非Transformer路线的RWKV7架构,这一特征显著降低了对算力和内存的需求。