全球TMT • 7个月前 (12-25) 883浏览

浪潮信息元脑HC1000实现推理成本首次击破1元/每百万token

（全球TMT2025年12月25日讯）浪潮信息推出元脑HC1000超扩展AI服务器，将推理成本首次击穿至1元/每百万token。这一突破不仅有望打通智能体产业化落地“最后一公里”的成本障碍，更将重塑AI产业竞争的底层逻辑。

火山引擎最新披露的数据显示，截至今年12月，字节跳动旗下豆包大模型日均token使用量突破50万亿，较去年同期增长超过10倍，相比2024年5月刚推出时的日均调用量增长达417倍；谷歌在10月披露，其各平台每月处理的token用量已达1300万亿，相当于日均43.3万亿，而一年前月均仅为9.7万亿。当使用量达到“百万亿token/月”的量级时，哪怕每百万token成本只下降1美元，也可能带来每月1亿美元的成本差异。

浪潮信息推出的元脑HC1000超扩展AI服务器，基于全新设计的全对称DirectCom极速架构，采用无损超扩展设计，可高效聚合海量本土AI芯片，支持极大推理吞吐量，推理成本首次击破1元/每百万token。DirectCom极速架构，每计算模组配置16颗AIPU，采用直达通信设计，实现超低延迟；计算通信1:1均衡配比，实现全局无阻塞通信；全对称的系统拓扑设计，可以按需配置计算实例，最大化资源利用率。DirectCom架构还保障了计算和通信均衡，推理性能1.75倍提升，单卡MFU最高可提升5.7倍。此外，元脑HC1000通过自适应路由和智能拥塞控制算法，提供数据包级动态负载均衡，实现KV Cache传输和All to All通信流量的智能调度，将KV Cache传输对Prefill、Decode计算实例影响降低5-10倍。

浪潮信息元脑HC1000实现推理成本首次击破1元/每百万token

Dymax推出9310胶粘剂，用于PCB细间距无引脚元器件加固

澜起科技率先在业界试产CXL 3.2内存扩展控制器芯片

宜鼎国际推出全新DDR5 MRDIMM内存，传输速度提升至12800 MT/s

文章评论(0)

文章标签

+0

中国电信、紫光国微发布业绩报告；此芯科技完成超1亿元天使++轮融资

澳鹏AI全生命周期数据解决方案在市场上具独特优势

美国计划授权微软等为“守门人”管制AI芯片出口；苹果将首次在印度生产AirPods；OpenAI吹哨人被证实死亡

长电科技第一季度净利润同比增长188.7%

时空壶推出AI同声传译器X1，荣获CES 2024创新奖

谷歌老将吴永辉被曝加入字节跳动；DeepSeek暂停在韩国新下载服务；华为拿下巴西通信网络大单

新华三在MWC上海全方位展示创新产品方案及AI技术成果

同方股份为“低碳冬奥”贡献更多方案和能量

首款区块链忠诚奖励平台：丰之沃阿拉订数字券上链

长电科技2020年净利润创历史新高

文章评论(0)

文章标签

+0

无需注册，直接使用社交账号登录