
中国AI初创DeepSeek开源模型引全球关注
(全球TMT2025年2月10日讯)DeepSeek-R1是中国初创公司DeepSeek推出的人工智能模型,该模型在人工智能开源平台Hugging Face上发布后迅速跃居下载量和活跃度榜首,促使投资者重新评估英伟达等芯片制造商的估值及AI巨头的巨额投资。DeepSeek-R1是一款“推理模型”的数字助理,在某些数学和编码任务的人工智能基准测试中表现与OpenAI的o1不相上下,但据称训练成本要低约96%。IBM AI硬件部门的一位首席研究科学家兼经理Kaoutar El Maghraoui表示,DeepSeek正在以开源的雄心和先进技术挑战行业巨头。

中国的人工智能公司正在缩小与美国竞争对手的差距,这得益于它们愿意开源或共享底层软件代码。DeepSeek-R1在Hugging Face上提供,允许不受限制地用于商业用途。此外,中国其他科技公司如快手、腾讯和阿里巴巴的新开源模型也受到开发者的热捧。而OpenAI和谷歌主要采用闭源方式。除了开源带来的好处外,DeepSeek工程师在训练系统时使用的英伟达高度专业化芯片数量也仅为美国竞争对手的一小部分,进一步降低了成本。
DeepSeek-R1结合了思维链推理与强化学习,在强化学习中,自主智能体通过反复试错学会执行任务。DeepSeek的成功部分源于其低廉的价格和高成本效益,通过使用专家混合架构实现了更高的资源利用效率。不过,El Maghraoui表示,现在判断DeepSeek-R1及其他产品是否会“改变人类互动、技术和企业应用”,还为时尚早。
文章评论(0)