DeepSeek 再放降本大招：NSA 官宣发布，加速推理降低成本，并且不牺牲性能

2026-01-29 22:00:48 科技新闻

2 月 18 日消息，DeepSeek 今日官宣推出 NSA（Native Sparse Attention），这是一种硬件对齐且原生可训练的稀疏注意力机制，用于超快速长上下文训练与推理。

DeepSeek 再放降本大招：NSA 官宣发布，加速推理降低成本，并且不牺牲性能

NSA 的核心组件包括：

动态分层稀疏策略
粗粒度 token 压缩
细粒度 token 选择

DeepSeek 官方表示，该机制可优化现代硬件设计，加速推理同时降低预训练成本，并且不牺牲性能。在通用基准、长上下文任务和基于指令的推理上，其表现与全注意力模型相当或更加优秀。

附论文链接：

https://arxiv.org/abs/2502.11089

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

免责声明：本站所有信息均来源于互联网搜集，并不代表本站观点，本站不对其真实合法性负责。如有信息侵犯了您的权益，请告知，本站将立刻删除。

12月24日科技圈热点新闻汇总 | 20

本文汇总2025年12月24日科技圈核心热点，涵盖国内AI产业落地、自动驾驶L3级号牌亮相、医疗科技突破，国际半导体关税调整、AI赛道格局变化等关键动态，解读存...

科技新闻
2025-12-24
839
三星2026年推“阔折叠”手机正面迎战i

三星将于2026年秋季推出全新“阔折叠”手机，采用创新4:3比例内屏和25W无线快充，直指同期发布的iPhone Fold。这场巨头对决将如何重塑折叠屏市场格局...

科技新闻
2025-12-23
840
美方将大疆无人机列入“受管制清单” 外交

美国联邦通信委员会（FCC）以“国家安全风险”为由，将大疆无人机及零部件列入“受管制清单”，限制新机型进口销售。外交部发言人林剑坚决反对美方泛化国家安全概念、无...

科技新闻
2025-12-23
570
12月22日科技圈热点：国产科技力量冲刺

本文汇总12月22日科技圈核心热点，聚焦国内国产GPU“四小龙”、AI大模型企业冲刺上市的行业浪潮，解读国际科技巨头算力+能源布局、自动驾驶技术极端场景考验等关...

科技新闻
2025-12-23
812
小米17 Ultra首批样张亮相！2亿徕

年末新旗舰影像实力如何？解析首批2亿徕卡长焦夜间样张，揭秘一英寸主摄的色彩与纯净度表现。文章深入解读四款配色设计及全场景拍摄能力，帮你了解这款影像旗舰的核心竞争...

科技新闻
2025-12-23
870