爱游戏平台游戏:智源：FlagOS完结DeepSeekV4八款芯片Day0 适配完结三重技能打破

来源：爱游戏平台游戏发布时间：2026-04-25 06:12:23

爱游戏平台充值:

中国日报4月24日（记者程钰）DeepSeek今天发布了DeepSeek-V4-Pro 1.6T 旗舰模型(1.86万亿参数）及DeepSeek-V4-Flash 284B 高效模型（2840亿）。由智源研究院牵头研制的众智FlagOS第一时间对两个“巨无霸”模型进行全量适配，已完结 DeepSeek-V4-Flash在8款以上 AI 芯片上的全量适配与推理布置，包含海光、沐曦、华为昇腾、摩尔线）、昆仑芯、平头哥真武、天数、英伟达（FP8）等芯片。FlagOS 一起正在推动 DeepSeek-V4-Pro 模型在多个芯片的搬迁适配，后续行将开源。

首要完结在八款芯片适配的DeepSeek-V4-Flash 是深度求索推出的 V4 系列两大模型之一，选用混合专家（MoE）架构，总参数量 284B，激活参数仅 13B，支撑 100 万 token上下文长度。该模型在架构上引入了混合注意力机制（结合紧缩稀少注意力CSA与高度紧缩注意力HCA，大幅度的进步长上下文功率）、流形束缚超衔接（mHC，增强跨层信号传达安稳性）以及Muon优化器（加快收敛、提高练习安稳性）。预练习数据超越32Ttoken，后练习选用两阶段范式——先经过SFT和GRPO强化学习独立培育范畴专家，再经过在线战略蒸馏将多范畴才能一致整合到单一模型中。在最大推理力度形式（Flash-Max）下，给予更大考虑预算使其推理才能可接近Pro版别水平；受限于参数规划，在纯常识类使命和最杂乱的Agent工作流上略逊于 Pro。

环绕DeepSeek-V4-Flash多芯适配，此次FlagOS体系软件技能栈打破了三大关键技能：FlagGems全算子代替（完结多芯片一致适配）、为o-group选用独立张量并行战略解锁更多低显存场景、以及“FP4+FP8混合精度”的原生权重到 FP8/BF16 的精度途径转化。当下国内出货的AI芯片，都没有FP4的支撑。英伟达也只要在Blackwell及之后的高端芯片才支撑FP4。这三项关键技能，使得DeepSeekV4可以在当时各种厂商的干流AI芯片上安稳运转，而非仅限于支撑 FP4 和大显存的少量高端AI加快卡。

每日一词青年开展型城市 youth-development-oriented cities

下一篇: 午后国产芯片直线迸发！DeepSeek、华为大音讯！

上一篇:芯片资讯-芯片相关资讯-天极网