公司新闻

3月19日 / deepseek

甫崎咨询—成功为上海理想举办了《deepseek 蒸馏与训练技术》内训

为应对大模型部署中的算力与成本挑战,我司在3月19日为电信理想公司成功举办了大模型知识蒸馏实战培训,聚焦“教师-学生”范式的蒸馏全流程演示。本次实战以DeepSeek-R1(671B参数)为教师模型,Qwen-7B(7B参数)为学生模型,通过五个阶段流程实现模型压缩与性能平衡。DeepSeek-R1的成功案例表明,通过蒸馏技术可兼顾性能与效率,为行业提供低成本、高可用的AI部署新范式。

deepseek