课程介绍
本课程聚焦AI大模型(尤其是多模态技术)在电信质调场景的落地实践,结合中国电信行业最新趋势(如星辰大模型、息壤平台等),通过技术架构解析+行业案例复盘+代码实操,帮助技术骨干掌握语音分析、多模态模型部署及解决方案设计能力,满足政企客户智能化转型需求。
培训对象
从事相关工作及对课程内容感兴趣的人员。
课程收益
掌握多模态技术架构(Gemini、九天、星辰)及电信行业落地方法论;
学习语音分离、长音频摘要生成等核心技术,并完成Pipeline搭建实战;
熟悉DeepSeek等工具链,设计电信级AI解决方案(如客服质检、故障工单分析);
获取多模态模型部署优化方案(MoE/CoE架构、息壤平台)与电信专属案例库。
知识概要
-- 多模态技术基础与语音提取实战;
-- 多模态生产部署与DeepSeek开发。
课程大纲
多模态架构与电信应用场景
多模态技术演进与运营商布局
原生多模态架构对比(Gemini/GPT-4o vs. 九天/星辰)
本地化部署(中国电信星辰视觉日均调用6亿+案例解析)
多模态在电信场景的应用
智能客服(多模态意图识别)
视频布控(图像+文本联动)
会议分析(语音+字幕联合分析)
语音处理技术栈解析
语音分离(FRCRN/MossFormer)
方言识别(CT-Transformer)
超自然语音生成(VITS框架)
语音内容提取解决方案实战
行业方案:长音频内容提取
LeMUR框架实践(10小时录音→摘要/问答/行动项)
安徽电信自服务智能体案例
行业方案:降噪与说话人分离
ClearerVoice-Studio实战(复数域算法+实时处理)
电信客服场景应用(投诉分类、情绪识别)
开发实战:语音提取Pipeline搭建
从音频上传→ASR(Whisper)→关键信息结构化(NLP实体抽取)
代码实操与调试
模型部署与前后端开发
大模型生产部署方案
算力调度(息壤平台)
模型蒸馏(Distil-BERT)、MoE/CoE架构优化(降低推理成本30%+)
前后端数据链路开发
前端语音采集(PyAudio)+后端AI能力集成(FastAPI+TensorRT)
电信级低延迟方案设计
电信级解决方案设计
质调场景:客服录音分析(情绪识别+关键词提取)
故障语音工单提取(声纹识别+文本生成)
DeepSeek与综合应用
DeepSeek-R1全解析
模型架构(Mixture-of-Experts)
微调(LoRA)
智能体编排
多模态综合应用案例
政务热线(语音→工单自动生成)
应急指挥(视频+语音联动决策系统)
结业设计
分组输出:质调中心语音质检AI方案(含技术选型/架构图)
导师点评与优化建议
认证过程
无认证考试
开班信息
暂无开班信息