人机语音交互技术系列课程主要内容包括:车载语音识别技术开发、关键方案设计与实现、人机交互系统的原型搭建及系统设计、语音识别相关算法的研究与开发,声学模型、语言模型的训练。分为五个视频,共计260分钟。
本视频为第五课,人机语音交互技术(五)
人机语音交互技术(一)
人机语音交互技术(二)
人机语音交互技术(三)
人机语音交互技术(四)
课程大纲
一、语音基础
1.语音识别技术发展概述
2.MFCC特征
3.单声道语音降噪算法
二、传统技术
1.模型匹配法(DTW)
2. 概率统计法(GMM-HMM)
3. 分类器法(SVM、CNN、LSTM)
三、热点技术
1. CTC
2. Attention
3. GAN
4. Few-shot
四、车内环境声识别
1. 边缘计算工具
2. 儿童哭声监听
模式识别与智能系统博士,现任某企业研发总监,负责国产芯片在智能座舱底层的移植,曾任智能座舱语音交互运用高级工程师和负责人,具有多年车载智控系统开发和交通环境视觉、语音识别类项目开发经验。在关键方案设计与实现、人机交互系统的原型搭建及系统设计、语音识别相关算法的研究与开发,包括声学模型、语言模型的训练等方面有丰富的经验。