音频算法工程师(AI语音识别方向)-珠海
岗位职责:
1、负责语音识别(ASR)相关算法的研发、优化与落地,包括声学模型、语言模型、解码器等方向;
2、参与语音识别系统的训练、调优和部署,提升识别准确率、鲁棒性和实时性;
3、负责基于 Kaldi、WeNet、PyTorch 等工具链进行模型训练、实验分析和性能优化;
4、研究并实现Chain model、 CTC、Attention、RNN-T、Conformer、Transformer 等主流语音识别模型结构;
5、结合实际应用场景,优化远场语音、噪声环境、口音、低资源语种等复杂条件下的识别效果;
6、参与语音数据处理流程建设,包括数据清洗、标注检查、特征提取、数据增强和训练集构建;
7、配合工程团队完成语音识别模型的端侧或服务器端部署,包括模型压缩、量化、推理加速等工作;
8、跟踪语音识别领域前沿技术,并推动相关算法在产品中的应用。
任职要求:
1、计算机、电子信息、通信工程、人工智能、自动化、数学等相关专业,本科及以上学历,硕士优先;
2、熟悉语音识别基本原理,了解声学模型、语言模型、发音词典、解码图、特征提取等核心模块;
3、具备 Kaldi 使用经验,熟悉基于 Kaldi 的数据准备、特征提取、模型训练、解码和结果分析流程;
3、熟悉 CTC、Attention、RNN-T 等端到端语音识别建模方法,有实际模型训练和调参经验;
4、熟悉深度学习框架,如 PyTorch、TensorFlow 等,具备良好的算法实现能力;
5、熟悉常见语音特征和数据增强方法,如 MFCC、FBank、SpecAugment、加噪、混响模拟等;
6、具备良好的 Python/C 编程能力,能够独立完成算法验证、实验设计和代码调试;
7、具备较强的问题分析能力,能够根据 WER/CER、loss 曲线、解码结果等定位模型性能问题;
8、具有良好的沟通能力和团队协作能力,能够与产品、数据和工程团队配合完成算法落地。