职位描述
该职位已进行加V认证,请放心投递
职位描述:1、在短视频和直播场景下,结合图像,声音,文字等,对视频进行理解,包括但不限于音频分离、音频检测与分类、语音识别、语种识别、音乐理解等;
2、推动音频理解算法在快手短视频相关应用上的落地;
3、追踪多模态视频理解的前沿算法和技术,保持算法先进性。
任职要求:1、机器学习、模式识别、信号处理等计算机相关专业的硕士或者博士;
2、有多模态技术、音频分离和生成等相关经验者优先;
3、熟练掌握C/C 、Python,有较强的工程实现能力。熟悉常见的机器学习算法工具,如tensorflow,pytorch等;
4、相关顶会或期刊上发表论文者优先(ICASSP,Interspeech,ACL,ICML,NIPS,CVPR等);
5、有团队精神,良好的表达能力和沟通能力。