职位信息
要求:
1、计算机、人工智能、电子信息、生物医学工程等相关专业,硕士及以上学历;
2、精通 Python,熟练使用 Pytorch 或 TensorFlow 进行深度学习模型开发;
3、熟悉计算机视觉、自然语言处理、语音识别等多模态任务的基础理论和算法;
4、了解 Transformer 及其衍生模型,具备相关实验或项目经验;
5、具备良好的编程能力,掌握 C++ 者优先,熟悉 Linux 开发环境和 Shell 脚本;
6、具备良好的论文阅读能力,能够调研、复现 CV/NLP/ASR 领域的最新研究成果;
7、每周实习不少于 4 天,持续 3 个月以上。
职责:
1、计算机视觉(CV)方向:- 参与医学影像、文本-图像生成、目标检测、语义分割等视觉任务的研究与优化;- 进行计算机视觉领域的算法调研、复现、优化,并在实际应用场景中落地。
2、自然语言处理(NLP)方向:- 参与大语言模型(LLM)的训练、微调(Fine-tuning)、对齐优化(如 RLHF),提高文本生成、理解等任务的效果;- 负责医疗文本、对话、问答系统等场景的数据处理、标注及质量评估;- 跟踪 NLP 领域前沿研究,包括 Transformer 架构优化、检索增强生成(RAG)等。
3、语音识别(ASR)方向:- 参与语音识别(ASR)及语音合成(TTS)相关模型的训练、优化及推理部署;- 研究多模态融合技术,提高语音与文本、图像等多模态任务的协同优化能力。
4、算子优化与推理加速:- 参与多模态大模型的推理优化,包括模型量化、剪枝、编译优化等;- 研究并优化分布式推理框架,提高推理效率,降低计算成本;- 深入理解 LLM 推理架构,优化算子性能,提升大模型在终端或云端的运行速度。