工作职责
1、负责LLM训练相关的工作,包括基础预训练、SFT以及强化学习等;
2、负责优化LLM在具体产品场景下的微调,能够完成技术在产品的落地;
3、探索LLM高效学习的方式,包括叠加数据训练、PPO优化方式等;
4、跟进前沿技术, 并把相应技术落地。
任职资格
1、博士学历;
2、熟练掌握Python,熟悉Linux 环境开发,熟练使用深度学习框架TensorFlow或者PyTorch;
3、熟悉一项或者多项以下技术:LLM预训练、对话管理、Instruction Tuning、强化学习等;
4、具备独立分析问题、定义问题和解决问题能力,并且有优秀的理解和沟通能力;
5、对技术充满热情,主动了解前沿技术,并对行业发展有一定的见解;
6、有NLP领域或者机器学习领域有参加比赛经验或者有高质量论文者优先。