职位描述
该职位还未进行加V认证,请仔细了解后再进行投递!
岗位职责:
1、负责大规模语言模型的数据处理、预训练、精调工作,提升特定任务上的大模型能力。采用Prompt Engineering,知识蒸馏,强化学习等方式提升模型效果和泛化性能;
2、负责本地生活核心创新项目的方案设计和落地,例如意图理解、AI点餐等。对接并推动和上下游团队的合作,共拿结果;
3、配合工程同学,对预训练模型进行压缩、量化、推理速度等优化,解决模型服务中的资源和性能问题;
4、跟踪大模型领域前沿技术,提出创新思路来推动算法升级和业务发展。撰写发表论文,和业界、学术界保持良好的交流。
岗位要求:
1、计算机、人工智能、数学等相关专业硕士及以上学历,具备机器学习、深度学习和自然语言处理等领域的相关背景知识,至少2年自然语言处理相关工作经验, 有大规模语言模型实际场景优化落地经验者优先,有强化学习实际调优落地经验者优先;
2、熟练掌握业界主流大语言模型(GPT、ChatGLM、LLaMA等)的算法原理,SFT、RLHF等训练方式和LangChain等应用范式;
3、熟悉PyTorch、TensorFlow等深度学习框架,有一定的多机多卡分布式训练与debug经验;
4、熟练掌握Java/C /Python中至少一门语言,有扎实的数据结构和算法基础;
5、具备优秀的分析和解决问题的能力,良好的沟通协作能力,具备较强的技术好奇心、学习能力、责任心。
1、负责大规模语言模型的数据处理、预训练、精调工作,提升特定任务上的大模型能力。采用Prompt Engineering,知识蒸馏,强化学习等方式提升模型效果和泛化性能;
2、负责本地生活核心创新项目的方案设计和落地,例如意图理解、AI点餐等。对接并推动和上下游团队的合作,共拿结果;
3、配合工程同学,对预训练模型进行压缩、量化、推理速度等优化,解决模型服务中的资源和性能问题;
4、跟踪大模型领域前沿技术,提出创新思路来推动算法升级和业务发展。撰写发表论文,和业界、学术界保持良好的交流。
岗位要求:
1、计算机、人工智能、数学等相关专业硕士及以上学历,具备机器学习、深度学习和自然语言处理等领域的相关背景知识,至少2年自然语言处理相关工作经验, 有大规模语言模型实际场景优化落地经验者优先,有强化学习实际调优落地经验者优先;
2、熟练掌握业界主流大语言模型(GPT、ChatGLM、LLaMA等)的算法原理,SFT、RLHF等训练方式和LangChain等应用范式;
3、熟悉PyTorch、TensorFlow等深度学习框架,有一定的多机多卡分布式训练与debug经验;
4、熟练掌握Java/C /Python中至少一门语言,有扎实的数据结构和算法基础;
5、具备优秀的分析和解决问题的能力,良好的沟通协作能力,具备较强的技术好奇心、学习能力、责任心。
工作地点
地址:上海普陀区近铁城市广场北座/南座
查看
求职提示:用人单位发布虚假招聘信息,或以任何名义向求职者收取财物(如体检费、置装费、押金、服装费、培训费、身份证、毕业证等),均涉嫌违法,请求职者务必提高警惕。
职位发布者
林姿含HR
饿了么
- 行业未知
- 100-199人
- 私营·民营企业
- 注协大厦2栋三单元101