大型語言模型/GenAI工程師
發佈於05-28

需要香港工作許可

5年

碩士
HK $45K-68K/月
工作描述
崗位職責
• 模型訓練與最佳化:設計並實現大型語言模型的訓練策略,包括監督微調(SFT)、強化學習(如 GRPO、PPO)等方法,提升模型在 Web3 領域的智慧程度。
• 數據處理與生成:建立高品質的訓練數據集,進行數據蒸餾和長短鏈式思考(Long&Short Chain of Thought, CoT)數據生成,確保模型具備強大的推理能力。
• 模型架构与评估:探索并应用专家混合(MoE)等先进模型架构,制定模型评估框架和指标,持续优化模型表现。
• 分布式训练与部署:开发并维护模型的分布式训练方案,确保模型的高效训练和稳定部署。
• 技术前沿探索:跟踪 AI 领域的最新研究动态,如 OpenAi GPT-4.5、DeepSeek-R1 等,推动技术在实际业务中的创新应用。
崗位要求
• 学历背景:计算机科学、人工智能、机器学习或相关领域的学士学位,硕士或博士优先。
• 技術能力:
• 熟練掌握 Transformer 架構,熟練使用 Transformer Reinforcement Learning(TRL)、 PyTorch 或 TensorFlow 深度學習化學習框架等。
• 具備大型語言模型的微調經驗,熟悉推論導向強化學習(Reasoning-Oriented Reinforcement Learning, RORL)等技術。
• 熟悉分散式訓練框架,具備模型並行、Flash Attention、LoRA 等技術的實戰經驗。
• 工程能力:
• 精通 Python、Go等編程語言,具備良好的程式碼風格和軟體工程實戰經驗。
• 熟悉模型服务化技术,如 Triton、vLLM、TGI 等,具备推理优化经验者优先。
• 科研能力:
• 能夠閱讀並實現前沿論文,撰寫技術報告或部落格。
• 在顶级会议(如 NeurIPS、ICLR、ICML、ACL)有论文发表或开源项目贡献者优先。
• 软技能:
• 具備優秀的團隊合作和溝通能力,能夠高效地與跨功能團隊協作。
• 对开源 AI 社区有深入了解,有相关项目贡献者优先。
查看更多公司簡介
Niuwa科技是一家總部位於香港的高成長新興經濟體人才招聘服務公司。我們的國際人才庫來自香港、大中國、北美和歐洲的科學、技術、工程、創新和商業領域。我們的客戶主要來自高成長新興產業,包括人工智慧、數據科學、機器人、IoT、智慧城市、先進製造、IC設計、生技、FinTech等。
我們的目標是通過高效的TA服務與客戶一起成長
Linkers International Limited
Collaborate on innovative AI solutions with business units
3-6 years AI engineering or related experience required
Proficiency with public cloud platforms (AWS, Azure, AliCloud)
請謹慎注意
申請工作時,請勿提供您的銀行或信用卡資料。