新大陆
H1B 员工人数:1000-9999人 行业分类:互联网
工作职责
1、负责大模型应用方向的研究与落地,围绕检索增强生成(RAG)、智能体(Agent)编排与优化、工具调用与插件生态,设计可复用解决方案并推动产品化;
2、搭建端到端应用闭环:需求分析 → 知识/数据工程 → RAG/Agent 方案设计 → 评测与监控 → 灰度上线与持续迭代;
3、构建与优化企业知识中台与向量检索体系:数据采集、清洗与切分,Embedding/索引构建,召回与重排,多源知识融合与实时更新;
4、优化推理链路与可用性:Prompt 工程、Few-shot/CoT/ReAct、函数调用(Tool/Function Calling)、长文档与记忆机制、工作流编排(多工具、多步骤、多代理协作);
5、建立系统化评测与A/B实验:离线指标(准确率、覆盖率、延迟、幻觉率、可用性)与在线指标(转化、满意度、SLA),沉淀评测基线与数据闭环;
6、提升可靠性与安全性:检索-生成协同(重排器、证据引用)、事实校验与防幻觉策略、权限与数据脱敏、内容安全与审计;
7、性能与成本优化:推理加速(批处理、并行、缓存、量化/蒸馏/剪枝)、多模型路由与降级策略、资源与成本监控优化;
8、跟踪与验证前沿技术:开源/闭源模型(如 Qwen、GLM、DeepSeek 等)、向量数据库与检索算法、Agent 框架(如 LangChain、AutoGen 等),快速原型并评估落地价值;
9、与产品/业务/平台团队协作,抽象通用能力,沉淀最佳实践、模板与 SDK,支撑客服、搜索、知识问答、办公自动化、数据分析等多垂类场景;
10、开展轻量训练与对齐:指令微调、强化学习、偏好对齐与领域知识注入/持续学习,形成可迭代的模型资产。
任职资格
1、硕士及以上学历,计算机、数学或统计学相关专业27届毕业生;
2、在自然语言理解、多模态等领域有研究,熟练使用pytorch/tensorfow等至少一种主流深度学习框架,能够独立实现前沿模型;
3、了解学界、业界最新研究成果;
4、能先来实习者优先录用。