职位信息
职责:
1、学历要求:双一流高校或海外知名高校,本科大四在读或硕博在读,2026 年及以后毕业者优先;
2、专业背景:统计学、应用数学、计算机科学、商业分析、智能制造等相关专业;
3、技能要求:- 熟练掌握 SQL,能高效处理复杂查询与多源数据关联; - 掌握 Python 或 R 中至少一种用于数据分析(pandas、numpy、scikit-learn 等); - 熟悉常用数据分析与可视化工具(如 Excel、Tableau、Power BI、SPSS 等);
要求:
1、参与面向企业客户的大模型知识库系统搭建与迭代,聚焦制造业、金融等垂直领域的知识管理需求;
2、基于 RAG(检索增强生成)架构,设计并实现从文档解析、文本分块、向量化到检索召回的完整数据处理流程;
3、使用 LangChain / Dify / LlamaIndex 等框架构建知识检索与问答生成链路,通过数据分析手段评估并优化检索准确率、回答相关性等核心指标;
4、负责向量数据库(如 Milvus、Pinecone、Weaviate、Chroma)的集成与性能调优,结合业务场景设计元数据标签体系;
5、协助将知识库能力封装为 API 或嵌入内部智能助手、客服系统等产品,通过用户行为日志分析推动功能迭代;
6、编写清晰的技术与分析文档,参与方案讨论、效果复盘及跨团队协作。